155 20 5MB
Italian Pages XV, 704 pagg. [713] Year 2010
A mia figlia Bianca, perch´e un giorno ne possa scrivere uno migliore se, come suo padre, sar`a affascinata dalla musica e dall’armonia del linguaggio con cui ci appare scritto l’universo Fisico: la Matematica.
Valter Moretti
IZdg^V HeZiigVaZ Z BZXXVc^XV FjVci^hi^XV DeZgVidg^ ^c heVo^ Y^ =^aWZgi
Valter Moretti Dipartimento di Matematica Università di Trento
ISBN 978-88-470-1610-1 DOI 10.1007/978-88-470-1611-8
e-ISBN 978-88-470-1611-8
© Springer-Verlag Italia 2010 Quest’opera è protetta dalla legge sul diritto d’autore e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto dall’art. 68. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Corso di Porta Romana n. 108, Milano 20122, e-mail [email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge. L’utilizzo in questa publicazione di denominazioni generiche, nomi commerciali, marchi registrati, ecc. anche se non specificatamente identificati, non implica che tali denominazioni o marchi non siano protetti dalle relative leggi e regolamenti.
AVndji XdeZgi^cV/ Beatrice %. (Milano) Impaginazione: PTP-Berlin, Protago TEX-Production GmbH, Germany (www.ptp-berlin.eu) Stampa: Signum, Bollate (MI) HiVbeVid ^c >iVa^V Springer-Verlag Italia S.r.l., Via Decembrio 28, I-20137 Milano Springer-Verlag fa parte di Springer Science+Business Media (www.springer.com)
Prefazione
Dovevo avere otto o nove anni e mio padre, di formazione letteraria, ma interdisciplinarmente colto e curioso, mi raccont`o: “Un grandissimo scienziato, Albert Einstein, ha scoperto che non `e possibile viaggiare pi` u velocemente della luce”. Io rimasi incredulo e cercai di controbattere: “Ma no, non `e vero, se corro alla velocit`a della luce e poi accelero un po’, la velocit`a della luce la supero sicurmente, no?” Ma mio padre fu irremovibile: “No, `e impossibile, `e un fatto noto della fisica”. Dopo un po’ aggiunsi:“Quel signore, Einstein, ha fatto tante prove . . . come si dice, tanti esperimenti?” Ma la risposta che mi arriv` o fu del tutto inattesa: “No, nemmeno uno, ha usato la matematica!” Cosa c’entravano i numeri e le figure geometriche con l’impossibilit`a di superare la velocit`a della luce? Come si poteva sostenere una cosa tanto apparentemente assurda, ma vera (mi fidavo di quanto mi raccontava mio padre) come l’esistenza di una velocit`a limite usando solo la matematica? Come poteva la matematica avere tanto potere sul mondo materiale? E poi la fisica? Che roba era e che relazione aveva con la matematica? Era una delle cose pi` u incredibilmente intriganti che avessi mai ascoltato fino a quel momento . . . dovevo saperne di pi` u. Una parte di questo libro `e stata in realt`a scritta, in forma preliminare, quando ero studente del corso di laurea in Fisica all’Universit` a degli Studi di Genova. Il corso obbligatorio di Istituzioni di Fisica Teorica, al terzo anno, era il secondo scoglio quasi insormontabile per molti studenti (il primo era il famigerato corso di Fisica II che includeva la termodinamica insieme all’elettrodinamica classica). La Meccanica Quantistica, insegnata in quel corso, necessitava un modo di pensare nuovo e difficile e lo sforzo era davvero notevole per noi volenterosi studenti: ci si muoveva per molti mesi in un contesto nebbioso ed insicuro, senza capire cosa fosse davvero importante nelle nozioni fisiche che – con molta difficolt`a – cercavamo di imparare insieme ad un formalismo del tutto nuovo: quello della teoria degli operatori lineari su spazi di Hilbert. In realt` a, all’epoca, non comprendevamo ancora che stavamo lavorando con tale teoria matematica, e per molti dei miei colleghi la cosa sarebbe stata, forse a ragione,
VI
Prefazione
del tutto irrilevante; i vettori bra di Dirac erano vettori bra di Dirac e basta! E non gli elementi del duale dello spazio di Hilbert. La nozione di spazio di Hilbert e di spazio duale non aveva ancora diritto di cittadinanza nella classe degli strumenti matematici della quasi totalit` a dei miei colleghi, anche se sarebbe entrata a breve dal corso di Metodi Matematici della Fisica. La matematica, la formalizzazione matematica della fisica, era sempre stato il mio cavallo di battaglia per superare tutte le difficolt`a insite nello studio della fisica, tanto che alla fine (ma dopo avere preso anche un dottorato in fisica teorica) sono istituzionalmente diventato un matematico. Armato delle mie nozioni di matematica – imparate in un percorso extracurriculare che coltivavo parallelamente agli studi di fisica da sempre – e preparandomi ad impararne nuove per l’occasione, cercai di formalizzare anche le nozioni nelle quale mi stavo imbattendo, in questo nuovo ed interessantissimo corso di fisica. In parallelo portavo avanti una analogo progetto riguardante la formalizzazione matematica della teoria della Relativit`a Generale, non sapendo ancora che lo sforzo dedicato alla Meccanica Quantistica sarebbe stato incommensurabilmente superiore. La formulazione del teorema spettrale pi` u o meno come `e presentata nel capitolo 9 di questo libro `e la stessa con la quale arrivai a sostenere l’esame del corso di Istituzioni di Fisica Teorica che fu, di conseguenza, un po’ un discorso tra sordi. Successivamente i miei interessi si spostarono verso la teoria quantistica dei campi, argomento di cui mi occupo ancora oggi, nel contesto un po’ pi` u generale della teoria quantistica dei campi su spaziotempo curvo. Tuttavia il mio interesse per la formulazione elementare della MQ non `e andato scemando negli anni e, di tanto in tanto, ho continuato ad aggiungere qualche altra parte all’opera iniziata da studente. L’occasione di insegnare queste cose in vari corsi per matematici e per fisici, nelle lauree specialistiche e nei dottorati, infliggendo ai miei poveri studenti i risultati dei miei sforzi di sintesi, si `e rivelata fondamentale per per migliorare l’opera, trascrivendo il testo in LATEX, ma anche correggendolo in vari punti, accogliendo le numerose osservazioni che mi sono giunte da varie persone. Vorrei a tal proposito ringraziare vari colleghi, diversi amici di discussione sui newsgroups: it.scienza.fisica, it.scienza.matematica e free.it.scienza.fisica e molti studenti, alcuni dei quali diventati oggi miei colleghi, che hanno contribuito a migliorare le diverse versioni preliminari di questo trattato, direttamente o indirettamente nel corso di vari anni: S. Albeverio, P. Armani, S. Bonaccorsi, G. Bramanti, A. Cassa, B. Cocciaro, M. Dalla Brida, L. Di Persio, S. Doplicher, E. Fabri, C. Fontanari, A. Franceschetti, R. Ghiloni, A. Giacomini, V. Marini, E. Pagani, E. Pelizzari, G. Tessaro, M. Toller, L. Tubaro, D. Pastorello, A. Pugliese, F. Serra Cassano, S. Zerbini, G. Ziglio. Sono debitore, per vari motivi legati anche a questo libro, al mio compianto collega Alberto Tognoli. Ringrazio in particolare R. Aramini, D. Cadamuro e C. Dappiaggi che mi hanno segnalato errori di vario genere in varie versioni del libro, dopo averlo letto accuratamente.
Prefazione
VII
Sono grato ai miei amici e collaboratori R. Brunetti, C. Dappiaggi e N. Pinamonti per varie discussioni tecniche nel corso degli anni, diversi suggerimenti su molti degli argomenti trattati e per avermi segnalato importanti riferimenti bibliografici. Infine desidero ringraziare E. Gregorio per il suo puntuale e preziosissimo aiuto tecnico con il LATEX. Sar` o grato a chiunque voglia segnalarmi le (sicuramente numerose) imprecisioni, mancanze e gli errori che quest’opera possiede ancora. Sono conscio del fatto che ci siano evidenti limitazioni nel contenuto: non sono trattati gli aspetti matematici di importantissimi argomenti di fisica, primo fra tutti la teoria della diffusione quantistica. Inoltre – per ironia della sorte, dato che la mia attivit` a di ricerca concerne le teorie relativistiche – tutta la trattazione si sviluppa ad un livello non relativistico e la trattazione quantistica della simmetria di Poincar´e rimane del tutto trascurata. D’altra parte alcuni argomenti chiave per la fisica, quali la nozione di simmetria (anche in relazione al problema della dinamica) oppure le propriet` a delle funzioni di operatori autoaggiunti, sono affrontati con una certa profondit` a ed ampiezza. Trento, febbraio 2010
Valter Moretti
Indice
1
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Sul libro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Scopi e struttura del libro . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Prerequisiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Convenzioni generali valide per tutto il libro . . . . . . . . . . 1.2 Sulla Meccanica Quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 La MQ come teoria matematica . . . . . . . . . . . . . . . . . . . . . 1.2.2 La MQ nel panorama della fisica attuale . . . . . . . . . . . . . .
1 1 1 3 4 5 5 7
Parte I Elementi di teoria degli operatori lineari 2
Spazi normati e spazi di Banach, esempi e applicazioni . . . . . 2.1 Richiami di topologia generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Spazi e algebre normate e di Banach . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Spazi normati e loro propriet` a topologiche elementari . . . 2.2.2 Spazi di Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Un esempio: lo spazio di Banach C(K; Kn ) e il teorema di Arzel` a-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Algebre normate, algebre di Banach ed esempi vari . . . . . 2.3 Operatori, spazi di operatori, norme di operatori . . . . . . . . . . . . . 2.4 I teoremi fondamentali negli spazi di Banach . . . . . . . . . . . . . . . . 2.4.1 Il teorema di Hahn-Banach e le sue conseguenze elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Il teorema di Banach-Steinhaus o principio della limitatezza uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Topologie deboli. Completezza ∗-debole di X . . . . . . . . . 2.4.4 Breve digressione: spazi metrici, spazi localmente convessi metrizzabili e spazi di Fr´echet . . . . . . . . . . . . . . . 2.4.5 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal teorema di Baire . . . . . . . . . . . . . . . .
13 14 17 17 22 25 29 36 45 45 49 51 56 59
X
Indice
2.4.6 Teorema del grafico chiuso . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Proiettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Norme equivalenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Il teorema del punto fisso e applicazioni . . . . . . . . . . . . . . . . . . . . . 2.7.1 Il teorema del punto fisso di Banach-Caccioppoli . . . . . . . 2.7.2 Applicazione del teorema del punto fisso: il teorema di esistenza e unicit`a locale per sistemi di equazioni differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63 65 67 70 70
75 79
3
Spazi di Hilbert e operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . 87 3.1 Nozioni elementari, teorema di Riesz e riflessivit`a . . . . . . . . . . . . 88 3.1.1 Spazi con prodotto scalare e spazi di Hilbert . . . . . . . . . . 88 3.1.2 Il teorema di Riesz e le sue conseguenze . . . . . . . . . . . . . . 93 3.2 Basi hilbertiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.3 Nozione di aggiunto hermitiano e applicazioni . . . . . . . . . . . . . . . 112 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 3.3.2 ∗ -algebre e C ∗ -algebre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.4 Proiettori ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.6 La trasformata di Fourier-Plancherel . . . . . . . . . . . . . . . . . . . . . . . 132 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4
Propriet` a elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia . . . . . . . . . . . . . . . . . . . . . . 151 4.1 Operatori compatti in spazi normati e di Banach . . . . . . . . . . . . . 152 4.1.1 Compatti in spazi normati (infinitodimensionali) . . . . . . . 152 4.1.2 Operatori compatti in spazi normati . . . . . . . . . . . . . . . . . 154 4.2 Operatori compatti in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . 159 4.3 Operatori di Hilbert-Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 4.4 Operatori di classe traccia (o nucleari) . . . . . . . . . . . . . . . . . . . . . . 179 4.5 Introduzione alla teoria di Fredholm delle equazioni integrali . . 188 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
5
Operatori non limitati con domini densi in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 5.1 Operatori non limitati con dominio non massimale . . . . . . . . . . . 204 5.1.1 Operatori non limitati con dominio non massimale in spazi normati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 5.1.2 Operatori chiusi e chiudibili . . . . . . . . . . . . . . . . . . . . . . . . . 205
Indice
XI
5.1.3 Il caso degli spazi di Hilbert: struttura di H ⊕ H e operatore τ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 5.1.4 Propriet` a generali dell’operatore aggiunto hermitiano . . . 207 5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 5.3.1 L’operatore posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 5.3.2 L’operatore impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 5.4 Criteri di esistenza e unicit`a per le estensioni autoaggiunte . . . . 220 5.4.1 La trasformata di Cayley e gli indici di difetto . . . . . . . . . 220 5.4.2 Il criterio di Von Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . 225 5.4.3 Il criterio di Nelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
Parte II Teoria Spettrale e formalismo della Meccanica Quantistica 6
Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 6.1 Generalit`a sui sistemi quantistici . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 6.2 Alcune propriet` a particellari delle onde elettromagnetiche . . . . . 241 6.2.1 Effetto Fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 6.2.2 Effetto Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 6.3 Cenni di Meccanica Ondulatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.3.1 Onde di de Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 6.3.2 Funzione d’onda di Schr¨ odinger e interpretazione probabilistica di Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 6.4 Principio di Indeterminazione di Heisenberg . . . . . . . . . . . . . . . . . 248 6.5 Le grandezze compatibili e incompatibili . . . . . . . . . . . . . . . . . . . . 250
7
I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 7.2 Stati classici come misure di probabilit` a sulla σ-algebra delle proposizioni elementari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 7.2.1 Misure di probabilit` a, misure di Borel . . . . . . . . . . . . . . . . 256 7.2.2 Stati come misure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 7.2.3 Proposizioni, insiemi e stati come misure su di esse . . . . . 259 7.2.4 Interpretazione insiemistica dei connettivi logici . . . . . . . 259 7.2.5 Proposizioni “infinite” e grandezze fisiche . . . . . . . . . . . . . 260 7.2.6 Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari . . . . . . . . . . . . . . 263
XII
Indice
7.3 Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert . . . . . 267 7.4 Le proposizioni e gli stati relativi a sistemi quantistici . . . . . . . . 276 7.4.1 Assiomi A1 e A2: proposizioni, stati di sistemi quantistici e il teorema di Gleason . . . . . . . . . . . . . . . . . . . 276 7.4.2 Stati puri, stati misti, ampiezze di transizione . . . . . . . . . 284 7.4.3 Assioma A3: stati successivi ai processi di misura e preparazione degli stati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 7.4.4 Regole di superselezione e settori coerenti . . . . . . . . . . . . . 293 7.5 Le osservabili come Misure a Valori di Proiezione su R . . . . . . . . 296 7.5.1 Assioma A4: la nozione di osservabile . . . . . . . . . . . . . . . . 296 7.5.2 Operatori autoaggiunti associati a osservabili: motivazioni fisiche e esempi elementari . . . . . . . . . . . . . . . 299 7.5.3 Misure di probabilit` a associate a coppie stato osservabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 8
Teoria Spettrale I: generalit` a e operatori normali di B(H) in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 8.1 Spettro e risolvente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 8.1.1 Nozioni fondamentali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 8.1.2 Algebre di Banach: teorema di Gelfand-Mazur, raggio spettrale, formula di Gelfand . . . . . . . . . . . . . . . . . . . . . . . . 315 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 8.3 Misure a Valori di Proiezione (PVM) . . . . . . . . . . . . . . . . . . . . . . . 331 8.3.1 Misure a Valori di Proiezione (PVM) dette anche misure spettrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 8.3.2 Integrale di funzioni misurabili limitate rispetto a una PVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 8.3.3 Propriet` a degli operatori ottenuti integrando funzioni limitate rispetto a PVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 8.4 Teorema spettrale per operatori normali in B(H) . . . . . . . . . . . . 348 8.4.1 Teorema di decomposizione spettrale per operatori limitati normali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 8.4.2 Teorema di rappresentazione spettrale per operatori normali in B(H) e teorema di Fuglede . . . . . . . . . . . . . . . . 357 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
9
Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373 9.1 Teorema spettrale per operatori autoaggiunti non limitati . . . . . 374
Indice
XIII
9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 9.1.4 Un esempio a spettro continuo: gli operatori posizione e impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati e misure congiunte . . . . . . . . . . 405 9.2 Esponenziale di operatori non limitati: vettori analitici . . . . . . . 409 9.3 Gruppi unitari a un parametro fortemente continui . . . . . . . . . . . 413 9.3.1 Gruppi unitari a un parametro fortemente continui, teorema di von Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 9.3.2 Gruppi unitari a un parametro generati da operatori autoaggiunti e teorema di Stone . . . . . . . . . . . . . . . . . . . . . 418 9.3.3 Commutativit`a di operatori e misure spettrali . . . . . . . . . 426 9.4 Prodotto tensoriale hilbertiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 9.4.1 Prodotto tensoriale di spazi di Hilbert . . . . . . . . . . . . . . . . 430 9.4.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro propriet` a spettrali . . . . . . . . . . . . . . . . . . . . 436 9.4.3 Un esempio: il momento angolare orbitale . . . . . . . . . . . . . 440 9.5 Teorema di decomposizione polare per operatori non limitati . . 443 9.5.1 Propriet` a degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati . . . . . . . . . . . . 444 9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 9.6 I teoremi di Kato-Rellich e di Kato . . . . . . . . . . . . . . . . . . . . . . . . . 450 9.6.1 Il teorema di Kato-Rellich . . . . . . . . . . . . . . . . . . . . . . . . . . 450 9.6.2 Un esempio: l’operatore −Δ + V e il teorema di Kato . . 453 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 10
La formulazione matematica della Meccanica Quantistica non relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 10.1 Riepilogo e commenti sugli assiomi A1, A2, A3, A4 della MQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 10.2 Assioma A5: sistemi elementari non relativistici . . . . . . . . . . . . . 471 10.2.1 Le Relazioni di Commutazione Canonica (CCR) . . . . . . . 473 10.2.2 Il Principio di Indeterminazione di Heisenberg come teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 10.3 Le relazioni di Weyl, il teorema di Stone-von Neumann e il teorema di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 10.3.1 Famiglie irriducibili di operatori e lemma di Schur . . . . . 476 10.3.2 Le relazioni di Weyl dalle CCR . . . . . . . . . . . . . . . . . . . . . . 478
XIV
Indice
10.3.3 Il teorema di Stone-von Neumann e il teorema di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 10.3.4 La ∗-algebra di Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489 10.3.5 Dimostrazione dei teoremi di Stone-von Neumann e di Mackey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 10.3.6 Estensione del “principio di Heisenberg” agli stati misti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501 10.3.7 Commenti finali sul teorema di Stone-von Neumann: il gruppo di Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 10.4 Il principio di corrispondenza di Dirac . . . . . . . . . . . . . . . . . . . . . . 506 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 11
Introduzione alle Simmetrie Quantistiche . . . . . . . . . . . . . . . . . 511 11.1 Nozione e caratterizzazione delle simmetrie quantistiche . . . . . . 512 11.1.1 Qualche esempio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 11.1.2 Simmetrie in presenza di regole di superselezione . . . . . . . 515 11.1.3 Simmetrie nel senso di Kadison . . . . . . . . . . . . . . . . . . . . . . 516 11.1.4 Simmetrie nel senso di Wigner . . . . . . . . . . . . . . . . . . . . . . . 518 11.1.5 Teoremi di Wigner e di Kadison . . . . . . . . . . . . . . . . . . . . . 520 11.1.6 Azione duale delle simmetrie sulle osservabili . . . . . . . . . . 532 11.2 Introduzione ai gruppi di simmetria . . . . . . . . . . . . . . . . . . . . . . . . 538 11.2.1 Rappresentazioni proiettive, unitarie proiettive . . . . . . . . 538 11.2.2 Unitariet` a o antiunitariet` a delle rappresentazioni unitarie proiettive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 11.2.3 Estensioni centrali e gruppo quantistico associato a un gruppo di simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544 11.2.4 Gruppi di simmetria topologici . . . . . . . . . . . . . . . . . . . . . . 547 11.2.5 Rappresentazioni unitarie proiettive fortemente continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551 11.2.6 Il caso notevole del gruppo topologico R . . . . . . . . . . . . . . 554 11.2.7 Richiami sui gruppi e algebre di Lie . . . . . . . . . . . . . . . . . . 560 11.2.8 Gruppi di simmetria di Lie, teoremi di Bargmann, G˚ arding, Nelson, FS3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570 11.2.9 Un esempio: il gruppo di simmetria SO(3) e lo spin . . . . 582 11.2.10Il gruppo di Galileo e le sue rappresentazioni unitarie proiettive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 11.2.11La regola di Bargmann di superselezione della massa . . . 594 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597
12
Alcuni argomenti pi` u avanzati di Meccanica Quantistica . . 603 12.1 La dinamica quantistica e le sue simmetrie . . . . . . . . . . . . . . . . . . 604 12.1.1 Assioma A6: l’evoluzione temporale . . . . . . . . . . . . . . . . . . 604 12.1.2 Simmetrie dinamiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 12.1.3 L’equazione di Schr¨ odinger e gli stati stazionari . . . . . . . . 610
Indice
XV
12.1.4 L’azione del gruppo di Galileo in rappresentazione posizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 618 12.1.5 L’evolutore temporale in assenza di omogeneit`a temporale e la serie di Dyson . . . . . . . . . . . . . . . . . . . . . . . . 621 12.1.6 Inversione del tempo antiunitaria . . . . . . . . . . . . . . . . . . . . 625 12.1.7 L’osservabile tempo ed il teorema di Pauli. Un accenno alle POVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 12.2 Relazione tra simmetrie dinamiche e costanti del moto . . . . . . . . 631 12.2.1 La rappresentazione di Heinsenberg e le costanti del moto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631 12.2.2 Un accenno al teorema di Ehrenfest e ai problemi matematici a esso connessi . . . . . . . . . . . . . . . . . . . . . . . . . . 636 12.2.3 Costanti del moto associate a gruppi di Lie di simmetria e il caso del gruppo di Galileo . . . . . . . . . . . . . . 639 12.3 Sistemi composti e loro propriet` a . . . . . . . . . . . . . . . . . . . . . . . . . . 644 12.3.1 Assioma A7: sistemi composti . . . . . . . . . . . . . . . . . . . . . . . 645 12.3.2 Stati entangled e il cosiddetto “paradosso EPR” . . . . . . . 646 12.3.3 Impossibilit`a di trasmettere informazione tramite le correlazioni EPR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 12.3.4 Assioma A8: sistemi di sottosistemi identici . . . . . . . . . . . 653 12.3.5 Bosoni e Fermioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 Appendice A Relazioni d’ordine, topologia, gruppi . . . . . . . . . . . 661 A.1 Relazioni d’ordine, insiemi parzialmente ordinati, lemma di Zorn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 A.2 Richiami di topologia generale elementare . . . . . . . . . . . . . . . . . . . 662 A.3 Richiami di teoria dei gruppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666 Appendice B Elementi di geometria differenziale . . . . . . . . . . . . . 669 B.1 Variet`a differenziabili, variet`a differenziabili prodotto, funzioni differenziabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 B.2 Spazio tangente e cotangente. Campi vettoriali covarianti e controvarianti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674 B.3 Differenziali, curve e vettori tangenti . . . . . . . . . . . . . . . . . . . . . . . 676 B.4 Pushforward e pullback . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677 Appendice C Teoria della misura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679 C.1 Misure positive σ-additive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679 C.2 Misura di Lebesgue su Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684 C.3 Misura prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 686 C.4 Derivazione sotto il segno di integrale . . . . . . . . . . . . . . . . . . . . . . . 687 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689 Indice analitico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 693
1 Introduzione La scienza `e una cosa meravigliosa. . . per chi non deve guadagnarsi da vivere con essa. Albert Einstein
1.1 Sul libro 1.1.1 Scopi e struttura del libro Uno degli scopi di questo libro `e quello di esporre i fondamenti matematici della Meccanica Quantistica (MQ) in modo matematicamente rigoroso. Tuttavia si tratta di un testo di (Fisica-)Matematica e non di un manuale di Meccanica Quantistica. Escludendo alcune parti del libro, la fenomenologia fisica sar`a lasciata sullo sfondo per concentrarci sugli aspetti logico-formali della teoria. In ogni caso saranno presentate numerose esemplificazioni fisiche del formalismo, per non perdere il contatto con la realt`a dei fisici. Alternativamente ed indipendentemente dalla formulazione matematica della Meccanica Quantistica, questo libro pu` o essere considerato come un testo introduttivo, ma che raggiunge argomenti abbastanza avanzati, di analisi funzionale lineare sugli spazi di Hilbert, con particolare enfasi su alcuni risultati di teoria spettrale – come le varie formulazioni del teorema spettrale per operatori normali limitati ed autoaggiunti non necessariamente limitati. Questo `e – di fatto – un ulteriore scopo del libro. La formalizzazione matematica della MQ `e “confinata” nei capitoli 6, 7, 10, 11 e 12 da cui i rimanenti capitoli sono logicamente indipendenti, anche se motivazioni per talune definizioni matematiche si possono trovare nei capitoli 7, 10, 11 e 12. Un terzo scopo del libro `e quello di raccogliere in un unico testo diversi utili risultati rigorosi, ma pi` u avanzati di quanto si trova nei manuali di fisica quantistica, sulla struttura matematica della Meccanica Quantistica. Molti di questi risultati sono noti da tempo, ma sparsi nella letteratura avanzata. Possiamo menzionare il teorema di Gleason, i teoremi di Stone-von Neumann e di Mackey, il teorema di Kadison, oltre che il pi` u noto teorema di Wigner; oppure argomenti di teoria degli operatori, come il teorema di decomposizione polare per operatori chiusi non limitati (che ha grande rilevanza nella teoria di Tomita-Takesaki e in meccanica quantistica statistica, in riferimento alla condizione KMS), oppure alcuni risultati, dovuti a Nelson, sulle propriet` a Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
2
1 Introduzione
di autoaggiunzione di operatori simmetrici come conseguenza all’esistenza di insiemi densi di vettori analitici ed anche, infine, alcuni risultati dovuti a Kato (ma non solo) sull’essenziale autoaggiunzione di certi tipi di operatori e sui loro limiti dal basso dello spettro (risultati in massima parte basati sul teorema di Kato-Rellich). Alcuni capitoli del libro, da soli, coprono una buona parte degli argomenti di un corso avanzato di Metodi Matematici della Fisica, in un corso di laurea “magistrale” in Fisica, o dottorato di ricerca, assumendo che lo studente sia gi`a familiare con le nozioni, i risultati e le tecniche elementari della teoria della misura. Il testo pu` o anche essere adoperato in un corso di Fisica Matematica avanzato, che tratti argomenti fondazionali di Meccanica Quantistica. Lo sforzo dell’autore, rivolgendosi agli studenti dei corsi di laurea magistrale o dottorandi in fisica con interessi nei metodi matematici, oppure agli studenti dei corsi di laurea magistrale o dottorandi in matematica con propensione verso le applicazioni alla fisica, `e stato quello di scrivere un testo per quanto possibile autoconsistente, anche in virt` u di alcune appendici riguardanti la topologia generale, la geometria differenziale e la teoria della misura. La maggior parte dei capitoli sono corredati da esercizi, molti dei quali esplicitamente risolti. Il libro pu` o essere utile ai ricercatori per l’organica e rigorosa esposizione di vari risultati avanzati, noti, ma sparsi nella letteratura. Il volume `e diviso in due parti. La prima parte, che termina con il capitolo 5 incluso, contiene la teoria generale degli operatori in spazi di Hilbert, introducendo per`o anche diverse nozioni valide per contesti pi` u generali, quali gli spazi di Banach e provando risultati generali fondamentali, quali il teorema di Baire, di Hahn-Banach e Banach-Steinhaus, ma anche il teorema del punto fisso di Banach-Caccioppoli, il teorema di Arzel`a-Ascoli ed il teorema dell’alternativa di Fredholm, ed alcune loro conseguenze elementari. In questa prima parte vengono richiamate ed usate diverse nozioni topologiche elementari. L’idea `e che questo modo di procedere possa tornare utile agli studenti dei corsi di laurea in fisica, la cui preparazione in topologia generale `e a volte disomogenea e lacunosa, essendo l’insegnamento della topologia generale disperso in vari corsi e non concentrato in corsi curriculari come accade, viceversa, nei corsi di laurea in matematica. Nella seconda parte viene sviluppata la teoria spettrale in termini di misure a valori di proiezione, fino ad enunciare e provare i teoremi di decomposizione spettrale per operatori autoaggiunti non limitati in spazi di Hilbert, includendo le propriet` a delle funzioni di operatori (calcolo funzionale) per funzioni misurabili e non necessariamente limitate, studiandone con cura la propriet` a spettrali generali e le propriet` a dei loro domini. Con tali strumenti viene quindi sviluppato tutto il formalismo matematico fondazionale della Meccanica Quantistica. Nei capitoli relativi alla formulazione matematica generale della Meccanica Quantistica, dopo una discussione ed una motivazione di carattere fisico, si assume come punto di partenza matematico l’idea, dovuta a von Neumann,
1.1 Sul libro
3
che le proposizioni sui sistemi fisici quantistici siano descritte dal reticolo dei proiettori ortogonali su uno spazio di Hilbert complesso. Insiemi massimali di proposizioni fisicamente compatibili (in senso quantistico) sono descritte da reticoli distributivi, ortocomplementati, limitati e σ-completi. In questa ottica, la definizione quantistica di osservabile in termini di operatore autoaggiunto risulta essere estremamente naturale come, d’altra parte, la formulazione del teorema di decomposizione spettrale. Gli stati quantistici vengono introdotti come misure sul reticolo di tutti i proiettori ortogonali, che cessa di essere distributivo (per l’esistenza di proposizioni ed osservabili quantisticamente incompatibili). Tramite il teorema di Gleason, si caratterizzano gli stati come operatori positivi di classe traccia con traccia unitaria. Gli stati puri (i raggi dello spazio di Hilbert del sistema fisico) si ottengono come elementi estremali del corpo convesso degli stati. In questo contesto, e tra diversi altri argomenti, si discute la nozione di simmetria quantistica e di gruppo di simmetria in modo approfondito (riferendosi sia alla nozione dovuta a Wigner, ma anche a quella dovuta a Kadison), includendo lo studio delle simmetrie dinamiche e la versione quantistica del teorema di N¨ other. Come gruppo di simmetria di riferimento, che useremo nelle varie esemplificazioni della teoria delle rappresentazioni unitarie proiettive, ci riferiremo al gruppo di Galileo ed alle sue estensioni centrali ed ai sottogruppi di tale gruppo. Daremo anche una dimostrazione del teorema di Bargmann sull’esistenza di rappresentazioni unitarie per gruppi di Lie semplicemente connessi la cui algebra di Lie soddisfa una certa condizione coomologica. Discuteremo la regola di superselezione della massa dovuta a Bargamnn. Discuteremo anche alcuni utili risultati sulle rappresentazioni unitarie proiettive di gruppi di Lie di simmetrie dovuti a G˚ arding e Nelson. Tratteremo anche alcuni argomenti importanti, ma presentati in modo poco approfondito sui manuali, come le formulazioni relative all’unicit` a delle rappresentazioni unitarie delle relazioni di commutazione canonica (teoremi di Stone-von Neumann e Mackey) oppure la difficolt` a teorica nel definire operatore tempo come operatore coniugato all’operatore energia (l’hamiltoniano). Discuteremo brevemente le difficolt` a matematiche che si incontrano nel voler rendere rigoroso l’enunciato del teorema di Ehrenfest. Le appendici, in fondo al libro, richiamano le nozioni elementari di topologia generale, geometria differenziale (utile nel capitolo 11) e teoria della misura. La scelta dell’autore `e stata di non trattare alcuni argomenti, sia pure importanti, come la teoria degli spazi di Hilbert attrezzati (le famose triplette di Gelfand), perch´e ci`o avrebbe richiesto l’introduzione di ulteriore materiale, specialmente riguardante la teoria delle distribuzioni. 1.1.2 Prerequisiti Prerequisiti matematici necessari per comprendere il contenuto di questo libro sono essenzialmente (oltre ai contenuti di un normale corso completo di algebra lineare, che includa elementi di teoria dei gruppi e delle loro rappresen-
4
1 Introduzione
tazioni) gli argomenti fondamentali di analisi elementare per funzioni di una e di pi` u variabili, i fondamenti della teoria della misura su σ-algebre [Rud82] (riassunti in appendice a fine libro), qualche nozione elementare di teoria delle funzioni analitiche di una variabile complessa. Dal punto di vista fisico `e necessaria la conoscenza di alcuni argomenti dei corsi universitari elementari di argomento Fisico. Pi` u precisamente alcune nozioni elementari di Fisica Meccanica, corredati di alcuni elementi di Meccanica Analitica (i primi rudimenti della formulazione di Hamilton della dinamica) unitamente ad alcune nozioni di Elettromagnetismo (propriet` a elementari delle Onde Elettromagnetiche e fenomeni ondulatori principali quali interferenza, diffrazione, diffusione). Alcune nozioni meno elementari ed alcuni concetti utili solo in alcune parti del libro saranno comunque riassunte brevemente nel testo (anche negli esempi), presentando i risultati sufficienti per proseguire nella lettura. In una sezione del capitolo 11 si far`a uso della nozione di gruppo di Lie e di alcune propriet` a e risultati fondamentali della teoria corrispondente. Per tali argomenti ci riferiamo ai testi [War75, NaSt84]. Come gi`a detto, in appendice a fine libro, sono richiamati con un certo dettaglio alcuni risultati di geometria differenziale utili in tale contesto. 1.1.3 Convenzioni generali valide per tutto il libro 1. 2. 3. 4. 5.
6.
7.
8. 9.
10.
Il simbolo := significa “uguale per definizione”. Il simboli di inclusione ⊂, ⊃ ammettono la possibilit`a =. Il simbolo indica l’unione di insiemi disgiunti. N indica l’insieme dei numeri naturali includendo lo zero, mentre R+ := [0, +∞). Se non `e precisato altrimenti, il campo degli scalari di uno spazio vettoriale, normato, di Banach, di Hilbert, sar` a sempre quello di complessi C. Similmente, prodotto scalare significa prodotto scalare hermitiano, se non `e precisato altrimenti. Il complesso coniugato di un numero c sar`a indicato con c. Lo stesso simbolo `e anche usato per denotare la chiusura di insiemi o di operatori; ci` o non dovrebbe comunque creare fraintendimenti e, dove fosse necessario, un commento preciser`a quale deve essere l’interpretazione del simbolo. Il prodotto scalare tra due vettori ψ, φ di uno spazio di Hilbert sar` a indicato con (ψ|φ) per distinguerlo dalla coppia ordinata (ψ, φ). L’entrata di sinistra del prodotto scalare `e quella antilineare: (αψ|φ) = α(ψ|φ). Operatore sottintende lineare anche se talvolta questa specificazione `e omessa. Un operatore lineare U : H → H , dove H e H sono spazi di Hilbert, che sia isometrico e suriettivo sar`a detto unitario, anche se in altri testi la terminologia `e riservata al solo caso in cui valga anche H = H . La locuzione sottospazio vettoriale sar`a riservata ai sottospazi rispetto alla semplice struttura di spazio vettoriale anche nel caso in cui esista
1.2 Sulla Meccanica Quantistica
11.
12.
13.
14.
5
un’ulteriore struttura (spazio di Hilbert, Banach o altro) nello spazio ambiente. L’operazione di coniugazione hermitiana sar`a sempre indicata con ∗ e operatore hermitiano, operatore simmetrico, operatore autoaggiunto non saranno considerati sinonimi. Biettivo significa insieme iniettivo e suriettivo. La nozione di isomorfismo, qualunque sia la struttura algebrica considerata, richiede la suriettivit` a dell’isomorfismo e non solo l’iniettivit`a. Il carattere grassetto nel testo delle definizioni (ma anche fuori da esse) `e solitamente utilizzato quando si definisce un termine matematico per la prima volta. I corollari, le definizioni, gli esempi, i lemmi, le notazioni, le osservazioni, le proposizioni, i teoremi, sono tutti labellati con un’unica comune numerazione per facilitarne l’individuazione nel testo.
1.2 Sulla Meccanica Quantistica 1.2.1 La MQ come teoria matematica Dal punto di vista matematico la Meccanica Quantistica rappresenta una rara sintesi di eleganza matematica e profondit` a descrittiva del contesto fisico. La teoria usa essenzialmente tecniche di analisi funzionale lineare, ma con intrusioni e intersezioni con la teoria della misura, la teoria della probabilit` a e la logica matematica. Esistono (almeno) due possibili formulazioni rigorose (matematiche) della Meccanica Quantistica elementare. La pi` u antica in ordine storico, dovuta essenzialmente a von Neumann (1932), `e formulata usando il linguaggio della teoria degli spazi di Hilbert e della teoria spettrale degli operatori non limitati su tali spazi. La formulazione pi` u recente ed avanzata, sviluppata da diversi autori anche nel tentativo di risolvere alcuni problemi fisico-matematici della teoria quantistica dei campi, `e presentata nel linguaggio delle algebre astratte (∗-algebre e C ∗ -algebre) costruite sul modello delle algebre di operatori definite e studiate dallo stesso von Neumann (oggi note come W ∗ algebre o algebre di von Neumann), ma emancipandosi dalla struttura di spazio di Hilbert (vedi per es. il testo classico sulle algebre di operatori [BrRo02]). Tale formulazione ha il suo centro nel famoso teorema GNS (Gelfand-Naimark-Segal) [Haa96, BrRo02]. La seconda formulazione, in un senso molto specifico che non possiamo chiarire qui, pu` o considerarsi un’estensione della prima formulazione, anche per i nuovi contenuti fisici introdotti e la possibilit` a di trattare sistemi fisici con infiniti gradi di libert`a: i campi quantistici. In particolare essa permette di dare un senso matematicamente preciso alla richiesta di localit` a e covarianza delle teorie di campo quantistiche relativistiche [Haa96] e permette l’estensione delle teorie quantistiche di campo in spaziotempo curvo.
6
1 Introduzione
La formulazione algebrica in MQ elementare non `e strettamente necessaria anche se possibile e molto elegante (vedi per esempio [Str05]). In questo libro ci occuperemo unicamente della prima formulazione, che ha comunque una complessit`a matematica notevole, accompagnata da una notevole eleganza formale. Uno strumento matematico fondamentale per sviluppare la MQ `e il cosiddetto teorema spettrale per operatori autoaggiunti (generalmente non limitati) definiti in sottospazi densi in uno spazio di Hilbert. Tale teorema, che pu` o essere esteso al caso di operatori normali, fu dimostrato per la prima volta proprio da von Neumann nel suo libro fondamentale sulla struttura matematica della MQ [Neu32], che pu` o considerarsi una pietra miliare della fisica matematica oltre che della matematica pura del XX secolo1 . Il legame tra MQ e teoria spettrale `e dovuto al seguente fatto. Nell’interpretazione standard della MQ si vede in modo naturale che le grandezze fisiche misurabili su sistemi quantistici possono essere associate ad operatori autoaggiunti non limitati in un opportuno spazio di Hilbert. Lo spettro di ciascuno di questi operatori coincide con l’insieme dei valori assumibili dalla grandezza associata. La procedura di costruzione delle grandezze fisiche a partire dalle propriet` a o proposizioni elementari del tipo “il valore della grandezza cade nell’intervallo (a, b]”, che nello schema matematico adottato corrispondono a proiettori ortogonali, non `e altro che una procedura di integrazione su una appropriata misura spettrale a valori di proiezione. Il teorema spettrale in sostanza altro non `e che un metodo che permette di costruire operatori pi` u complessi partendo da proiettori o, viceversa, di decomporre operatori in termini di misure a valori di proiezione. La formulazione moderna della teoria spettrale `e sicuramente differente da quella originale di von Neumann, che per` o conteneva tutti gli elementi fondamentali. Ancora oggi il testo di von Neumann (che `e stato scritto nel lontano 1932) rivela una profondit`a impressionante specie nei problemi pi` u difficili dell’interpretazione fisica del formalismo della MQ di cui, leggendo il libro, si evince che von Neumann era chiaramente conscio, a differenza di molti dei suoi colleghi. Sarebbe interessante fare un paragone tra il testo di von Neumann e il, molto pi` u famoso, testo di Dirac [Dir30] sui fondamenti della MQ, cosa che lasciamo al lettore interessato. In ogni caso la profondit`a dell’impostazione data da von Neumann alla MQ comincia anche ad essere riconosciuta da chi si occupa di fisica sperimentale ed in particolare di misure quantistiche [BrKh95]. Le cosiddette Logiche Quantistiche nascono dal tentativo di formulare la MQ partendo dal punto di vista pi` u radicale possibile, attribuendo alla stessa logica usata nel trattare i sistemi quantistici, alcune propriet` a differenti da quelle della logica classica e modificando la teoria dell’interpretazione. Per esempio, sono usati pi` u di due valori di verit` a e il reticolo booleano delle pro1
La definizione del concetto di spazio di Hilbert infinito dimensionale e gran parte della teoria generale degli spazi di Hilbert cos`ı come la conosciamo oggi sono anch’essi dovuti a von Neumann e alla sua formulazione della MQ.
1.2 Sulla Meccanica Quantistica
7
posizioni `e rimpiazzato da una struttura non distributiva pi` u complessa. Nella prima formulazione della logica quantistica, oggi denominata Logica Quantistica Standard, proposta da Von Neumann e Birkhoff nel 1936, la struttura dell’algebra booleana delle proposizioni era rimpiazzata con quella di un reticolo ortomodulare che, di fatto, ha come modello l’insieme dei proiettori ortogonali su uno spazio di Hilbert ovvero, l’insieme dei sottospazi chiusi su cui proiettano i proiettori [Bon97], unitamente ad alcune regole di composizione. ` noto che, a dispetto della sua eleganza, tale modellizzazione contiene diversi E difetti quando si cerca di tradurla in termini operativi fisici (o pi` u precisamente operazionali). Accanto alle diverse formulazioni delle Logiche Quantistiche [Bon97, DCGi02, EGL09], esistono oggi formulazioni fondazionali alternative basate su altri punti di vista (come la teoria dei topos). 1.2.2 La MQ nel panorama della fisica attuale La Meccanica Quantistica – genericamente parlando la teoria della fisica del mondo atomico e sub atomico – insieme alla Teoria della Relativit` a Speciale e Generale (RSG) – genericamente parlando la teoria fisica della gravit`a, del mondo macroscopico e della cosmologia – costituiscono i due paradigmi attraverso i quali si `e sviluppata la fisica del XX secolo e quella dell’inizio del secolo attuale. I due paradigmi si sono fusi in vari contesti dando luogo a teorie quantistiche relativistiche, in particolare alla Teoria Quantistica Relativistica dei Campi [StWi00, Wei99], che ha avuto uno sviluppo impressionante con straordinari successi esplicativi e predittivi nel contesto della teoria delle particelle elementari e delle forze fondamentali. A titolo d’esempio tale teoria ha previsto, all’interno del cosiddetto modello standard delle particelle elementari, l’unificazione della forza debole ed elettromagnetica che `e poi stata confermata sperimentalmente alla fine degli anni ’80 con un esperimento spettacolare al C.E.R.N. di Ginevra in cui si sono osservate le particelle Z0 e W ± previste dalla teoria dell’unificazione elettrodebole. La previsione del valore di una grandezza fisica, che `e stata poi confermata con una delle maggiori precisioni di tutta la storia della Fisica, si `e avuta nell’elettrodinamica quantistica. Si tratta del valore del cosiddetto rapporto giromagnetico dell’elettrone g. Tale grandezza fisica `e un numero puro. Il valore previsto dall’elettrodinamica quantistica per a := g/2 − 1 `e: 0.001159652359 ± 0.000000000282 , quello ottenuto sperimentalmente `e risultato essere 0.001159652209 ± 0.000000000031 . Molti fisici ritengono che la MQ sia la teoria fondamentale dell’Universo (pi` u profonda delle teorie relativistiche) anche per il fatto che risulta essere valida per scale lineari di lunghezza che variano in uno spettro di ampiezza impressionante: da 1m (condensati di Bose-Einstein) almeno fino a 10−16 m (interno
8
1 Introduzione
dei nucleoni: quarks). La MQ ha avuto un enorme successo sia teorico che sperimentale anche nella scienza che studia la struttura della materia solida, nell’ottica, nell’elettronica, con diverse importantissime ricadute tecnologiche: ogni oggetto tecnologico di uso comune che sia moderatamente sofisticato (giocattoli per i bambini, telefonini, telecomandi...) da contenere qualche elemento semiconduttore sfrutta propriet` a quantistiche della materia. Tornando ai due paradigmi scientifici del XX secolo – MQ e RSG – rimangono diversi punti oscuri in cui i due paradigmi sembrano venire in conflitto, in particolare il problema della cosiddetta “quantizzazione della gravit` a” e della struttura dello spaziotempo alle scale di Planck – 10−33 cm, 10−43 s – le scale di lunghezza e di tempo che si ottengono combinando le costanti fondamentali delle due teorie: la velocit`a della luce, la costante di gravitazione universale e la costante di Planck. La necessit`a di una struttura discontinua dello spaziotempo a scale ultramicroscopiche `e suggerita anche da alcune difficolt` a matematiche (ma anche concettuali) non completamente risolte dalla cosiddetta teoria della Rinormalizzazione quantistica, dovute all’apparire di infiniti che si incontrano nei calcoli dei processi dovuti alle interazioni fondamentali tra le particelle elementari. Dal punto di vista puramente matematico, l’apparire di questi infiniti `e in realt` a connesso al problema, intrinsecamente ambiguo, della definizione del prodotto di distribuzioni: gli infiniti non sono la radice del problema, sono solo un modo di esplicitare il problema. Tali questioni irrisolte o parzialmente risolte hanno dato luogo a recenti ed importanti sviluppi teorici, che hanno avuto influenze nello sviluppo della stessa matematica pura, come la teoria delle (super) stringhe (e brane) e le varie versioni di Geometria non commutativa, prima fra tutte quella di A. Connes. La difficolt`a nel decidere quale di queste teorie abbia un senso fisico e descriva l’Universo alle scale piccolissime `e anche di natura tecnologica: la tecnologia attuale non `e in grado di preparare esperimenti che permettano il discernimento tra le varie teorie proposte. Altri punti di contrasto tra MQ e RSG, su cui la discussione `e oggi un po’ pi` u pacata rispetto al passato, riguardano il rapporto della MQ con concetti di localit` a di natura relativistica (paradosso Einstein-Podolsky-Rosen [Bon97]) in relazione ai fenomeni di entanglement della MQ. Ci` o `e dovuto in particolare all’analisi di Bell alla fine degli anni ’60 ed ai celebri esperimenti di Aspect che hanno dato torto alle aspettative di Einstein, ragione all’interpretazione di Copenaghen, ed hanno provato che la nonlocalit` a `e una caratteristica della Natura, indipendentemente dall’accettazione o meno dell’interpretazione standard della MQ. Sembra ormai condivisa dalla maggior parte dei fisici l’idea che l’esistenza di processi fisici non locali, prevista teoricamente dalla MQ, non implichi alcuna reale violazione dei fondamenti della Relativit`a (l’entanglement quantistico non coinvolge trasmissione superluminare di informazioni e violazione della causalit` a [Bon97]). Nell’interpretazione standard della MQ detta di Copenaghen, rimangono punti fisicamente e matematicamente poco chiari, ma di estremo interesse concettuale. In particolare, a dispetto di diverse ed interessanti proposte, non
1.2 Sulla Meccanica Quantistica
9
`e ancora chiaro come la meccanica classica si possa ottenere come sotto caso o caso limite della MQ e come si possa fissare un limite (anche provvisorio o impreciso) tra i due mondi. Ulteriormente rimane aperto il problema della descrizione fisica e matematica del cosiddetto processo di misura quantistica, di cui parleremo pi` u avanti, e che `e strettamente connesso a quello del limite classico della MQ. Anche prendendo spunto da questo problema sono nate altre interpretazioni del formalismo della MQ, profondamente differenti dall’interpretazione di Copenaghen. Tra queste pi` u recenti interpretazioni, una volta considerate eretiche, di grande interesse `e in particolare quella a variabili nascoste di Bohm [Bon97, Des80]. Talvolta vengono sollevate riserve sulla formulazione Meccanica Quantistica e sul fatto che non sia veramente comprensibile, ma che si tratti semplicemente di un elenco di procedure che “materialmente funzionano”, mentre la ` opinione dell’auvera essenza sia qualcosa di inaccessibile, di “noumenico”. E tore che dietro a questo punto di vista ci sia un pericoloso errore epistemologico. Basato sulla credenza che “spiegare” un fenomeno significhi ridurlo alle categorie dell’esperienza quotidiana. Come se queste fossero qualcosa di pi` u profondo della realt` a stessa. L’opinione dell’autore `e che sia il esattamente il contrario: le categorie dell’esperienza quotidiana sono state costruite con l’esperienza quotidiana senza, conseguentemente, alcuna pretesa di profondit`a metafisica. Dietro quel semplice “materialmente funziona” ci potrebbe essere un mare filosofico profondo che ci avvicina alla realt` a invece che allontanarcene. La Meccanica Quantistica ci ha insegnato a pensare in un modo differente ed `e stata (anzi `e), per questo, un opportunit` a incredibile per l’esperienza umana. Voltarle le spalle dicendo che non l’abbiamo compresa, perch´e si rifiuta di ricadere nelle nostre categorie usuali, significa chiudere una porta su qualcosa di enorme. Questo `e il parere dell’autore, che `e fermamente convinto che il principio di indeterminazione di Heisenberg (ridotto a semplice teorema nella formulazione moderna) sia una delle massime vette raggiunte dall’intelletto umano.
Parte I
Elementi di teoria degli operatori lineari
2 Spazi normati e spazi di Banach, esempi e applicazioni Sono persuaso che la matematica sia il pi` u importante strumento di conoscenza fra quelli lasciatici in eredit` a dall’agire umano, essendo la fonte di tutte le cose. Cartesio
In questo capitolo iniziale presenteremo alcune nozioni ed alcuni risultati fondamentali della teoria generale degli spazi normati e degli spazi di Banach. Introdurremo anche alcune strutture algebriche modellizzate su algebre naturali di operatori sugli spazi di Banach. Le algebre di Banach di operatori svolgono un ruolo di grande importanza nelle formulazioni moderne della Meccanica Quantistica. Questo capitolo serve essenzialmente ad introdurre il linguaggio e gli strumenti topologici elementari della teoria degli spazi di operatori lineari. Pertanto, anche se questo capitolo `e (escludendo alcuni esempi) autoconsistente, non `e assolutamente esaustivo nei confronti dell’enorme letteratura sulle propriet`a fondamentali degli spazi di normati e di Banach. Si rimanda a [Rud82, Rud91] per trattazioni esaustive. Nei capitoli successivi specializzeremo la discussione al caso degli operatori su spazi di Hilbert complessi, con una piccola parentesi pi` u generale, nel capitolo 4, in riferimento agli operatori compatti. Le nozioni pi` u importanti di questo capitolo sono sicuramente la nozione di operatore limitato e le varie nozioni di topologia (indotta da norme o da seminorme) negli spazi di operatori. L’importanza di questi strumenti matematici deriva dal fatto che il linguaggio degli operatori lineari su spazi lineari `e il linguaggio con cui `e formulata la Meccanica Quantistica. In questo contesto la classe degli operatori limitati riveste un ruolo tecnico centrale anche se, per motivi di carattere fisico, in Meccanica Quantistica ci si trova costretti ad introdurre e lavorare anche con operatori non limitati come vedremo nella seconda parte del libro. Nella prima parte di questo capitolo ricorderemo alcune nozioni di topologia generale utili in tutto il libro. Nella seconda parte introdurremo le nozioni elementari di spazio normato e di spazio di Banach e delle loro propriet` a topologiche elementari, fornendo qualche importante esempio, come lo spazio delle funzioni continue sullo spazio topologico compatto K, C(K), e dimostrando l’importante teorema di Arzel`a-Ascoli in tale caso. Negli esempi dimostreremo anche qualche teore-
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
14
2 Spazi normati e spazi di Banach, esempi e applicazioni
ma chiave come quello relativo alla completezza degli spazi Lp (teorema di Fischer-Riesz). Nella terza parte passeremo a presentare la nozione di norma operatoriale e delle propriet`a pi` u utili di tale nozione. Nella quarta parte discuteremo i teoremi fondamentali generali degli spazi di Banach, nelle versioni pi` u elementari. Il teorema di Hahn-Banach, il teorema di Banach-Steinhaus, il teorema dell’applicazione aperta (partendo dal teorema di Baire). Faremo ci`o dimostrando anche diverse utili conseguenze tecniche dei teoremi menzionati (teorema delloperatore inverso continuo e del grafico chiuso). Infine presenteremo brevemente le varie topologie operatoriali che entrano in gioco nella teoria degli operatori, accennando brevemente alla nozione di spazio di Fr´echet. La quinta parte sar`a dedicata alla nozione di proiettore negli spazi normati, nozione che specializzeremo nel capito successivo a quella, pi` u utile per i nostri scopi, di proiettore ortogonale. Le ultime due parti, saranno dedicate a due argomenti elementari, ma importanti: la nozione di norma equivalente (includendo la dimostrazione del fatto che gli spazi normati di dimensione n finita, sono di Banach e omeomorfi ad un corrispondente Cn con norma standard), e la teoria delle mappe di contrazione in spazi normati completi (includendo, negli esempi, una dimostrazione del teorema di esistenza ed unicit`a locale per le equazioni differenziali del prim’ordine su Rn o Cn ). Assumeremo d’ora in poi che il lettore sia completamente familiare con la teoria elementare degli spazi vettoriali e delle applicazioni lineari [Ser94I]. Per comprendere appieno alcuni degli esempi che presenteremo, il lettore dovrebbe conoscere alcune nozioni e risultati fondamentali della teoria della misura. Nozioni topologiche generali e di teoria della misura generale sono riassunte in appendice in fondo al libro.
2.1 Richiami di topologia generale Nel caso del tutto generale, le nozioni di insieme aperto e insieme chiuso vengono caratterizzati dalla definizione generale che ricordiamo di seguito [Ser94II]. Definizione 2.1. Una coppia (X, T ), con X insieme e T classe di sottoinsiemi di X, si dice spazio topologico se valgono i seguenti fatti: (i) ∅, X ∈ T , (ii) l’unione di elementi (in quantit` a arbitraria) di T `e elemento di T , (iii) l’intersezione di un numero finito di elementi di T `e elemento di T . In questo caso T `e detta topologia su X e gli elementi di T sono detti (insiemi) aperti in X. Valgono le seguenti ulteriori definizioni. (a) Una base topologica di (X, T ) `e un sottoinsieme B ⊂ T tale che ogni elemento di T `e unione di elementi di B.
2.1 Richiami di topologia generale
15
(b) Un intorno aperto di p ∈ X `e un qualsiasi A ∈ T tale che p ∈ A. (c) Gli insiemi chiusi in X sono i complementi, X \ A, degli aperti A ∈ T . Un sottoinsieme S ⊂ X di uno spazio topologico (X, T ) eredita una struttura di spazio topologico da (X, T ), definendo una topologia su S come TS := {S ∩ A | A ∈ T }. Tale topologia (si verifica immediatamente che la definizione `e soddisfatta) `e detta topologia indotta su S da (X, T ). La maggior parte degli spazi topologici che incontreremo in questo libro saranno spazi di Hausdorff, cio`e spazi topologici in cui la classe degli aperti permette di distinguere i punti di una qualsiasi coppia di punti dello spazio. Definizione 2.2. Uno spazio topologico (X, T ) e la sua topologia sono detti di Hausdorff se soddisfano la seguente propriet` a di Hausdorff: per ogni coppia di punti x, x ∈ X esistono due insiemi aperti, A, A ∈ T , tali che A ∩ A = ∅ e x ∈ A, x ∈ A . Osservazioni 2.3. (1) Per un generico spazio topologico (X, T ), gli insiemi X e ∅ risultano essere contemporaneamente aperti e chiusi. (2) Per un generico spazio topologico (X, T ), gli insiemi chiusi soddisfano propriet` a “duali” rispetto a quelle degli aperti, come segue immediatamente dalla loro definizione: (i) ∅, X sono chiusi, (ii) l’intersezione di chiusi (in quantit` a arbitraria) `e ancora un chiuso, (iii) l’unione di un numero finito di chiusi `e ancora un chiuso. (3) L’esempio pi` u semplice di topologia di Hausdorff `e dato dalla classe di insiemi su R costituiti da unioni arbitrarie di intervalli aperti. La classe degli intervalli aperti `e una base per la topologia nel senso della definizione 2.1. Questa topologia, e l’analoga che si ottiene su Rn (e Cn ) rimpiazzando la base degli intervalli aperti con la base delle palle aperte di centro e raggio arbitrari, viene detta topologia euclidea o topologia standard di Rn (e Cn ). Si tratta della topologia usuale alla quale ci si riferisce nei corsi di analisi elementare. Diverse nozioni utili che ricorreranno molto nel seguito del libro sono le seguenti. Definizione 2.4. Se (X, T ) `e uno spazio topologico, la chiusura, S, di un sottoinsieme S ⊂ X `e l’insieme: S := ∩{C ⊃ S , C ⊂ X | C `e chiuso} .
(2.1)
S `e detto essere denso in X se S = X. (X, T ) `e detto separabile se ammette un sottoinsieme S denso e numerabile. Dalla definizione data risultano facilmente le propriet` a seguenti.
16
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proposizione 2.5. Sia (X, T ) uno spazio topologico e sia S ⊂ X. Allora vale quanto segue. (a) S `e un insieme chiuso. (b) S = S. (c) Se T ⊂ X, allora S ⊂ T implica S ⊂ T . (d) S `e chiuso se e solo se S = S. Passiamo ora alle nozioni di convergenza e continuit` a. Per prima cosa ricordiamo le nozioni di convergenza di una successione e di punto di accumulazione. Definizione 2.6. Sia (X, T ) uno spazio topologico. (a) Una successione {xn }n∈N ⊂ X `e detta convergere ad un punto x ∈ X, che `e detto il limite della successione e si scrive: x = lim xn = x n→+∞
e anche
xn → x
per n → +∞
se e solo se, per ogni intorno aperto A di x esiste NA ∈ R tale che xn ∈ A se n > NA . (b) Un punto x ∈ X `e detto punto di accumulazione di un insieme S ⊂ X se ogni intorno A di x contiene un punto di S \ {x}. Osservazione 2.7. Dovrebbe essere evidente dalle definizioni date, che il limite di una successione `e unico quando lo spazio topologico `e di Hausdorff. Inoltre se x `e limite di una successione di punti xn ∈ S con xn = x per ogni n, allora x `e punto di accumulazione di S (in generale non `e per` o vero che i punti di accumulazione sono tutti di questo tipo per uno spazio topologico generico). Il legame tra punti di accumulazione e chiusura di un insieme `e sancito dal seguente classico risultato di topologia generale. Proposizione 2.8. Sia (X, T ) uno spazio topologico e sia S ⊂ X. S coincide con l’unione di S e dell’insieme dei punti di accumulazione di S. La definizione di funzione continua e di funzione continua in un punto, nel caso generale, `e ricordata di seguito. Definizione 2.9. Siano (X, T ) e (X , T ) spazi topologici e si consideri una funzione f : X → X . (a) f `e detta continua, se f −1 (A ) ⊂ T quando A ∈ T . (b) f `e detta continua in p ∈ X se, per ogni intorno aperto Af(p) di f(p), esiste un intorno aperto Ap di p tale che f(Ap ) ⊂ Af(p) . (c) f `e detta essere un omeomorfismo se valgono insieme le seguenti condizioni: (i) f `e continua, (ii) f `e biettiva, (iii) f −1 : X → X `e continua. In questo caso gli spazi topologici X e X sono detti essere omeomorfi (secondo f).
2.2 Spazi e algebre normate e di Banach
17
Osservazioni 2.10. (1) Si verifica immediatamente che f : X → X `e continua se e solo se `e continua in ogni punto p ∈ X. (2) Le definizione (b) si riduce alla definizione elementare “-δ” quando gli spazi X e X siano spazi Rn (o Cn ) dotati della topologia standard, tenendo conto che: (a) gli intorni aperti possono sempre essere scelti come palle aperte di raggi δ ed e che (b) ogni intorno aperto di un punto include una palla aperta centrata in quel punto. Definizione 2.11. Se {(Xi , Ti )}i∈F `e una classe finita di spazi topologici, la topologia prodotto su X := ×i∈F Xi `e l’unica topologia i cui gli aperti sono ∅ e le unioni di tutti i possibili prodotti cartesiani ×i∈F Ai , con Ai ∈ Ti per ogni i ∈ F . Nel caso in cui F non sia finito, la definizione di topologia prodotto richiede un’opportuna generalizzazione (vedi appendice in fondo al libro).
2.2 Spazi e algebre normate e di Banach Dopo aver specializzato al caso degli spazi normati le nozioni di topologia generale introdotte nella sezione precedente, passeremo ad introdurre gli spazi di Banach, per poi concludere introducendo le algebre normate e di Banach, arricchendo la struttura algebrica con la presenza di un prodotto interno. 2.2.1 Spazi normati e loro propriet` a topologiche elementari Le prime nozioni che diamo sono quella di norma, di spazio normato e di funzione continua tra due spazi normati. Esempi di spazi normati, che sono moltissimi in analisi funzionale e nelle sue applicazioni alla fisica, saranno esibiti successivamente, specialmente nella prossima sezione. Definizione 2.12. Sia X uno spazio vettoriale sul campo K = C o R. Un’applicazione N : X → R si dice norma su X e (X, N ) si dice spazio normato, quando N soddisfa le seguenti propriet` a: N0. N (u) ≥ 0 per u ∈ X, N1. N (λu) = |λ|N (u) per λ ∈ K e u ∈ X, N2. N (u + v) ≤ N (u) + N (v), per u, v ∈ X, N3. N (u) = 0 ⇒ u = 0, per u ∈ X. Se N0, N1 e N2 sono soddisfatte ma non lo `e necessariamente N3, N si dice seminorma. Osservazioni 2.13. ` chiaro che da N1 discende che N (0) = 0, mentre da N2 segue la (1) E disuguaglianza: |N (u) − N (v)| ≤ N (u − v)
se u, v ∈ X.
(2.2)
18
2 Spazi normati e spazi di Banach, esempi e applicazioni
(2) La propriet` a N1 `e nota come omogeneit` a, la propriet` a N2 `e nota come (propriet` a della) disuguaglianza triangolare oppure subadditivit` a, le propriet` a N0 e N3 insieme sono note come positivit` a. Se si lascia cadere N3, la propriet` a N0 da sola `e, a volte, chiamata semi positivit` a. Notazione 2.14. Nel seguito || || e p( ), aggiungendo eventuali indici quando necessari, indicheranno sempre rispettivamente norme e seminorme. Useremo comunque, anche qualche altro simbolo se conveniente. Una nozione matematica elementare, ma fondamentale `e la nozione di palla aperta. Definizione 2.15. Sia (X, || ||) uno spazio normato. Una palla aperta di centro x0 ∈ X e raggio r > 0 `e l’insieme: Br (x0 ) := {x ∈ X | ||x − x0 || < r} . Un insieme A ⊂ X `e detto essere limitato, se esiste una palla aperta Br (x0 ) (quindi di raggio finito!) tale che Br (x0 ) ⊃ A. Si osservi che potremmo dare la stessa definizione rimpiazzando la norma || || con una seminorma p e faremo ci`o pi` u avanti. Due propriet` a utili delle palle aperte (valide anche per le palle aperte definite tramite una seminorma), che seguono subito da N2 e dalla definizione di palla aperta, sono le seguenti: Bδ (y) ⊂ Br (x) Br (x) ∩ Br (x ) = ∅
se y ∈ Br (x) e 0 < δ + ||y − x|| < r. se 0 < r + r < ||x − x ||.
(2.3) (2.4)
Passiamo a definire la topologia naturale di uno spazio normato. Definizione 2.16. Si consideri uno spazio normato (X, || ||). (a) A ⊂ X `e aperto se A = ∅ oppure A `e unione di palle aperte. (b) La topologia naturale di X `e la famiglia degli insiemi aperti di X. Osservazioni 2.17. (1) In virt` u di (2.3), risulta subito che: A ⊂ X `e aperto se e solo se: ∀x ∈ A, ∃rx > 0 tale che Brx (x) ⊂ A.
(2.5)
(2) Dalla definizione di insieme aperto e da (2.3) e (2.5) segue subito che gli aperti definiti nel senso della definizione 2.16 sono anche aperti nel senso generale della definizione 2.1. Pertanto la classe degli aperti di uno spazio normato `e effettivamente una topologia nel senso generale. Lo spazio normato X, dotato della famiglia degli aperti suddetti, `e uno spazio topologico in senso proprio. Infine la classe delle palle aperte, di centri e raggi arbitrari, costituisce una base per la topologia naturale dello spazio normato (X, || ||). (3) Ogni spazio normato (X, || ||) soddisfa la propriet` a di Hausdorff della definizione 2.2 (ed `e quindi uno spazio topologico di Hausdorff). La prova
2.2 Spazi e algebre normate e di Banach
19
segue subito da (2.4) scegliendo A = Br (x) e A = Br (x ) avendo fissato r + r < ||x − x||, che deve risultare differente da 0, se x = x , per la propriet` a N3 delle norme. Si noti che se definissimo la topologia adoperando palle aperte definite da una seminorma (invece che una norma), la propriet` a di Hausdorff non sarebbe automaticamente garantita. Teniamo ora conto dei seguenti due fatti validi in ogni spazio normato: (a) gli intorni aperti dei punti possono sempre essere scelti come palle aperte (di raggi e δ) e (b) ogni intorno aperto di un punto include una palla aperta centrata in tale punto (ci` o segue facilmente dalla definizione di aperto in uno spazio normato e dalla (2.3)). Da (a) e (b) si ha immediatamente che, negli spazi normati, la definizione 2.9 di funzione continua pu` o essere equivalentemente enunciata come segue. Definizione 2.18. Un’applicazione f : X → Y, con (X, || ||X ) e (Y, || ||Y ) spazi normati, `e detta continua in x0 ∈ X se, per ogni > 0 esiste un corrispondente δ > 0 tale che ||f(x) − f(x0 )||Y < se ||x − x0 ||X < δ. Una funzione f : X → Y `e detta essere continua se `e continua in ogni punto di X. Nello stesso modo, negli spazi normati, la nozione di successione convergente (definizione 2.6) si specializza nel modo seguente. Definizione 2.19. Se (X, ||||) `e uno spazio normato, una successione {xn }n∈N ⊂ X `e detta convergere ad un vettore x ∈ X, detto il limite della successione, e si scrive: xn → x
per
n → +∞
e anche
limn→+∞ xn = x ,
se e solo se, per ogni > 0 esiste N ∈ R tale che ||xn − x|| < se n > N ; cio`e se e solo se: lim ||xn − x|| = 0 . n→+∞
Osservazione 2.20. Se (X, || ||) `e uno spazio normato e A ⊂ X, allora x ∈ A `e un punto di accumulazione di A se e solo se esiste una successione {xn }n∈N ⊂ A \ {x} tendente a x. Infatti, se x `e punto di accumulazione di A, allora ogni palla aperta B1/n (x), dove n = 1, 2, . . ., contiene almeno un xn ∈ A \ {x}. Allora, per costruzione, xn → x per n → +∞. Viceversa, se {xn }n∈N ⊂ A \ {x} tende a x, dato che, per (2.5), ogni intorno aperto B di x contiene una palla B (x) centrata in x, la definizione di serie convergente implica che B (x) – e quindi B – contiene ogni xn con n > N per qualche N ∈ R. Dunque x `e punto di accumulazione di A Una classe importante di funzioni lineari continue `e quella delle isometrie definite nel seguito.
20
2 Spazi normati e spazi di Banach, esempi e applicazioni
Definizione 2.21. Se (X, || ||X) e (Y, || ||Y ) sono spazi normati sullo stesso campo C o R, un’applicazione lineare L : X → Y `e detta isometria se `e isometrica, cio`e: ||L(x)||Y = ||x||X per ogni x ∈ X. Se l’isometria L : X → Y `e anche suriettiva, L `e detta isomorfismo di spazi normati. Se esiste un isomorfismo di spazi normati (L) dallo spazio normato X allo spazio normato Y, tali spazi si dicono isomorfi (secondo L). Osservazioni 2.22. ` chiaro che ogni isometria L : X → Y `e iniettiva per N3, ma pu` (1) E o non essere suriettiva. Se X = Y, l’assenza di suriettivit`a implica che la dimensione dello spazio X non sia finita. (2) Dato che la controimmagine di una palla aperta secondo un’isometria `e una palla aperta, ogni isometria f : X → Y tra due spazi normati X, Y `e continua rispetto alle topologie dei due spazi normati. (3) Se un’isometria f : X → Y `e anche suriettiva (cio`e se `e un isomorfismo), la sua inversa f −1 : Y → X `e ancora un’applicazione lineare isometrica ed `e quindi f −1 `e un isomorfismo da Y a X. Evidentemente un isomorfismo di spazi normati `e un omeomorfismo (lineare) tra i due spazi. (4) A volte si trova in letteratura una definizione alternativa, e non equivalente a quella da noi adottata, di isomorfismo di spazi normati. Tale definizione richiede solo che un isomorfismo sia un’applicazione lineare bicontinua (cio`e un ` chiaro che un isomorfismo nel senso della definizione omeomorfismo lineare). E definizione 2.21 lo `e anche rispetto a questa seconda definizione, tuttavia non vale il viceversa, perch`e la richiesta di bicontinuit` a `e molto pi` u debole della richiesta di preservare le norme. Per esempio la funzione f : X x → ax ∈ X, dove a = 0 `e una costante fissata, `e un isomorfismo dallo spazio normato X in X nel senso della seconda definizione, ma non in quella adottata da noi. Un ulteriore risultato tecnico elementare che citiamo `e il seguente, che vale negli spazi normati esattamente come accade nello spazio normato elementare R dotato della norma naturale del valore assoluto. Proposizione 2.23. Una funzione f : X → Y tra due spazi normati, X, Y, `e continua in un punto x ∈ X se e solo se `e sequenzialmente continua in quel punto, cio`e f(xn ) → f(x) per n → +∞, per ogni successione {xn }n∈N ⊂ X tale che xn → x se n → +∞. Dimostrazione. Se f `e continua in x, sia {xn }n∈N ⊂ X tendente a x. Dato che f `e continua, per ogni > 0, esiste δ > 0 tale che ||f(xn ) − f(x)||Y < se ||xn − x||X < δ. Dato che ||xn − x|| → 0, concludiamo che, per ogni > 0 esiste N ∈ R tale che ||f(xn ) − f(x)||Y < se n > N . Abbiamo provato che e f `e sequenzialmente continua in x se `e continua in x. Supponiamo ora che f non sia continua in x0 , mostriamo che non pu`o essere sequenzialmente continua in x. Nelle ipotesi fatte, deve esistere > 0, tale che per ogni n = 1, 2, . . ., esiste xn ∈ X tale che ||xn − x||X < 1/n ma ||f(x) − f(xn )||Y > . La successione
2.2 Spazi e algebre normate e di Banach
21
{xn }n=1,2,... costruita in questo modo tende a x, ma la corrispondente successione {f(xn )}n=1,2,... non tende a f(x) in Y. Pertanto f non `e sequenzialmente continua in x. Per ultimo vogliamo discutere le propriet` a di continuit` a delle operazioni di spazio vettoriale rispetto alle topologie naturali presenti sugli spazi normati. Se (X, || ||X ) e (Y, || ||Y ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare lo prodotto cartesiano Y × X dotato della topologia prodotto indotta da quella dei fattori X e Y, presentata nella definizione 2.11. Tale topologia `e quella per cui gli aperti sono, a parte l’insieme vuoto, le unioni di prodotti cartesiani di tutte le palle aperte negli spazi fattore: X e Y. Nel caso in cui Y = X, ci` o permette di studiare la continuit` a dell’operazione di somma di due vettori in X × X, pensata come: + : X × X (u, v) → u + v ∈ X , dove X × X `e dotato della topologia prodotto. Dalla propriet` a N2 delle norme: ||u + v|| ≤ ||u|| + ||v|| segue immediatamente che + `e una funzione congiuntamente continua nei due argomenti rispetto alle topologie naturali; in altre parole, `e continua rispetto alla topologia prodotto nel dominio ed a quella standard nell’immagine. Infatti dalla disuguaglianza triangolare segue che, fissato (u0 , v0 ) ∈ X × X e > 0, allora u +v ∈ B (u0 +v0 ) se (u, v) ∈ Bδ (u0 )×Bδ (v0 ) con 0 < δ < /2. Nel caso in cui Y sia il campo K = R oppure C dello spazio normato X, pensato come spazio normato con la norma del valore assoluto, possiamo studiare la continuit` a dell’operazione di prodotto di scalare e vettore in K × X, pensata come: K × X (α, u) → αu ∈ X , dove il primo membro `e dotato della topologia prodotto. Dalle propriet` a N2 e N1 delle norme, essendo la seconda: ||αu|| = |α| ||u|| , segue immediatamente che il prodotto di uno scalare per un vettore `e una funzione congiuntamente continua nei due argomenti rispetto alle topologie naturali; in altre parole, `e continua rispetto alla topologia prodotto nel dominio ed a quella standard nell’immagine. Anche in questo caso la prova `e immediata: dall’identit` a di sopra e da N2 si ha che, fissato (α0 , u0 ) ∈ K × X, e (K) > 0, allora αu ∈ B (α0 u0 ) se (α, u) ∈ Bδ (α) × Bδ (u0 ) con 0 < δ < /(2α0 ) (K) e 0 < δ < /(2(||u0|| + δ)). (Sopra Bδ (α) indica una palla aperta in K, considerato come spazio normato.)
22
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.2.2 Spazi di Banach Alcune delle propriet` a e nozioni viste precedentemente si possono in realt`a generalizzare a spazi topologici del tutto generali. Viceversa esistono propriet`a, quali la completezza che andiamo a discutere ora, che sono proprie della teoria degli spazi normati (e pi` u in generale, degli spazi topologici metrizzabili che non considereremo, se non marginalmente, in un altro capitolo). Un fatto ben noto gi` a dalla teoria elementare su Rn `e il seguente. Se (X, ||||) `e uno spazio normato e {xn }n∈N ⊂ X `e una successione convergente, allora essa soddisfa anche la cosiddetta propriet` a di Cauchy: per ogni > 0 esiste N ∈ R tale che, se n, m > N , allora ||xn − xm || < . Infatti: se ||xn − x|| → 0 per n → +∞, allora ||xk − x|| < se k > N e quindi ||xn − xm || ≤ ||xn − x|| + ||xm − x|| < se n, m > N/2 . Una successione che soddisfa la propriet`a di Cauchy `e detta successione di Cauchy. L’idea intuitiva della dimostrazione di sopra `e che, se una successione converge a qualche punto, allora i termini della successione si devono avvicinare ` interessante porsi la domanda se sia vero anche sempre di pi` u tra di essi. E il viceversa: una successione di vettori che si avvicinano sempre di pi` u tra di essi ammette sempre un limite? Come ben noto dai corsi di analisi elementare, se X = R, dotato della norma del valore assoluto, la risposta `e positiva (e, di conseguenza, continua ad esserlo su C e su spazi vettoriali costruiti in modo ovvio sui prodotti cartesiani Rn o Cn ed adoperando le norme standard su questi spazi). Ci`o `e garantito dal fatto che R soddisfa il cosiddetto assioma di completezza. Gli spazi normati in cui ogni successione di Cauchy `e una successione convergente sono detti spazi normati completi. In generale, uno spazio normato non `e completo: gli spazi normati completi sono “pochi” e di conseguenza, sono, per loro natura, interessanti. Tali spazi presentano notevoli propriet` a matematiche, moto utili anche per le applicazioni in fisica, che saranno oggetto di gran parte del seguito di questo libro. Definizione 2.24. Uno spazio normato si dice spazio di Banach quando `e completo: cio`e ogni successione di Cauchy di elementi dello spazio converge a qualche elemento dello spazio. Osservazione 2.25. ` chiaro che la propriet` (1) E a di completezza `e invariante per isomorfismi di spazi normati, ma non lo `e sotto omeomorfismi (applicazioni continue con inversa continua, non necessariamente lineari). Un controesempio `e dato dalla coppia di spazi R e (0, 1) entrambi dotati della norma valore assoluto. I due spazi sono connessi da un omeomorfismo ma il primo `e completo, mentre il secondo non lo `e. ` facile provare che ogni sottospazio M chiuso di uno spazio di Banach B (2) E `e a sua volta uno spazio di Banach rispetto alla restrizione della norma: ogni
2.2 Spazi e algebre normate e di Banach
23
successione di Cauchy di M `e tale anche rispetto a B e quindi deve convergere a qualche punto di B. Tale punto deve appartenere a M perch´e M `e chiuso e quindi contiene i suoi punti di accumulazione. Gli spazi Cn e Rn dotati della norma standard: n |ck |2 ||(c1 , . . . , cn )|| = k=1
sono sicuramente l’esempio pi` u ovvio di spazio di Banach finitodimensionale, complesso e reale, rispettivamente. Si pu`o inoltre provare che ogni spazio di Banach finitodimensionale complesso `e omeomorfo ad un corrispondente Cn dotato della norma detta sopra. Proveremo questo risultato nella sezione 2.6, ma daremo esempi espliciti di spazi di Banach a partire dalla prossima sezione. Vale comunque un importante risultato generale per ogni spazio normato: ogni spazio normato pu` o essere completato producendo uno spazio di Banach determinato dallo spazio di partenza, che risulta esser denso nello spazio pi` u grande completo. Teorema 2.26. (Del completamento per spazi di Banach). Sia (X, || ||) uno spazio vettoriale sul campo K = C o R. (a) Esiste uno spazio di Banach (Y, N ) su K, detto completamento di X, tale che X si identifica isometricamente con un sottospazio denso di Y tramite un’applicazione lineare iniettiva J : X → Y. In altre parole, esiste un’applicazione lineare iniettiva J : X → Y con J(X) = Y
e
N (J(x)) = ||x|| per ogni x ∈ X.
(b) Se la terna (J1 , Y1 , N1 ) con J1 : X → Y1 lineare isometrica e (Y1 , N1 ) spazio di Banach su K `e tale che (X, || ||) si identifica isometricamente con un sottospazio denso di Y1 tramite J1 , allora esiste ed `e unico un isomorfismo di spazi normati φ : Y → Y1 tale che J1 = φ ◦ J. Schema della dimostrazione. Diamo solo l’idea generale della dimostrazione che `e molto simile ad una possibile procedura che si usa per completare i razionali nei reali. (a) Conviene considerare lo spazio C delle successioni di Cauchy di elementi di X e definire la relazione di equivalenza in C: xn ∼ xn
⇔
esiste
lim ||xn − xn || = 0 .
n→∞
` chiaro che X ⊂ C/∼ identificando ogni x di X con la classe di equivalenza E della successione costante xn = x. L’applicazione che definisce tale identificazione la indicheremo con J. Si prova facilmente che C/∼ `e uno spazio vettoriale su K normato rispetto alla struttura indotta naturalmente da quella di X. Si prova infine che C/∼ `e completo, che J `e lineare, isometrica (e quindi iniettiva)
24
2 Spazi normati e spazi di Banach, esempi e applicazioni
e che J(X) `e denso in Y := C/∼. (b) J1 ◦ J −1 : J(X) → Y1 `e una trasformazione lineare isometrica continua definita su un insieme denso J(X) ⊂ Y a valori in uno spazio di Banach Y1 , e pertanto si estende unicamente ad una trasformazione φ lineare continua ed isometrica su Y (vedi gli esercizi 2.14 e 2.15). Essendo φ isometrica, `e anche iniettiva. La stessa cosa si pu` o dire per l’estensione φ di J ◦J1−1 : J1 (X) → Y e per costruzione (J ◦J1−1 )◦(J1 ◦J −1 ) = idJ(X) . Estendendo per continuit`a su J(X) = Y troviamo che φ ◦ φ = idY e con un analogo ragionamento troviamo anche che φ ◦ φ = idY1 . Concludiamo che φ e φ sono anche suriettive ed in particolare φ `e un isomorfismo di spazi normati e che per costruzione vale J1 = φ ◦ J. L’unicit` a di un isomorfismo φ : Y → Y che soddisfa J1 = φ ◦ J si ha facilmente notando che ogni altro siffatto isomorfismo di spazi normati ψ : Y → Y1 , per linearit` a deve soddisfare J − J = (φ − ψ) ◦ J e quindi (φ − ψ) J(X) = 0. L’unicit` a dell’estensione dell’applicazione (φ − ψ) J(X) , continua con dominio J(X) denso, a J(X) = Y prova che φ = ψ. Un criterio per verificare se uno spazio normato `e di Banach `e espresso dalla seguente utile proposizione. Proposizione 2.27. Sia (X, || ||) uno spazio normato. Si supponga che +∞ ogni serie e n=0 xn di elementi di X che converge assolutamente (cio` +∞ e uno n=0 ||xn|| < +∞) converga a qualche elemento di X. Allora (X, || ||) ` spazio di Banach. Dimostrazione. Si consideri una successione di Cauchy {vn }n∈N ⊂ X. Mostriamo che, se vale la propriet`a scritta sopra, allora tale successione converge ad un elemento di X. Dato che al successione `e di Cauchy, per ogni k = 0, 1, 2, . . ., esiste Nk tale che ||vn − vm || < 2−k se n, m ≥ Nk . Scegliamo i numeri Nk in modo tale che Nk+1 > Nk ed estraiamo la sottosuccessione {vNk }k∈N . Infine definiamo i vettori: z0 := vN1 e zk := vNk+1 − vNk e costruiamo la +∞ k serie k=0 zk . Si osservi che vNk = k =0 zk . Per costruzione ||zk || < 2−k e pertanto la serie suddetta converger`a assolutamente. Nelle ipotesi fatte sullo spazio normato, esister`a v ∈ X tale che: lim vNk = lim
k→+∞
k→+∞
k
zk = v .
k =0
Concludiamo che la sottosuccessione {vNk }k∈N della successione di Cauchy {vn }n∈N converge a v ∈ X. Per concludere `e sufficiente provare che tutta la successione {vn }n∈N converge a tale limite. Valendo: ||vn − v|| ≤ ||vn − vNk || + ||vNk − v|| , per un fissato > 0, possiamo trovare N per cui ||vn − vNk || < /2 se n, Nk > N , dato che la successione {vn }n∈N `e di Cauchy. D’altra parte, possiamo trovare M tale che ||vNk −V || < /2 se k > M , dato che vNk → v. Concludendo: prendendo k > M abbastanza grande, in modo tale che Nk > N ,
2.2 Spazi e algebre normate e di Banach
25
abbiamo che ||vn − v|| < se n > N . Dato che > 0 era arbitrario, questo significa che vn → v se n → +∞. 2.2.3 Un esempio: lo spazio di Banach C(K; Kn ) e il teorema di Arzel` a-Ascoli Ricordiamo preventivamente la seguente definizione topologica generale. Definizione 2.28. Sia (X, T ) spazio topologico e K ⊂ X (eventualmente K = X). (a) K `e detto compatto se ogni ricoprimento di aperti di K ammette un sotto ricoprimento finito1 . (b) K `e detto relativamente compatto se K `e compatto. (c) X `e detto localmente compatto se ogni suo punto ammette un intorno aperto relativamente compatto. Le propriet` a degli insiemi compatti sono molteplici [Ser94II] e non ce ne occuperemo in questa sede (torneremo su tale nozione nel capitolo 4), eccetto che per le due seguenti propriet` a elementari. Proposizione 2.29. Se K = C o R, si denoti la norma standard di Kn con: n |ck |2 , (c1 , . . . , cn ) ∈ Kn . (2.6) ||(c1 , . . . , cn )|| := k=1
Sia f : X → Kn , una funzione continua dallo spazio topologico (X, T ) allo spazio normato (Kn , || ||) (complesso o reale a seconda del caso). Se K ⊂ X `e compatto allora la restrizione di f a K `e limitata, cio`e esiste M ∈ R tale che ||f(x)|| ≤ M per ogni x ∈ K. Dimostrazione. Dato che f `e continua in ogni punto p ∈ K, vale ||f(x)|| ≤ Mp ∈ R per ogni x ∈ Ap intorno aperto di p. Dato che K `e compatto, possiamo estrarre un sotto ricoprimento finito {Apk }k=1,...,N dal ricoprimento di aperti {Ap }p∈K di K. Il numero M := maxk=1,...,N Mk soddisfa la tesi. Nel caso in cui X sia Rn (oppure Cn ), il famoso teorema di Heine-Borel [Ser94II] assicura che: i compatti in Rn dotato della topologia standard sono tutti e soli i sottoinsiemi chiusi e limitati. In tal caso la proposizione 2.29 non `e altro che la parte fondamentale dell’enunciato del noto teorema di Weierstrass dell’analisi elementare. In riferimento alla nozione di topologia indotta (vedi la sezione 2.1), abbiamo che la propriet` a di compattezza `e una propriet` a ereditaria, nel senso della seguente proposizione, di dimostrazione immediata dalla definizione 2.28. 1 In altre parole: se {Ai }i∈I ⊂ T con ∪i∈I Ai ⊃ K allora esiste J ⊂ I, J finito, con ∪i∈J Ai ⊃ K.
26
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proposizione 2.30. Se (X, T ) `e uno spazio topologico, K ⊂ X `e compatto se e solo se `e compatto come spazio topologico (K, TK ), dove TK `e la topologia indotta su K da (X, T ). Uno degli esempi pi` u semplici di spazio di Banach non ovvio e, generalmente parlando, infinito dimensionale, `e quello dello spazio C(K; Kn ) delle funzioni continue a valori su Kn con K = C oppure R, definite su un comune spazio topologico compatto K ed assumendo come norma quella dell’estremo superiore ||f||∞ := supx∈K ||f(x)||. Si osservi che tale norma `e sempre finita se f ∈ C(K; Kn ) proprio per la proposizione 2.29. Proposizione 2.31. Sia K = C o R e si consideri lo spazio normato (Kn , || ||) con norma data in 2.6. Se K `e uno spazio topologico compatto, lo spazio vettoriale C(K; Kn ) delle funzioni continue da K a Kn , dotato della norma: ||f||∞ := sup ||f(x)|| , x∈X
`e uno spazio di Banach (complesso o reale a seconda del caso). Dimostrazione. Sia {fn }n∈N ⊂ C(K; K) una successione di Cauchy. Vogliamo dimostrare che esiste f ∈ C(K; K) tale che ||fn − f||∞ → 0 per n → +∞. Dato che {fn }n∈N `e di Cauchy, per ogni fissato x ∈ K, `e di Cauchy anche la successione delle n-ple: fn (x) ∈ Kn . In questo modo, dato che Kn `e completo, punto per punto viene definita la funzione: f(x) := lim fn (x) . n→+∞
Vogliamo ora provare che f ∈ C(K; K) e che ||fn − f||∞ → 0 per n → +∞. Dato che la successione {fn }n∈N `e di Cauchy, per ogni > 0, esiste N tale che, se n, m > N ||fn (x) − fm (x)|| < ,
per tutti gli x ∈ K.
D’altra parte, dalla definizione di f, per un fissato x ∈ K e per ogni x > 0, esister`a Nx,x tale che, se m > Nx,x vale ||fm (x) − f(x)|| < x . Usando entrambi i fatti abbiamo subito che, se n > N : ||fn (x) − f(x)|| ≤ ||fn (x) − fm (x)|| + ||fm (x) − f(x)|| < + x dove abbiamo scelto m > max(N , Nx,x ). In definitiva, se n > N , vale ||fn (x) − f(x)|| < + x ,
per ogni x > 0.
Dato che x > 0 `e arbitrario, la disuguaglianza di sopra vale anche per x = 0, eventualmente diventando un’uguaglianza. In questo modo si perde la dipendenza da x. In definitiva, per ogni > 0 esiste N ∈ N tale che, se n > N ||fn (x) − f(x)|| ≤ , per tutti gli x ∈ K. (2.7)
2.2 Spazi e algebre normate e di Banach
27
Quindi {fn } converge a f uniformemente. Dato che (2.7) vale per ogni x ∈ K, vale anche prendendo l’estremo superiore degli x in K: per ogni > 0 esiste N ∈ N tale che supx∈K ||fn (x) − f(x)|| < , se n > N . In altre parole ||fn − f||∞ → 0 ,
se n → +∞.
Per concludere mostriamo che f deve essere anche continua. Fissato x ∈ K, per ogni > 0 esibiremo δ > 0, tale che ||f(x ) − f(x)|| < se ||x − x|| < δ. A tal fine, sfruttando l’uniforme convergenza provata, scegliamo n tale che, per il valore di fissato, ||f(z) − fn (z)|| < /3 per ogni z ∈ K. Ulteriormente, dato che fn `e continua, esiste δ > 0 tale che ||fn (x ) − fn (x)|| < /3 se ||x − x|| < δ. Mettendo tutto insieme, e facendo uso della disuguaglianza triangolare, possiamo concludere che, come volevamo, se ||x − x|| < δ, allora: ||f(x ) − f(x)|| ≤ ||f(x ) − fn (x )|| + ||fn (x ) − fn (x)|| + ||fn (x) − f(x)|| < /3 + /3 + /3 = . Dunque f ∈ C(K; K).
Notazione 2.32. Nel seguito useremo la notazione C(K) := C(K; C).
Nel caso particolare in cui K sia un compatto che contiene un sottoinsieme denso e numerabile, lo spazio di Banach C(K) ha una propriet` a interessante espressa dall’enunciato del teorema di Arzel` a-Ascoli nella sua forma pi` u elementare che riportiamo sotto. Anche se tale teorema non `e strettamente legato al contenuto di questo libro, per la sua importanza (specie le sue generalizzazioni) e per la caratteristica procedura di dimostrazione merita di essere menzionato e provato. Definizione 2.33. Una successione {fn }n∈N di funzioni fn : X → C, con (X, || ||) spazio normato2 , si dice equicontinua se, per ogni > 0 esiste δ > 0 tale che valga |fn (x) − fn (x )| < se ||x − x || < δ, per ogni n ∈ N e per ogni x, x ∈ X. Teorema 2.34. (Di Arzel` a-Ascoli.) Si consideri uno spazio topologico K compatto e separabile (definizione 2.4). Sia {fn }n∈N ⊂ C(K) una successione di funzioni che soddisfa le seguenti due condizioni: (a) `e equicontinua, (b) esiste C ∈ R con ||fn ||∞ < C per ogni n ∈ N. Allora esiste una sottosuccessione {fnk }k∈N che converge a qualche f ∈ C(K) nella topologia della norma || ||∞. Dimostrazione. Si considerino i punti q di un insieme denso numerabile Q ⊂ K etichettati su N. Se q1 `e il primo dei punti detti, consideriamo i valori |fn (q1 )|. Tali valori cadono in un compatto [0, C] e quindi, o sono finiti e quindi 2
La definizione si estende banalmente agli spazi metrici.
28
2 Spazi normati e spazi di Banach, esempi e applicazioni
fn (q1 ) = x1 ∈ C per uno stesso valore x1 e per infiniti valori di n, oppure i numeri fn (q1 ) ammetteranno un punto di accumulazione x1 ∈ C. In entrambi i casi, esister`a una sottosuccessione {fnk }k∈N per cui fnk (q1 ) → x1 ∈ C per qualche x1 ∈ C. Poniamo f1n := fnk . Possiamo ripetere la procedura considerando i valori |f1n (q2 )|, dove q2 `e il secondo punto di Q, estraendo una sottosuccessione {f2n }n∈N dalla successione {f1n }n∈N. Per costruzione, f2n (q1 ) → x1 e f2n (q2 ) → x2 ∈ C se n → +∞. Procedendo in questo modo, per ogni k ∈ N, possiamo costruire una sottosuccessione {fkn }n∈N di {fn }n∈N tale che converge quando valutata su q1 , q2 , . . . , qk ∈ Q. Consideriamo la sottosuccessione di {fn }n∈N costruita prendendo tutti i termini diagonali delle sottosuccessioni costruite come detto: {fnn }n∈N. Mostriamo che tale sottosuccessione `e di Cauchy rispetto alla norma || ||∞, concludendo la dimostrazione. Fissiamo > 0 e ricaviamo il δ > 0 corrispondente ad /3 in riferimento alla propriet` a di equicontinuit` a, quindi ricopriamo K di palle di raggio δ centrate in ogni punto di K e, sfruttando la compattezza di K, estraiamo un (1) (2) (N) sottoricoprimento finito di palle di raggio δ, Bδ , Bδ , . . . , Bδ e scegliamo (j) (j) q (j) ∈ Bδ ∩ Q, per ogni j = 1, . . . , N . Se consideriamo un qualsiasi x ∈ Bδ , avremo allora che: |fnn (x) − fmm (x)| ≤ |fnn (x) − fnn (q (j))| + |fnn (q (j)) − fmm (q (j) )| + |fmm (q (j) ) − fmm (x)| . Il primo ed il terzo termine sono inferiori a /3 per costruzione. Dato che fnn (q (j) ) converge in C se n → +∞, il secondo termine `e inferiore (j) (j) a /3 se n, m > M per qualche M ≥ 0. Per costruzione, se M = (j) maxj=1,...,N M : |fnn (x) − fmm (x)| <
se n, m > M , per ogni x ∈ K.
In altre parole: ||fnn − fmm ||∞ < se n, m > M . Questa `e la tesi che volevamo provare.
Osservazioni 2.35. (1) Il teorema si applica in particolare al caso in cui K `e la chiusura di un aperto non vuoto e limitato A ⊂ Rn , notando che un insieme denso numerabile di K `e l’insieme dei punti di K di coordinate razionali con segno. Inoltre il teorema vale, con la stessa dimostrazione (e con banali modifiche), anche nel caso in cui si sostituisca C(K) con C(K; Kn ). (2) Dimostreremo nel capitolo 4, nella proposizione 4.3, che in uno spazio normato (X, || ||), un sottoinsieme A ⊂ X `e relativamente compatto (cio`e la sua chiusura `e compatta) se da ogni successione di punti di A `e possibile estrarre una sotto successione convergente. In base a questo risultato, il teorema di Arzel`a-Ascoli afferma quanto segue. Se K `e uno spazio topologico compatto separabile, ogni sottoinsieme equicontinuo di C(K) che sia limitato nella norma ||||∞ `e anche relativamente compatto in (C(K), || ||∞ ).
2.2 Spazi e algebre normate e di Banach
29
(3) Esiste un importante teorema di analisi funzionale [Mrr01], detto Teorema di Banach-Mazur, che citiamo senza provare, che dimostra che ogni spazio di Banach complesso separabile `e isometricamente isomorfo ad un corrispondente sottospazio chiuso di (C([0, 1]), || ||∞). Presenteremo diversi esempi di spazi di Banach alla fine della sezione seguente, dopo avere introdotto la nozione di algebra normata e di Banach.
2.2.4 Algebre normate, algebre di Banach ed esempi vari Come vedremo tra poco, in molte applicazioni esiste uno stretto legame tra algebre e spazi normati, tale legame passa per la nozione di operatore lineare su uno spazio normato. Infatti le algebre normate pi` u importanti nelle applicazioni alla fisica sono quelle costituite da operatori. La nozione di algebra e di algebra normata `e comunque del tutto indipendente da quella di operatore. La nozione di algebra si ottiene arricchendo la struttura di spazio vettoriale con un prodotto interno associativo, che sia distributivo rispetto alla somma di vettori e si comporti in modo associativo rispetto al prodotto tra vettori e scalari. La nozione di algebra normata si ottiene aggiungendo, alla struttura di algebra, una norma che renda lo spazio vettoriale uno spazio normato e che si comporti “bene” rispetto al prodotto dell’algebra. Le definizioni principali riguardante le menzionate strutture sono riassunte nella seguente definizione. Definizione 2.36. Un’algebra A sul campo K = C o R `e uno spazio vettoriale su K dotato di un’ulteriore applicazione, ◦ : A × A → A, detta prodotto dell’algebra, che sia associativa: (a ◦ b) ◦ c = a ◦ (b ◦ c)
per ogni terna a, b, c ∈ A
(2.8)
e tale che, rispetto alla struttura di spazio vettoriale soddisfi: A1. a ◦ (b + c) = a ◦ b + a ◦ c per a, b, c ∈ A, A2. (b + c) ◦ a = b ◦ a + c ◦ a per a, b, c ∈ A, A3. α(a ◦ b) = (αa) ◦ b = a ◦ (αb) per α ∈ K e a, b ∈ A. L’algebra (A, ◦) `e detta: commutativa o abeliana se A4. a ◦ b = b ◦ a per ogni coppia a, b ∈ A; algebra con unit` a se contiene un elemento I, detto unit` a dell’algebra, tale che: A5. I ◦ u = u ◦ I = u per ogni a ∈ A; algebra normata ovvero algebra normata con unit` a se `e uno spazio vettoriale normato con norma || || che soddisfi la relazione A6. ||a ◦ b|| ≤ ||a||||b|| per a, b ∈ A;
30
2 Spazi normati e spazi di Banach, esempi e applicazioni
e, nel caso di algebra normata con unit` a, valga anche: A7. ||I|| = 1; algebra di Banach ovvero algebra di Banach con unit` a se A `e spazio di Banach e rispettivamente algebra normata, o algebra normata con unit` a rispetto alla stessa norma. Un omomorfismo di algebre (con unit` a, normate, di Banach), φ : A1 → A2 `e una funzione lineare che preserva i prodotti delle algebre e le unit` a, se presenti. Con ovvie notazioni: φ(a ◦1 b) = φ(a) ◦2 φ(b)
se a, b ∈ A,
φ(I1 ) = I2 .
Un omomorfismo di algebre `e detto isomorfismo di algebre (con unit` a, normate, di Banach) se `e anche biettivo. Se esiste un isomorfismo φ : A → A , le algebre A e A (con unit` a, normate, di Banach) sono dette isomorfe. Osservazioni 2.37. (1) Si dimostra immediatamente che l’unit`a, se esiste `e unica: se I e I soddisfano entrambi A5, allora I = I ◦ I = I. (2) Nel caso di algebre normate, dagli assiomi dati risulta immediatamente che tutte le operazioni dell’algebra sono continue rispetto alle topologie naturali coinvolte. Abbiamo gi` a mostrato alla fine della sezione 2.2.1 che questo `e vero per le operazioni di somma di vettori e di prodotto di scalari e vettori. Anche l’operazione di prodotto ◦ `e congiuntamente continua negli argomenti (cio`e nella topologia prodotto di A × A) valendo: ||a ◦ b|| ≤ ||a|| ||b|| . (3) Si osservi che la nozione di norma non viene coinvolta nella definizione di omomorfismo e isomorfismo di algebre con unit` a, normate, di Banach. (4) La nozione di sottoalgebra (con unit` a, normata, di Banach) `e quella ovvia: si tratta di un sottoinsieme A1 ⊂ A, di un’algebra A (normata, con unit` a, di Banach), che continua ad essere un’algebra (dello stesso tipo di A) rispetto alle ovvie restrizioni delle operazioni di algebra (con la stessa unit` a di A se esiste, dotata della restrizione della norma di A se presente, e A1 deve essere completa se A `e di Banach). Notazione 2.38. Nel seguito, se ci`o non dar` a luogo a fraintendimenti, indicheremo il prodotto di due elementi di un’algebra con ab, semplicemente, invece che con a◦b, oppure, in altri casi, con il semplice puntino: f ·g, specialmente lavorando con algebre di funzioni. Esempi 2.39. Diamo ora diversi esempi di spazi di Banach e di algebre di Banach. Alcuni esempi richiedono, in alcuni punti, nozioni di teoria della misura astratta per le quali si rimanda alla bibliografia indicata ed all’appendice a fine libro. (1) I campi C e R sono banalmente algebre commutative di Banach con unit` a. In entrambi i casi la norma `e l’operazione di estrazione del valore assoluto o modulo.
2.2 Spazi e algebre normate e di Banach
31
(2) Se X `e un insieme qualsiasi e K = C o R, indichiamo con L(X) l’insieme di tutte le funzioni f : X → K limitate, cio`e supx∈X |f(x)| < ∞. L(X) ha una struttura naturale di spazio vettoriale su K rispetto alla solita operazione di composizione lineare di funzioni: se α, β ∈ C e f, g ∈ L(X), (αf + βg)(x) := αf(x) + βg(x)
per ogni x ∈ X.
Possiamo aggiungere un prodotto che rende L(X) un’algebra: se f, g ∈ L(X), (f · g)(x) := f(x)g(x)
per ogni x ∈ X.
Si osservi che l’algebra `e commutativa e con unit`a (data dalla funzione che vale sempre 1). Una norma che rende L(X) algebra di Banach commutativa `e quella dell’estremo superiore: ||f||∞ := supx∈X |f(x)|. La dimostrazione `e del tutto elementare (si basa sulla completezza di C, lavorando punto per punto per x ∈ X) ed `e data nella soluzione degli esercizi a fine capitolo. (3) Se sull’insieme X di sopra definiamo una σ-algebra, Σ, la sottoalgebra delle funzioni Σ-misurabili, Mb (X) ⊂ L(X), `e un insieme chiuso in L(X) rispetto alla topologia della norma dell’estremo superiore. Quindi Mb (X) `e a sua volta un’algebra di Banach commutativa. Ci`o segue immediatamente dall’esempio precedente, tenendo conto del fatto che il limite puntuale di funzioni misurabili `e ancora una funzione misurabile. (4) Se X `e uno spazio topologico, lo spazio vettoriale delle funzioni continue a valori nel campo C si indica con C(X), abbiamo gi` a usato tale notazione, nel caso in cui X sia un compatto, nella sezione 2.2.3. Cb (X) ⊂ C(X) denota il sottospazio delle funzioni continue limitate. Cc(X) ⊂ Cb (X) denota il sottospazio delle funzioni continue a supporto compatto. Nel caso X sia compatto i tre spazi coincidono evidentemente. I tre spazi sono sicuramente algebre commutative rispetto alle operazioni dette nell’esempio (2). C(X) e Cb (X) sono algebre con unit` a data dalla funzione costante di valore 1, mentre non lo `e Cc (X) quando X non `e compatto. Valgono i seguenti risultati generali. (a) Cb (X) `e algebra di Banach rispetto alla norma dell’estremo superiore || ||∞. (b) Se X = K `e compatto, allora Cc(K) = C(K) `e un’algebra di Banach con unit` a rispetto alla norma dell’estremo superiore || ||∞, come abbiamo ` un risultato importante delle teorie delle algebre visto nella sezione 2.2.3. E di Banach [Rud91] che: ogni algebra di Banach commutativa, con unit` a, con campo C, `e isomorfa ad un’algebra C(K) con K compatto. (c) Se X `e uno spazio topologico: 1. di Hausdorff, che sia anche 2. localmente compatto,
32
2 Spazi normati e spazi di Banach, esempi e applicazioni
allora, completando lo spazio normato Cc (X) si ottiene un’algebra di Banach (senza unit` a) commutativa indicata con C0 (X). Tale algebra di Banach si chiama l’algebra delle funzioni continue che tendono a zero all’infinito in X [Rud82]. Si tratta delle funzioni continue f : X → C, tali che, per ogni > 0 esiste un compatto K ⊂ X (dipendente da f in generale) con |f(x)| < se x ∈ X \ K . (5) Se X `e spazio di Hausdorff compatto, consideriamo in C(X) una sottoalgebra A che soddisfi i seguenti requisiti: contenga l’unit`a (data dalla funzione che vale ovunque 1) e sia chiusa rispetto alla coniugazione complessa – se f ∈ A allora f ∗ ∈ A, dove f ∗ (x) := f(x) per ogni x ∈ X in cui la barra indica la coniugazione complessa. Diremo che A separa i punti di X, se per ogni coppia x, y ∈ X con x = y esiste f ∈ A con f(x) = f(y). Il teorema di Stone-Weierstrass [Rud91], prova quanto segue. Teorema 2.40. (Di Stone-Weierstrass). Sia X spazio di Hausdorff compatto e si consideri l’algebra di Banach con unit` a (C(X), || ||∞). Ogni sottoalgebra A ⊂ C(X) che contenga l’unit` a, sia chiusa rispetto alla coniugazione complessa e separi i punti, `e tale che la sua chiusura rispetto alla norma || ||∞ coincide con C(X) stessa. Un esempio tipico `e quello in cui X `e un compatto di Rn e A `e l’algebra dei polinomi complessi ad n variabili (le coordinate standard di Rn ) ristretti ad X. Dal teorema di Stone-Weierstrass si ricava che con i polinomi possiamo approssimare uniformemente ogni funzione complessa continua definita su X. Tale risultato `e utile nella teoria degli spazi di Hilbert per costruire basi hilbertiane, come diremo pi` u avanti. (6) Sia (X, Σ, μ) uno spazio con misura positiva. In altre parole [Rud82], X `e un insieme, Σ `e una σ-algebra di sottoinsiemi di X e μ : Σ → [0, +∞) ∪ {+∞} `e una misura σ-additiva (vedi l’appendice in fondo al libro). Valgono la disuguaglianza di H¨ older e la disuguaglianza di Minkowski, rispettivamente:
1/p
1/q p q |f(x)g(x)|dμ(x) ≤ |f(x)| dμ(x) |g(x)| dμ(x) (2.9) X
X
X
X
1/p
1/p
1/p p p p |f(x) + g(x)| dμ(x) ≤ |f(x)| dμ(x) + |g(x)| dμ(x) X
X
(2.10) dove f, g : X → C sono funzioni misurabili e p, q > 0 con 1/p + 1/q = 1 nel caso della disuguaglianza di H¨ older, mentre p ≥ 1 nel caso della disuguaglianza di Minkowski [Rud82]. Tali disuguaglianze sono dimostrate nelle soluzioni di due esercizi a fine capitolo. Indichiamo con Lp (X, Σ, μ) o, pi` u brevemente, con Lp(X, μ), l’insieme contenente tutte le funzioni f : X → C che sono Σ-misurabili e tali che
2.2 Spazi e algebre normate e di Banach
33
|f(x)|p dμ(x) < ∞. Usando la disuguaglianza di Minkowski, si prova facilmente che Lp (X, μ) `e uno spazio vettoriale rispetto alle solite composizioni lineari di funzioni e che Pp definita sotto `e effettivamente una seminorma: X
Pp (f) :=
1/p |f(x)| dμ(x) . p
X
(2.11)
Dato che Pp(f) = 0 se e solo se f = 0 quasi ovunque rispetto alla misura μ, per ottenere una vera norma, cio`e per avere che sia soddisfatta N3, bisogna fare in modo da identificare con la funzione nulla ogni funzione che differisce da essa per un insieme di misura nulla. A tal fine si pu` o definire la relazione di equivalenza su Lp (X, μ) data da f ∼ g se e solo se f − g `e nulla quasi ovunque rispetto a μ. Si indica con Lp (X, μ) lo spazio quoziente Lp (X, μ)/∼. Questo spazio eredita naturalmente una struttura di spazio vettoriale su C da quella di Lp (X, μ) semplicemente definendo: [f] + [g] := [f + g]
e
α[f] := [αf] per ogni α ∈ C e ogni f, g ∈ Lp (X, μ).
Si verifica facilmente che, in tali definizioni, i secondi membri sono indipendenti dai rappresentanti scelti nelle classi di equivalenza a primo membro. Si riesce a provare che Lp (X, μ) `e spazio di Banach rispetto alla norma:
1/p |f(x)|p dμ(x) , (2.12) ||[f]||p := X
dove f `e un rappresentante arbitrario di [f] ∈ Lp (X, μ). Nel seguito, con qualche impropriet` a di notazione, useremo sempre il simbolo ||f||p, invece di Pp(f), anche lavorando con funzioni e non con classi di equivalenza. Teorema 2.41. (Di Fischer-Riesz.) Se 1 ≤ p < +∞ e (X, Σ, μ) `e uno spazio con misura positiva σ-additiva, lo spazio normato associato Lp (X, μ) `e uno spazio di Banach. Dimostrazione. Nel seguito indicheremo con la semplice lettera, per es. f, e senza le parentesi quadre, gli elementi di Lp (X, μ), identificandoli, quando conveniente, con funzioni (individuate a meno di insiemi di misura nulla). Per provare la tesi, in virt` u della proposizione 2.27, `e sufficiente verificare +∞ che se la serie di funzioni di Lp(X, μ), n=0 fn converge assolutamente, cio`e +∞ +∞ n=0 ||fn ||p ≤ K < +∞, allora n=0 fn = f quasi ovunque per qualche f ∈ Lp (X, μ) nel senso della topologia di || ||p. Per provare ci` o `e conveniente N definire la seguente successione ausiliaria di funzioni: gN (x) := n=1 |fn (x)|, N dove N = 1, 2, . . .. Per costruzione ||gN ||p ≤ n=1 ||fn ||p ≤ K per ogni N = 1, 2, . . .. Vogliamo ora provare che esiste finito il limite limN→+∞ gN (x) per quasi tutti gli x ∈ X. Per provare ci`o si osservi che la successione delp le funzioni integrabili gN `e non negativa e non decrescente per costruzione p e vale X gN (x) dμ(x) < K p per ogni N . Il teorema della convergenza mop notona (vedi appendice) implica allora che il limite gp delle gN (che esiste,
34
2 Spazi normati e spazi di Banach, esempi e applicazioni
p come funzione a valori in [0, +∞], dato che la successione delle gN ≥ 0 `e non p decrescente) deve avere integrale finito, e quindi g ≥ 0 dovr` a essere finita a meno di un eventuale insieme di misura nulla. Dato che p ≥ 0, nei punti x ∈ X in cui g(x)p < +∞, risulter` a anche limN→+∞ g N (x) = g(x) < +∞. Per costruzione, nei punti x in cui g(x) `e finita, la serie +∞ a assolun=0 fn (x) sar` tamente convergente. Pertanto converger`a a corrispondenti numeri f(x) ∈ C. Definendo f(x) = 0 nei punti nei quali la serie delle fn non converge, abbia+∞ mo ottenuto che la serie n=0 fn converge quasi ovunque ad una funzione f : X → C (misurabile perch´e limite quasi ovunque di funzioni misurabili). N La funzione f appartiene a Lp (X, μ). Infatti, posto fN (x) := n fn (x), la successione delle |fN |p `e una successione di funzioni non negative tali che p p di Fatou (vedi appendice) X |fN (x)| dμ(x) < K per ogni N . Per il lemma p f ∈ L (X, μ). Per concludere proviamo che X |fN (x) − f(x)|p dμ(x) → 0 per n → +∞. Come `e facile provare (vedi la nota di fondo pagina relativa alla soluzione dell’esercizio 2.12), |fN (x) − f(x)|p ≤ 2p (|fN (x)|p + |f(x)|p ). Dato che, per costruzione, |fN |p + |f|p ≤ |g|p + |f|p ∈ L1 (X, μ), possiamo applicare il teorema della convergenza dominata (vedi appendice) alla successione delle funzioni |fN − f|p che sappiamo convergere quasi ovunque a 0, otte nendo X |fN (x) − f(x)|p dμ(x) → 0 per n → +∞. Abbiamo provato che la +∞ serie iniziale di funzioni di Lp (X, μ), n=0 fn , che supponevamo convergere +∞ assolutamente, deve soddisfare n=0 fn = f quasi ovunque per la funzione f ∈ Lp (X, μ) costruita sopra, nel senso della topologia di ||||p. Questo conclude la dimostrazione.
La dimostrazione del teorema di Fischer-Riesz implica in realt`a, un risultato tecnico, molto utile nelle applicazioni, che merita essere citato a parte. Proposizione 2.42. Sia 1 ≤ p < +∞ e (X, Σ, μ) uno spazio con misura positiva σ-additiva. Se {fn }n∈N ⊂ Lp (X, μ) soddisfa fn → f per n → +∞ nella topologia di || ||p , allora esiste una sottosuccessione {fnk }k∈N tale che fnk → f quasi ovunque rispetto a μ. Dimostrazione. La successione {fn }n∈N `e convergente ed `e quindi di Cauchy, possiamo allora estrarre una sottosuccessione {fnk }k∈N tale che ||fnk+1 − +∞ fnk || ≤ 2−k . Definiamo sk := fnk+1 − fnk . La serie fn0 + k=1 sk `e allora +∞ +∞ −k assolutamente convergente, essendo: k=1 ||sk ||p < k=1 2 < +∞. Procedendo come nella dimostrazione del teorema 2.41, concludiamo che (a) esiste la somma s ∈ Lp (X, μ) della serie nel senso della convergenza nella topologia di || ||p, (b) la serie converge anche puntualmente quasi ovunque a s trovata: +∞ fn0 (x) + k∈N sk (x) = s(x). Essendo fn0 (x) + k=1 sk (x) = fnk (x), abbiamo p in realt` a trovato che fnk → s ∈ L (X, μ) sia puntualmente μ-quasi ovunque, sia nel senso di || ||p . Dato che per ipotesi vale anche fnk → f ∈ Lp (X, μ) nel senso di || ||p, deve essere ||f − s||p = 0 e quindi f(x) = s(x) quasi ovunque rispetto a μ e dunque fnk (x) → f(x) quasi ovunque rispetto a μ. Per concludere questo esempio osserviamo che lo spazio di Banach Lp (X, μ), in generale, non `e un’algebra (con l’operazione di prodotto dato dal solito
2.2 Spazi e algebre normate e di Banach
35
prodotto puntuale di funzioni) dato che il prodotto puntuale di funzioni di Lp(X, μ) non `e, in generale, elemento dello stesso spazio. (7) In riferimento all’esempio (6), consideriamo il caso particolare in cui X `e un insieme non necessariamente numerabile, Σ `e l’insieme delle parti di X e μ `e la misura che conta i punti: se S ⊂ X, μ(S) = numero di elementi di S, con μ(S) = ∞ se S contiene infiniti punti. In questo caso lo spazio Lp (X, μ) si indica semplicemente con p (X). I suoi elementi sono le “successioni” {zx }x∈X di complessi etichettati su X, tali che: |zx |p < ∞ , x∈X
dove la somma `e definita come: sup |zx|p x∈X0
X0 ⊂ X, X0 finito .
Si osservi che, nel caso X sia numerabile, X = N o Z in particolare, la definizione data sopra, di somma di un insieme di numeri positivi etichettati su X, si riduce a quella solita di somma di una serie (vedi definizione 3.20 e proposizione 3.22). Pertanto p (N) `e, per esempio, lo spazio delle successioni {cn }n∈N ⊂ C tali che: +∞ |cn |p < +∞ . n=0
(8) Sempre in riferimento a (X, Σ, μ), consideriamo la classe L∞ (X, μ) delle funzioni misurabili complesse f : X → C tali che |f(x)| < Mf quasi ovunque rispetto a μ, per qualche Mf ∈ R (dipendente da f). L∞ (X, μ) possiede una naturale struttura di spazio vettoriale e quindi di algebra commutativa con unit` a (la funzione che vale ovunque 1), definendo le solite nozioni di combinazione lineare e prodotto di funzioni punto per punto dell’esempio (2). Possiamo dotare L∞ (X, μ) di una seminorma: P∞ (f) := ess sup|f| , dove l’estremo superiore essenziale di f ∈ L∞ (X, μ) `e definito come: ess sup|f| := inf {r ∈ R | μ ({x ∈ X | |f(x)| > r}) = 0 } .
(2.13)
In parole intuitive, si tratta del “pi` u piccolo” maggiorante dei valori assunti da |f| trascurando quello che succede sugli insiemi di misura nulla. Si osservi che risulta in particolare che (lo si provi per esercizio): P∞ (f · g) ≤ P∞ (f)P∞ (g)
se f, g ∈ L∞ (X, μ) .
36
2 Spazi normati e spazi di Banach, esempi e applicazioni
Lavorando come per gli spazi Lp , identificando funzioni che differiscono su insiemi di misura nulla, `e possibile passare ad uno spazio vettoriale complesso di classi di equivalenza L∞ (X, μ) sul quale `e ben definito anche il prodotto: [f] · [g] := [f · g]
se f, g ∈ L∞ (X, μ).
Esattamente come per gli spazi Lp , la seminorma P∞ diventa (evidentemente) una norma su L∞ (X, μ): ||[f]||∞ := ess sup|f| . Esattamente come per gli spazi Lp , L∞ (X, μ) `e uno spazio di Banach e quindi anche un’algebra di Banach. Teorema 2.43. (Di Fischer-Riesz, caso L∞ .) Se (X, Σ, μ) `e uno spazio con misura positiva σ-additiva, lo spazio normato associato L∞ (X, μ) `e uno spazio di Banach. Dimostrazione. Nel seguito indicheremo con la semplice lettere, per es. f, e senza le parentesi quadre, gli elementi di L∞ (X, μ), identificandoli, quando conveniente, con funzioni (individuate a meno di insiemi di misura nulla). Sia {fn }n∈N ⊂ L∞ (X, μ) una successione di Cauchy rispetto a || ||∞. Definiamo gli insiemi, per k, m, n ∈ N Ak := {x ∈ X | |fk (x)| > ||fk ||∞ } e Bn,m := {x ∈ X | |fn (x) − fm (x)| > ||fn − fm ||∞ }. Per costruzione E := ∪k∈N ∪n,m∈N Ak ∪ Bn,m deve avere misura nulla e, in X \ E, la successione delle fn converge uniformemente ad una funzione f, che conseguentemente risulta essere limitata. Estendiamo f su tutto X definendola come la funzione nulla su X \ E. In questo modo f ∈ L∞ (X, μ) ed anche ||fn − f||∞ → 0 se n → +∞. (9) In riferimento all’esempio (8), nel caso particolare in cui Σ `e l’insieme delle parti di X e μ `e la misura che conta i punti, lo spazio L∞ (X, μ) si indica semplicemente con ∞ (X). I suoi elementi sono le “successioni” {zx }x∈X di complessi etichettati su X tali che supx∈X |zx | < +∞. (Per cui, in riferimento alla notazione usata nell’esempio (2), ∞ (X) = L(X).) Notazione 2.44. Nella letteratura corrente prevale l’uso del simbolo f per denotare la classe di equivalenza [f] ∈ Lp (X, μ), con 1 ≤ p ≤ ∞. Noi seguiremo tale uso nelle situazioni in cui ci`o non produrr` a confusione.
2.3 Operatori, spazi di operatori, norme di operatori Introduciamo, con la prossima definizione, le nozioni di operatore lineare e di funzionale lineare, che saranno di centrale importanza in tutto il resto del libro. Assumeremo, d’ora in poi, che il lettore conosca la teoria elementare degli operatori lineari (matrici) tra spazi vettoriali finitodimensionali, di cui useremo qualche risultato senza menzionarlo esplicitamente
2.3 Operatori, spazi di operatori, norme di operatori
37
Definizione 2.45. Siano X e Y spazi vettoriali sullo stesso campo K := R o C. (a) T : X → Y `e detto operatore lineare (o semplicemente operatore) da X in Y se `e lineare: T (αf + βg) = αT (f) + βT (g)
per ogni α, β ∈ K e f, g ∈ X.
L(X, Y) denota l’insieme degli operatori lineari da X in Y. Quando X e Y sono normati, B(X, Y) ⊂ L(X, Y) denota il sottoinsieme degli operatori lineari continui. In particolare L(X) := L(X, X) e B(X) := B(X, X). (b) T : X → K `e detto funzionale lineare (o semplicemente funzionale) su X se `e lineare. (c) Lo spazio X∗ := L(X, K) `e detto duale algebrico di X mentre, se K `e inteso come uno spazio normato rispetto alla norma indotta dal valore assoluto, X := B(X, K) `e detto duale topologico (o semplicemente duale) di X. Notazione 2.46. Come di consueto nei testi di algebra lineare, useremo spesso la notazione T u in luogo di T (u), quando T : X → Y `e un operatore lineare e u ∈ X. Al solito se T, S ∈ L(X, Y) e α, β ∈ K, la combinazione lineare αT + βS `e definita come l’applicazione: (αT +βS)(u) := α(T u)+β(Su) per ogni u ∈ X. αT + βS `e quindi ancora un elemento di L(X, Y). Dato che ogni combinazione lineare di funzioni continue `e una funzione continua, vale quanto segue. Proposizione 2.47. Siano X e Y spazi vettoriali sullo stesso campo K := R o C. L(X, Y), L(X), X∗ , B(X, Y), B(X) e X , sono spazi vettoriali su K. La seconda fondamentale nozione che vogliamo introdurre `e quella di operatore (e funzionale) limitato. Tale nozione viene introdotta partendo da un elementare ma importante risultato. Teorema 2.48. Siano (X, || ||X ), (Y, || ||Y ) spazi normati sullo stesso campo K = C o R. Si consideri T ∈ L(X, Y). (a) Le seguenti due condizioni sono equivalenti: (i) esiste K ∈ R tale che ||T u||Y ≤ K||u||X per ogni u ∈ X, u||Y (ii) supu∈X\{0} ||T < +∞. ||u||X (b) Se vale la condizione (i) o (ii) allora:
||T u||Y
sup u ∈ X \ {0} = inf {K ∈ R | ||T u||Y ≤ K||u||X ||u||X per ogni u ∈ X} . Dimostrazione. (a) Se vale (i), per costruzione supu∈X\{0} Se vale (ii) posto A :=
u||Y supu∈X\{0} ||T , ||u||X
||T u||Y ||u||X
K := A soddisfa (i).
≤ K < +∞.
38
2 Spazi normati e spazi di Banach, esempi e applicazioni
(b) Detto I l’estremo inferiore dell’insieme dei K che soddisfano (i), valendo: ||T u||Y ≤K, u∈X\{0} ||u||X sup
||T u||Y ≤ I. ||u||X ||T u||Y supu∈X\{0} ||u||X
deve essere supu∈X\{0}
Se se i due membri sono diversi allora deve
esistere K0 con < K0 < I, da cui: ||T u||Y < K0 ||u||X per ogni u = 0 e quindi ||T u||Y ≤ K0 ||u||X per ogni u ∈ X. K0 soddisfa allora la condizione (i) e dunque I ≤ K0 per definizione di I, che contraddice K0 < I supposto sopra. Notazione 2.49. Nel seguito ometteremo gli indici nelle norme per denotare gli spazi su cui sono definite se ci` o sar` a ovvio dal contesto. Definizione 2.50. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) `e detto limitato se valgono le due condizioni equivalenti in (a) nel teorema 2.48. In tal caso il numero ||T u|| ||u||=0 ||u||
||T || := sup
(2.14)
`e detto norma (operatoriale) di T . Osservazioni 2.51. (1) Dalla definizione di ||T || si ha subito che se T : X → Y `e limitato vale l’utile propriet` a: ||T u|| ≤ ||T || ||u|| ,
per ogni u ∈ X .
(2.15)
(2) Evidentemente la nozione di limitatezza di un operatore lineare introdotta sopra non pu` o corrispondere alla nozione di funzione limitata. Questo `e dovuto al fatto che l’immagine di una funzione lineare, definita su uno spazio vettoriale, non pu` o essere limitata, proprio per la linearit` a della funzione. La proposizione 2.52 sotto mostra per`o che ha ancora senso interpretare la “limitatezza” nel senso di limitatezza dell’immagine dell’operatore, quando si restringe il dominio ad un insieme limitato. La norma operatoriale pu` o essere calcolata anche in altri modi talvolta utili nelle dimostrazioni. Vale la seguente proposizione in proposito. Proposizione 2.52. Siano X, Y spazi normati sul medesimo campo C o R. T ∈ L(X, Y) `e limitato se e solo esiste finito uno dei secondi membri delle tre identit` a di sotto ed in tal caso tali identit` a sono verificate. ||T || = sup ||T u|| , ||u||=1
(2.16)
2.3 Operatori, spazi di operatori, norme di operatori
39
ovvero ||T || = sup ||T u|| ,
(2.17)
||T || = inf {K ∈ R | ||T u|| ≤ K||u|| per ogni u ∈ X} .
(2.18)
||u||≤1
ovvero
Dimostrazione. Il fatto che T sia limitato se e solo se il secondo membro di (2.16) esista finito e la stessa identit`a (2.16) seguono immediatamente dalla linearit` a di T e dalla propriet` a N1 delle norme. Il fatto che T sia limitato se e solo se il secondo membro di (2.17) esista finito e la stessa identit`a (2.17) seguono facilmente dal seguente ragionamento. Dato che l’insieme degli u con ||u|| ≤ 1 include l’insieme degli u con ||u|| = 1, vale sup||u||≤1 ||T u|| ≥ sup||u||=1 ||T u||. D’altra parte, se ||u|| ≤ 1, vale ||T u|| ≤ ||T v|| per qualche v con ||v|| = 1 (qualunque v suddetto se u = 0 e v = u/||u|| altrimenti). Quindi vale anche sup||u||≤1 ||T u|| ≤ sup||u||=1 ||T u||, da cui si ottiene sup||u||≤1 ||T u|| = sup||u||=1 ||T u|| che dimostra quanto volevamo. Il fatto che T sia limitato se e solo se il secondo membro di (2.18) esista e sia finito e la stessa identit`a (2.18) seguono subito da (b) del teorema 2.48. Esiste un legame tra continuit` a e limitatezza per operatori e funzionali lineari. Tale legame rende importantissima la propriet`a di limitatezza. Il seguente elementare teorema prova, tra l’altro, che gli operatori limitati sono tutti e soli quelli continui. Teorema 2.53. Sia T ∈ L(X, Y) con X, Y spazi normati sul medesimo campo. I seguenti fatti sono equivalenti: (i) T `e continuo in 0, (ii) T `e continuo, (iii) T `e limitato. Dimostrazione. (i) ⇔ (ii). La continuit` a implica banalmente la continuit` a in 0. Mostriamo che la continuit`a in 0 implica la continuit` a. Valendo (T u)−(T v) = T (u − v) si ha che (limu→v T u) − T v = limu→v (T u − T v) = lim(u−v)→0 T (u − v) = 0 per la continuit` a in 0. (i) ⇒ (iii). Dalla continuit` a in 0, esiste δ > 0 tale che, se ||u|| < δ allora ||T u|| < 1. Scelto δ > 0 con δ < δ, se v ∈ X \ {0}, u = δ v/||v|| ha norma inferiore a δ per cui ||T u|| < 1, che in termini di v si scrive ||T v|| < (1/δ )||v||. Vale allora la condizione (a) del teorema 2.48 con K = 1/δ e pertanto, per la definizione 2.50 T `e limitato. (iii) ⇒ (i). Si tratta di un fatto ovvio. Se T `e limitato allora ||T u|| ≤ ||T ||||u|| da cui la continuit` a in 0. Il nome “norma” per ||T || non `e casuale; in effetti la norma di operatori rende a tutti gli effetti B(X, Y), e quindi in particolare B(X) e X , uno spazio normato come proveremo tra poco. Pi` u precisamente, vedremo che B(X, Y) `e
40
2 Spazi normati e spazi di Banach, esempi e applicazioni
uno spazio di Banach se Y `e di Banach e quindi, in particolare, X `e sempre spazio di Banach. Il teorema che segue riguarda anche un altro importante fatto in relazione alla struttura di algebra. Cominciamo con l’osservare che la composizione di operatori di L(X), rispettivamente B(X), produce operatori nello stesso spazio (in particolare perch´e la composizione di funzioni continue produce funzioni continue). Ulteriormente, `e immediato provare che lo spazio vettoriale L(X), rispettivamente B(X), soddisfa gli assiomi A1, A2 e A3 della definizione di algebra quando il prodotto dell’algebra `e definito come la composizione di operatori. In questo modo risulta chiaro che L(X) e B(X) possiedono una struttura naturale di algebra con unit` a, quest’ultima data dalla funzione identit` a I : X → X, inoltre B(X) risulta essere una sottoalgebra di L(X). Nell’ultima parte del teorema seguente si rafforza ulteriormente il risultato, provando che B(X) `e sempre un’algebra normata con unit` a rispetto alla norma operatoriale ed `e ulteriormente algebra di Banach se X `e uno spazio di Banach. Teorema 2.54. Siano X, Y spazi normati sullo stesso campo. (a) L’applicazione || || : T → ||T ||, dove ||T || `e definita da (2.14) per T ∈ B(X, Y), `e una norma su B(X, Y) e rende B(X, Y) spazio normato. (b) Sull’algebra con unit` a B(X) valgono le ulteriori relazioni che la rendono algebra normata con unit` a: (i) ||T S|| ≤ ||T ||||S|| e T, S ∈ B(X), (ii) ||I|| = 1. (c) Se Y `e completo B(X, Y) `e uno spazio di Banach. In particolare: (i) se X `e uno spazio di Banach, B(X) `e un’algebra di Banach con unit` a (data dall’operatore identit` a); (ii) X `e sempre uno spazio di Banach rispetto alla norma dei funzionali, anche se X non `e completo. Dimostrazione. (a) `e diretta conseguenza della definizione di norma di un operatore: le propriet` a definitorie della norma N0, N1, N2, N3 per la norma operatoriale possono essere immediatamente verificate usando le stesse propriet` a N0. N1, N2, N3 per la norma dello spazio Y, la formula (2.16) per la norma operatoriale e la definizione di estremo superiore. (b) Il punto (i) `e immediata conseguenza della (2.15) e della (2.16). (ii) `e di immediata verifica usando l’espressione per la norma operatoriale (2.16). Passiamo a provare la parte (c). Proviamo che se Y `e completo allora B(X, Y) `e uno spazio di Banach. Sia {Tn } ⊂ B(X, Y) una successione di Cauchy rispetto alla norma operatoriale. Da (2.15) segue che ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| , il fatto che {Tn } sia di Cauchy implica che sia di Cauchy la successione dei vettori Tn u. Essendo Y completo, per ogni fissato u ∈ X esister`a un vettore di Y: T u := lim Tn u . n→∞
2.3 Operatori, spazi di operatori, norme di operatori
41
X u → T u `e un operatore lineare essendo tali tutti gli operatori Tn . Mostriamo, per concludere, che T ∈ B(X, Y) e che ||T − Tn || → 0 per n → ∞. Essendo {Tn } una successione di Cauchy, se > 0, varr` a ||Tn − Tm || ≤ per n, m sufficientemente grandi e quindi anche ||Tn u − Tm u|| ≤ ||Tn − Tm ||||u|| ≤ ||u||. Allora: ||T u − Tm u|| = || lim Tn u − Tm u|| = lim ||Tn u − Tm u|| ≤ ||u|| n→+∞
n→+∞
se m `e grande a sufficienza. Dalla stima ottenuta, essendo ||T u|| ≤ ||T u − Tm u|| + ||Tm u|| ed usando (2.15), segue ancora che ||T u|| ≤ ( + ||Tm ||)||u|| . Ci`o dimostra che T `e limitato e quindi T ∈ B(X, Y) per il teorema 2.53. Valendo, come provato sopra, ||T u−Tmu|| ≤ ||u|| si ha anche che ||T −Tm || ≤ dove pu` o essere scelto arbitrariamente piccolo pur di scegliere m grande a sufficienza. In altre parole ||T − Tn || → 0 se n → ∞. La prova dei sottocasi (i) e (ii) `e immediata. (i) segue dal fatto che B(X) = B(X, X) e (ii) segue dal fatto che X := B(X, K) ed il campo di X, K = C o R `e completo come spazio normato. Come ultima nozione introduciamo quella di operatore coniugato o aggiunto in spazi normati. Si noti che esiste una nozione differente di operatore coniugato, specifica negli spazi di Hilbert e che vedremo nel prossimo capitolo. Consideriamo un operatore T ∈ B(X, Y), con X e Y spazi normati. Possiamo costruire un operatore che lavora tra gli spazi duali in verso opposto, T ∈ L(Y , X ), imponendo che: (T f)(x) = f(T (x)) per ogni x ∈ X, se f ∈ Y . Si osservi che la definizione `e ben posta e, per ogni f ∈ Y , la definizione individua una funzione T f : X → C che `e lineare per costruzione, coincidendo con la composizione delle funzioni lineari f e T . Ulteriormente la funzione T : Y f → T f ∈ X `e anch’essa lineare: (T (af + bf))(x) = (af + bg)(T (x)) = af(T (x)) + bg(T (x)) = a(T f)(x) + b(T g)(x)
per ogni x ∈ X .
Si osservi infine che T `e limitato, con ovvio significato delle norme: |(T f)(x)| = |f(T (x))| ≤ ||f||||T ||||x|| , di conseguenza:
||T f|| = sup |T f(x)| ≤ ||f||||T || , ||x||=1
e quindi, prendendo ancora l’estremo superiore del primo membro sulla classe degli f ∈ Y con ||f|| = 1: ||T || ≤ ||T || . (2.19) Nel seguito, dopo aver dimostrato il teorema di Hahn-Banach, mostreremo che, in realt` a ||T || = ||T || se X e Y sono spazi di Banach.
42
2 Spazi normati e spazi di Banach, esempi e applicazioni
Definizione 2.55. Siano X, Y spazi normati e T ∈ B(X, Y). L’operatore coniugato o aggiunto di T , nel senso degli spazi normati, `e l’operatore T ∈ B(Y , X) individuato dalla richiesta: (T f)(x) = f(T (x))
per ogni x ∈ X e T ∈ B(X, Y).
(2.20)
Osservazione 2.56. L’applicazione B(X, Y) T → T ∈ B(Y , X ) `e lineare come si prova immediatamente: (aT + bS) = aT + bS
per ogni a, b ∈ C e ogni T, S ∈ B(X, Y).
Prima di passare a dare qualche esempio di spazio duale topologico, enunciamo un risultato elementare, ma di grande importanza nelle applicazione, che riguarda l’unicit` a dell’estensione di operatori (e funzionali) limitati, inizialmente definiti su un sottospazio denso. Proposizione 2.57. (Sull’estensione di un operatore limitato.) Siano X, Y spazi normati con Y spazio di Banach. Se S ⊂ X `e un sottospazio denso in X e T : S → Y `e un operatore lineare limitato su S, allora vale quanto segue. ˜ S= T . (a) Esiste un unico operatore lineare limitato T˜ : X → Y tale che T ˜ (b) Vale ||T || = ||T ||. Dimostrazione. La dimostrazione `e data nella soluzione agli esercizi 2.14 e 2.15. Esempi 2.58. (1) Le misure complesse permettono di costruire tutti i funzionali lineari limitati su C0 (X), dove X `e uno spazio topologico di Hausdorff localmente compatto, pertanto richiamiamo brevemente la definizione e le principali propriet` a di tali misure. Una misura complessa su X [Rud82] `e un’applicazione μ : Σ → C, che associa un numero complesso ad ogni elemento di una σ-algebra Σ su X, in modo tale che: (i) μ(∅) = 0 e +∞ (ii) μ(∪n∈N En ) = n=0 μ(En ), indipendentemente dall’ordine di somma, per ogni classe {En }n∈N ⊂ Σ con En ∩ Em = ∅ se n = m. La richiesta (ii) `e equivalente a dire che la convergenza della serie deve valere in valore assoluto. Le misure con segno si intendono qui un sottocaso di quelle complesse. Si pu` o associare una misura positiva finita ad ogni misura complessa nel modo che segue. Se E ∈ Σ, diremo che {Ei }i∈I ⊂ Σ `e una partizione di E se: I `e finito o numerabile, ∪i∈I Ei = E e Ei ∩ Ej = ∅ per i = j. La misura positiva σ-additiva su Σ, |μ|, detta variazione totale di μ, `e definita come:
|μ|(E) := sup |μ(Ei )| {Ei }i∈I partizione di E per ogni E ∈ Σ.
i∈I
2.3 Operatori, spazi di operatori, norme di operatori
43
|μ| soddisfa ovviamente |μ|(E) ≥ |μ(E)| se E ∈ Σ. Inoltre si prova che |μ|(X) < +∞ [Rud82]. |μ| `e quindi una misura (positiva σ-additiva) finita su Σ per ogni misura complessa μ. Dal Teorema di Radon-Nikodym segue in particolare il seguente risultato [Rud82]. Teorema 2.59. (Di caratterizzazione delle misure complesse). Per ogni misura complessa μ sullo spazio misurabile X esiste, ed `e unica a meno di ridefinizione su insiemi di misura nulla, una funzione misurabile h:X→C con |h| = 1 su X, che sia in L1 (X, |μ|) e tale che μ(E) = E h d|μ|. Se f ∈ L1 (X, |μ|) si definisce pertanto: fdμ := fh d|μ| . X
X
Consideriamo X spazio topologico di Hausdorff localmente compatto dotato di una misura complessa μ, definita sulla σ-algebra di Borel di X. Sappiamo che l’algebra normata (Cc(X), || ||∞) ha come completamento nella norma dell’estremo superiore l’algebra di Banach (C0 (X), || ||∞ ) delle funzioni che si annullano all’infinito ((4) in esempi 2.39). Nelle ipotesi fatte definiamo ||μ|| := |μ|(X). Se verifica facilmente che || || definisce una norma sullo spazio delle misure di Borel complesse su X. Inoltre, `e chiaro che, se f ∈ C0 (X), |Λμf| ≤ ||μ||||f||∞ dove Λμ f := fdμ , X
e dove, al solito, ||f||∞ = supx∈X |f(x)|. Da tale fatto segue subito che ogni misura complessa di Borel μ definisce un elemento Λμ del duale (topologico) di C0 (X). Il teorema di Riesz per misure complesse [Rud82] prova che questo `e in realt`a il caso generale, precisando anche qualcosa in pi` u. Per enunciare il teorema di Riesz, ricordiamo che, se μ `e una misura di Borel positiva σ-additiva sullo spazio di Hausdorff localmente compatto X, μ `e detta regolare se, per ogni boreliano E, valgono le seguenti condizioni: (i) μ(E) = sup{μ(K) | K ⊂ E , K compatto}, (ii) μ(E) = inf{μ(V ) | V ⊃ E , V aperto}. Una misura di Borel complessa, μ, `e detta regolare se `e tale la misura di Borel positiva finita data dalla sua variazione totale |μ|. Teorema 2.60. (Di Riesz per misure complesse regolari). Sia X uno spazio topologico di Hausdorff localmente compatto. Se Λ : C0 (X) → C `e un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa regolare μΛ tale che, per ogni f ∈ C0 (X): Λ(f) = fdμΛ . X
Vale inoltre ||Λ|| = ||μΛ ||.
44
2 Spazi normati e spazi di Banach, esempi e applicazioni
Dato che ogni misura di Borel complessa regolare individua un funzionale limitato su C0 (X) tramite l’integrale rispetto alla misura considerata, il teorema ha il seguente importante corollario. Corollario 2.61. Se X `e uno spazio topologico di Hausdorff localmente compatto, il duale topologico C0 (X) dello spazio di Banach (C0 (X), || ||∞) si identifica con lo spazio vettoriale reale delle misure di Borel complesse μ regolari su X, dotato della norma ||μ|| := |μ|(X): l’applicazione che associa ad ogni misura complessa suddetta μ il funzionale Λμ : C0 (X) → R, con Λμ f := X fdμ, `e un isomorfismo di spazi normati. Si osservi anche che, essendo Cc (X) denso in C0 (X), un funzionale continuo sul primo spazio ne individua univocamente uno sul secondo, per cui il teorema caratterizza anche i funzionali continui rispetto alla norma dell’estremo superiore su Cc (X). Si osservi ancora che, se X `e tale che ogni aperto sia unione numerabile di compatti, la parola regolare si pu` o omettere nell’ipotesi del teorema 2.60 di Riesz. Risulta infatti che (teorema 2.18 in [Rud82]), se ν `e una misura di Borel positiva sullo spazio di Hausdorff localmente compatto X in cui ogni aperto `e unione numerabile di compatti3 e i compatti hanno misura finita (come nel caso in esame, essendo la misura |μ| finita), allora ν `e regolare. In particolare vale il seguente teorema. Teorema 2.62. (Di Riesz per misure complesse su Rn ). Se K ⊂ Rn oppure K ⊂ C `e un compatto (rispetto alla topologia standard di Rn oppure C) e Λ : C0 (K) → C `e un funzionale lineare continuo, allora esiste un’unica misura di Borel complessa μΛ su K (che risulta essere regolare) tale che, per ogni f ∈ C0 (K): Λ(f) =
fdμΛ . K
(2) Un’altra importante classe di spazi duali topologici di spazi di Banach `e quello degli spazi Lp in riferimento all’esempio (6) in esempi 2.39. Vale a tal proposito la seguente proposizione [Rud82]. Proposizione 2.63. Sia (X, Σ, μ) uno misurabile con misura positiva. Se 1 ≤ p < +∞ e 1/p+1/q = 1, il duale dello spazio di Banach Lp (X, μ) risulta essere Lq (X, μ), nel senso che l’applicazione lineare: Lq (X, μ) [g] → Λg dove Λg (f) := X fg dμ per ogni f ∈ Lp (X, μ) `e un isomorfismo di spazi normati da Lq (X, μ) a (Lp (X, μ)) . Nello stesso modo il duale di L1 (X, μ) si identifica con L∞ (X, μ), nel senso che l’applicazione lineare: L∞ (X, μ) [g] → Λg dove Λg (f) := X fg dμ per ogni f ∈ L1 (X, μ) `e un isomorfismo di spazi normati da L∞ (X, μ) a (L1 (X, μ)) .
3 Ci` o accade in Rn in cui gli aperti sono unione numerabile delle chiusure di palle aperte di raggio finito.
2.4 I teoremi fondamentali negli spazi di Banach
45
2.4 I teoremi fondamentali negli spazi di Banach In questa sezione dimostreremo i teoremi fondamentali della teoria degli spazi normati e di Banach nella versione pi` u elementare possibile e ne esaminiamo le pi` u importanti conseguenze generali. Discuteremo il teorema di Hahn-Banach, quello di Banach-Steinhaus e quello dell’applicazione aperta, studiandone anche qualche immediata conseguenza importante. Le applicazioni del secondo teorema, quello di Banach-Steinhaus, forniscono l’occasione per introdurre diverse topologie negli spazi di operatori. Tali topologie rivestono un ruolo importantissimo in Meccanica Quantistica quando lo spazio di Banach di partenza `e lo spazio di Hilbert della teoria, l’algebra di operatori limitati di interesse `e costituita da (alcune) osservabili della teoria, mentre le propriet`a elementari del sistema quantistico associate ai processi di misura sono una sottoclasse della classe degli operatori di proiezione ortogonale. Per passare con continuit`a dall’algebra delle osservabili a quella dei proiettori sono necessarie topologie pi` u deboli rispetto a quella standard. Questo genere di problematiche che discuteremo pi` u oltre hanno portato alla nozione di algebra (di operatori) di von Neumann. 2.4.1 Il teorema di Hahn-Banach e le sue conseguenze elementari Il primo teorema `e il famosissimo teorema di Hahn-Banach che si occupa del problema dell’estensione di un funzionale lineare continuo, da un sottospazio dello spazio ambiente, ad un funzionale continuo definito tutto lo spazio e che conservi la norma iniziale. Esistono in realt`a versioni molto pi` u elaborate e potenti di tale teorema che si possono trovare, per esempio, in [Rud91]. Noi ci limiteremo qui alla situazione pi` u elementare possibile. Per enunciare il teorema, notiamo che se X `e uno spazio normato e M ⊂ X un suo sottospazio (rispetto alla sola struttura di spazio vettoriale di X), la restrizione della norma di X a M definisce su M una struttura di spazio normato. In questo senso si pu`o parlare di operatori o funzionali definiti su M e continui (ossia limitati rispetto alla struttura di spazio normato indotta da quella di X). Teorema 2.64. (Di Hahn-Banach per spazi normati.) Sia M un sottospazio (non necessariamente chiuso) di uno spazio normato X con campo K = C o R. Se g : M → K `e un funzionale lineare continuo, esiste un funzionale lineare f : X → K continuo tale che f M = g e ||f||X = ||g||M. Dimostrazione. Seguiremo essenzialmente la dimostrazione in [Rud82]. Partiamo dal caso in cui K = R. Se g = 0, un’estensione che soddisfa la tesi `e f = 0. Supponiamo dunque che g = 0 e, senza perdere generalit` a, assumiamo anche che ||g|| = 1. Costruiamo l’estensione f come segue. Sia x0 ∈ X \ M e sia: M1 := {x + λx0 | x ∈ M , λ ∈ R} .
46
2 Spazi normati e spazi di Banach, esempi e applicazioni
Se, per ν ∈ R fissato, definiamo g1 : M1 → R come g1 (x + λx0 ) = g(x) + λν , o sempre scegliere ν in abbiamo un’estensione di g a M1 . Proviamo che si pu` modo tale che ||g1|| = 1. A tal fine `e sufficiente che ν sia scelto in modo che valga: |g(x) + λν| ≤ ||x + λx0 || ,
per ogni x ∈ M e λ ∈ R \ {0}.
(2.21)
Sostituiamo −λx a x e dividiamo i due membri di (2.21) per |λ|, ottenendo la condizione equivalente alla (2.21): |g(x) − ν| ≤ ||x − x0 || ,
per ogni x ∈ M.
(2.22)
Poniamo quindi: ax := g(x) − ||x − x0 || e
bx := g(x) + ||x − x0 ||.
(2.23)
La (2.22), e quindi ||g1|| = 1, vale se ν si fissa in modo tale da soddisfare ` sufficiente dunque provare che gli intervalli ax ≤ ν ≤ bx per ogni x ∈ M. E [ax, bx], con x ∈ M, hanno un punto in comune, cosa che `e equivalente a dimostrare che per ogni x, y ∈ M, vale: ax ≤ b y .
(2.24)
D’altra parte: g(x) − g(y) = g(x − y) ≤ ||x − y|| ≤ ||x − x0 || + ||y − x0 || e la (2.24) `e conseguenza della (2.23). Abbiamo ottenuto che si pu`o fissare ν in modo tale che ||g1 || = 1 come volevamo. Consideriamo ora la famiglia P di tutte le coppie (M , g ) tali che M ⊃ M sia un sottospazio di X e g : M → R sia lineare, estenda g e valga ||g || = 1. Sappiamo che P non `e vuoto dato che contiene almeno (M1 , g1). Possiamo ordinare parzialmente P (vedi l’Appendice A anche per il seguito) definendo (M , g ) ≤ (M , g ) quando M ⊃ M e g estende g e ||g || = ||g || = 1. Si dimostra facilmente che ogni sottoinsieme totalmente ordinato di P ammette un maggiorante in P. Il lemma di Zorn implica allora che esiste un elemento massimale in P che denoteremo con (M1 , f 1 ). Si osservi ora che deve essere necessariamente M1 = X, altrimenti esisterebbe x0 ∈ X\M1 e, con la procedura vista all’inizio, potremmo costruire un’estensione propria di f 1 al sottospazio generato da x0 e M1 che rispetti la richiesta sulla norma, in contraddizione con la massimalit`a di (M1 , f 1 ). Concludiamo che f := f 1 `e l’estensione cercata nella tesi. Passiamo infine al caso K = C. Premettiamo il seguente lemma.
2.4 I teoremi fondamentali negli spazi di Banach
47
Lemma 2.65. Sia Y uno spazio vettoriale complesso. Vale quanto segue. (a) Se u(x) = Reg(x) per ogni x ∈ Y con g : Y → C funzionale lineare complesso, allora la funzione u : Y → R `e un funzionale lineare reale su Y e: f(x) := u(x) − iu(ix)
per ogni x ∈ Y.
(2.25)
(b) Se u : Y → R `e un funzionale lineare reale su Y e se g `e definito da (2.25), allora g `e un funzionale lineare complesso su Y. (c) Se Y `e spazio normato e se g e u sono legati dalla (2.25), risulta ||g|| = ||u||. Dimostrazione. (a) e (b) si provano immediatamente per computo diretto. Riguardo a (c), osserviamo che, nelle ipotesi fatte: |u(x)| ≤ |g(x)| = |u(x)|2 + |u(ix)|2 e quindi ||u|| ≤ ||g||. D’altra parte, se x ∈ Y, esiste α ∈ C con |α| = 1, tale che αg(x) = |g(x)|. Di conseguenza: |g(x)| = g(αx) = u(αx) ≤ ||u|| ||αx|| = ||u|| ||x|| e dunque ||g|| ≤ ||u||. Torniamo alla dimostrazione principale. Se u : M → R `e la parte reale di g, deve essere g(x) = u(x) − iu(ix) e anche ||g|| = ||u|| dal lemma appena provato. Sappiamo, dal caso reale, che esiste un’estensione lineare U : X → R di u con ||U || = ||u|| = ||g||. Ma allora, se definiamo l’applicazione lineare f : X → C come: f(x) := U (x) − iU (ix) ,
per ogni x ∈ X,
abbiamo che f estende g a tutto X e soddisfa ||f|| = ||U || = ||g||.
Una delle pi` u utili conseguenze del teorema di Hahn-Banach `e il seguente corollario. Ricordiamo che, se X `e uno spazio normato, X indica il suo duale topologico B(X, C). Corollario 2.66. (Del Teorema di Hahn-Banach.) Sia X spazio normato e x0 ∈ X con x0 = 0. Esiste f ∈ X con ||f|| = 1 tale che f(x0 ) = ||x0||. Dimostrazione. Si scelga M := {λx0 | λ ∈ K} e g : λx0 → λ||x0 ||. Sia f ∈ X il funzionale limitato che estende g secondo il teorema di Hahn-Banach. Per costruzione f(x0 ) = g(x0 ) = ||x0|| e ||f||X = ||g||M = 1. Una conseguenza immediata di questo corollario `e la seguente proposizione sulla norma dell’operatore coniugato T ∈ B(Y , X ) di T ∈ B(X, Y) (vedi la definizione 2.55). Proposizione 2.67. Se T ∈ B(X, Y), dove X e Y sono spazi di Banach, allora: ||T || = ||T || . Dimostrazione. Dato che, nel caso generale di X, Y spazi normati, vale (vedi la (2.19)) ||T || ≥ ||T ||, dobbiamo solo provare ||T || ≤ ||T || se X e Y sono spazi
48
2 Spazi normati e spazi di Banach, esempi e applicazioni
x di Banach. Se x ∈ X e T x = 0, definiamo y0 := ||TT x|| ∈ Y. Evidentemente ||y0 || = 1. Per il corollario 2.66, esiste g ∈ Y tale che ||g|| = 1 e g(y0 ) = 1 e quindi g(T x) = ||T x||. Dato che:
||T x|| = g(T x) = |T (g(x))| ≤ ||T g|| ||x|| ≤ ||T || ||g|| ||x|| = ||T || ||x|| , abbiamo ottenuto: ||T || ≤ ||T || come volevamo.
Un altro risultato, che ha importanti conseguenze nella teoria delle algebre di Banach, `e il seguente. Corollario 2.68. (Del Teorema di Hahn-Banach.) Sia X = {0} spazio normato. Gli elementi di X sono separanti per X. Cio`e, se x1 = x2 sono punti di X allora esiste f ∈ X per cui f(x1 ) = f(x2 ). Dimostrazione. Basta scegliere nel corollario 2.66 x0 := x1 − x2 ottenendo f(x1 ) − f(x2 ) = f(x1 − x2 ) = ||x1 − x2 || = 0. Se x ∈ X e f ∈ X con ||f|| = 1, allora |f(x)| ≤ 1||x|| per cui sup{|f(x)| | f ∈ X , ||f|| = 1} ≤ ||x|| . Il corollario 2.66 consente di rafforzare il risultato provando immediatamente che sup{|f(x)| | f ∈ X , ||f|| = 1} = max{|f(x)| | f ∈ X , ||f|| = 1} = ||x|| . Questo fatto apparentemente non molto profondo ha invece una certa rilevanza in una questione importante che nasce nella teoria degli spazi normati infinito-dimensionali, quando la si confronta con quella nel caso finito dimensionale. ` noto, dalla teoria elementare degli spazi vettoriali, che lo spazio (X∗ )∗ , E duale algebrico del duale algebrico di uno spazio vettoriale X di dimensione finita, ha la notevole propriet` a di essere naturalmente isomorfo a X stesso. L’isomorfismo `e dato dalla applicazione lineare che associa ad x ∈ X il funzionale lineare su X∗, I(x), definito da (I(x))(f) := f(x) per ogni f ∈ X∗ . Nel caso infinito dimensionale I identifica X con un sottospazio di (X∗ )∗ , ma non, in generale con tutto (X∗ )∗ . C’`e qualche proposizione generale a riguardo che vale lavorando con spazi normati infinito dimensionali considerando per` o i duali in senso topologico? Si noti che (X ) `e il duale topologico di uno spazio normato (X , la cui norma `e quella operatoriale). Di conseguenza (X ) `e uno spazio normato a sua volta, la norma essendo ancora una volta quella operatoriale. Consideriamo ancora la trasformazione lineare naturale I : X → (X )∗ che associa a x ∈ X l’elemento I(x) ∈ (X )∗ , cio`e la funzione lineare I(x) : X → K, definita come (I(x))(f) := f(x) per ogni f ∈ X e x ∈ X .
2.4 I teoremi fondamentali negli spazi di Banach
49
` chiaro per costruzione che I(x) `e un funzionale lineare su X per cui (E effettivamente I(x) ∈ (X )∗ ). Il fatto che sup{|f(x)| | f ∈ X , ||f|| = 1} = ||x|| ha due implicazioni immediate: (1) I(x) `e un funzionale limitato, per cui appartiene a (X ) e (2) ||I(x)|| = ||x||. Per cui la trasformazione lineare I : X → (X ) `e un’isometria e quindi in particolare `e iniettiva. In definitiva si ha l’inclusione isometrica X ⊂ (X ) data dall’isometria I : X → (X ) . Abbiamo provato il seguente corollario. Corollario 2.69. (Del Teorema di Hahn-Banach.) Sia X spazio normato. La trasformazione lineare I : X → (X ) definita da: (I(x))(f) := f(x)
per ogni x ∈ X e f ∈ X ,
(2.26)
`e un’isometria. In tal modo X si identifica isometricamente con un sottospazio di (X ) . Si possono trovare esempi, nel caso infinito dimensionale, in cui X non ricopre tutto (X ) . Ci` o porta a dare la seguente definizione. Definizione 2.70. Uno spazio normato X `e detto riflessivo se l’isometria (2.26) `e suriettiva (cio`e `e un isomorfismo di spazi normati). In altre parole X `e riflessivo quando X e (X ) sono isometricamente isomorfi tramite l’isomorfismo naturale I. Vedremo nel capitolo 3 che, se X `e uno spazio di Hilbert, la riflessivit` a `e assicurata. Esempio 2.71. Gli spazi di Banach Lp (X, μ) introdotti negli esempi 2.39 sono riflessivi se 1 < p < ∞. La dimostrazione `e immediata: dato che Lp (X, μ) = Lq (X, μ) con 1/p + 1/q = 1, scambiando q con p si trova: Lq (X, μ) = Lp (X, μ). Mettendo tutto insieme: (Lp (X, μ) ) = Lp (X, μ). 2.4.2 Il teorema di Banach-Steinhaus o principio della limitatezza uniforme Passiamo al teorema di Banach-Steinhaus nella formulazione pi` u elementare ed alle sue conseguenze immediate. Tale teorema `e noto anche come principio della limitatezza uniforme. Il motivo `e chiaro direttamente dall’enunciato del teorema che mostra che, rimarcabilmente, l’equilimitatezza puntuale implichi la limitatezza uniforme per una famiglia di operatori definiti su uno spazio di Banach. Teorema 2.72. (Di Banach-Steinhaus.) Siano X spazio di Banach e Y spazio normato. Se {Tα }α∈A ⊂ B(X, Y) `e una famiglia di operatori che soddisfa: sup ||Tα x|| < +∞ per ogni x ∈ X , α∈A
50
2 Spazi normati e spazi di Banach, esempi e applicazioni
allora esiste K ≥ 0 che limita uniformemente la famiglia di operatori: ||Tα || ≤ K per ogni α ∈ A . Dimostrazione. La dimostrazione si ottiene provando che esiste una palla aperta Bρ (z) ⊂ X per cui esiste M ≥ 0 con ||Tα (x)|| ≤ M per ogni α ∈ A e ogni x ∈ Bρ (z). Infatti, essendo x = (x + z) − z, si avrebbe: ||Tα(x)|| ≤ ||Tα (x + z)|| + ||Tα(z)|| ≤ 2M ,
per ogni α ∈ A e ogni x ∈ Bρ (0) ,
e quindi: ||Tα || ≤ 2M/ρ per ogni α ∈ A, dimostrando la tesi. Proviamo, per assurdo, che Bρ (z) suddetta esiste davvero. Assumiamo che non esista alcuna Bρ (z) con le propriet` a suddette. Allora, per una palla aperta Br0 (x0 ) fissata arbitrariamente, deve esistere x1 ∈ Br0 (x0 ) per cui ||Tα1 (x1 )|| > 1, per qualche α1 ∈ A. Dato che Tα1 `e continuo, possiamo trovare una seconda palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ Br0 (x0 ) e con 0 < r1 < r0 tale che ||Tα1 (x)|| ≥ 1 se x ∈ Bα1 (x1 ). Questa procedura pu` o essere iterata all’infinito in modo da ottenere una successione di palle aperte in X, {Brk (xk )}k∈N, che soddisfano: (i) Brk (xk ) ⊃ Brk+1 (xk+1 ), (ii) rk → 0 per k → +∞, (iii) per ogni k ∈ N c’`e un αk ∈ A tale che ||Tαk (x)|| ≥ k se x ∈ Brk (xk ). Si verifica subito, che (i) e (ii) implicano che la successione {xk }k∈N deve essere di Cauchy. Per la completezza di X, esiste y ∈ ∩k∈N Brk (xk ); d’altra parte, la condizione (iii) implica che ||Tαk (y)|| ≥ k per ogni k ∈ N contraddicendo l’ipotesi che, per ogni x ∈ X, vale supn∈N ||Tα x|| < +∞. Abbiamo ottenuto un assurdo che conclude la dimostrazione. Un immediato ed utile corollario del teorema di Banach-Steinhaus `e il seguente. Corollario 2.73. (Del Teorema di Banach-Steinhaus.) Nelle stesse ipotesi del teorema di Banach-Steinhaus la famiglia di operatori {Tα }α∈A `e equicontinua: per ogni > 0 esiste δ > 0 tale che, se x, x ∈ X e ||x − x || < δ, allora ||Tα x − Tα x || < per ogni α ∈ A. Dimostrazione. Nel seguito Cγ := {x ∈ X | ||x|| ≤ γ} per ogni γ > 0. Fissiamo > 0, dobbiamo trovare il δ > 0 che soddisfa la propriet` a scritta nella tesi. Per il teorema di Banach-Steinhaus ed usando la proposizione 2.52, ||Tαx|| ≤ K < +∞ per ogni α ∈ A e x ∈ C1 . Se K = 0 non c’`e nulla da provare, assumiamo pertanto K > 0. Scegliamo δ > 0 per cui Cδ ⊂ C/K . Con le scelte fatte, se ||x − x || < δ, vale K(x − x )/ ∈ CKδ/ ⊂ C1 e quindi:
K(x − x )
Tα ||Tα x − Tα x || = ||Tα (x − x )|| =
< K K = K
per ogni α ∈ A.
2.4 I teoremi fondamentali negli spazi di Banach
51
Abbiamo infine il seguente ulteriore corollario che riguarda lo spazio duale topologico X . Corollario 2.74. (Del Teorema di Banach-Steinhaus.) Sia X uno spazio normato sul campo C o R. Se S ⊂ X `e debolmente limitato, cio`e: per ogni f ∈ X esiste cf ≥ 0 tale che |f(x)| ≤ cf per ogni x ∈ S allora S `e limitato rispetto alla norma di X. Dimostrazione. Consideriamo gli elementi x ∈ S ⊂ X come funzionali del duale di X , (X ) facendo uso della trasformazione isometrica I : X → (X ) definita nel corollario 2.69 del teorema di Hahn-Banach. La famiglia di funzionali su X , S ⊂ (X ) `e limitata su ogni f ∈ X per ipotesi essendo (scriviamo x in luogo di I(x)) |x(f)| = |f(x)| ≤ cf . Dato che X `e completo possiamo applicare il teorema di Banach-Steinhaus, concludendo che sup{|x(f)| | ||f|| = 1} ≤ K < +∞ per ogni x ∈ S ossia (essendo I un’isometria) ||x|| ≤ K < +∞ per ogni x ∈ S. 2.4.3 Topologie deboli. Completezza ∗-debole di X Per introdurre l’ultimo corollario del teorema di Banach-Steinhaus dobbiamo introdurre qualche nuova nozione topologica generale e poi applicarla, in particolare, agli spazi di operatori gi` a incontrati. Ci`o permetter`a di introdurre alcune nozioni, estremamente utili nelle applicazioni, sui tipi di convergenze di successioni di operatori. Per prima cosa riconsideriamo la nozione di palla aperta, ma questa volta consideriamo anche il caso in cui tali palle siano definite in termini di seminorme e non solo di norme. Notazione 2.75. Se δ > 0 e p `e una seminorma sullo spazio vettoriale X, sul campo K = C o R, e x ∈ X, indicheremo con Bp,δ (x) la palla aperta associata alla seminorma p, centrata sul vettore x e di raggio δ: Bp,δ (x) := {z ∈ X | p(z − x) < δ} . Nel caso in cui x = 0 scriveremo semplicemente Bp,δ in luogo di Bp,δ (0). Se A ⊂ X, B ⊂ X, x ∈ X e α, β ∈ K, nel seguito useremo anche le notazioni: x + βA := {x + βu | u ∈ A} e αA + βB := {αu + βv | u ∈ A , v ∈ B} .
Si prova subito che le palle Bp,δ con δ > 0 sono: (i) insiemi convessi, cio`e se x, y ∈ Bp,δ allora (1 − λ)x + λy ∈ Bp,δ per λ ∈ [0, 1], (ii) insiemi bilanciati (detti anche equilibrati), cio`e λx ∈ Bp,δ se x ∈ Bp,δ e 0 ≤ λ ≤ 1,
52
2 Spazi normati e spazi di Banach, esempi e applicazioni
(iii) insiemi assorbenti, cio`e ogni x ∈ X soddisfa λ−1 x ∈ Bp,δ per qualche λ > 0. Queste propriet` a sono evidentemente invarianti per intersezione, per cui anche insiemi ottenuti intersecando palle centrate nell’origine, ma ottenute da seminorme differenti, godono di tali propriet` a. Definizione 2.76. Se P := {pi }i∈I `e una famiglia di seminorme sullo spazio vettoriale X sul campo K = C o R, la topologia su X generata o indotta da P, T (P), `e l’unica che ammette come base (definizione 2.1) la classe degli insiemi: x + Bpi1 ,δ1 ∩ · · · ∩ Bpin ,δn (2.27) per ogni scelta dei centri x ∈ X, di n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei numeri δ1 > 0, . . . δn > 0. La coppia (X, P), dove X `e contemporaneamente uno spazio vettoriale ed uno spazio topologico dotato della topologia indotta dalla classe di seminorme P, `e detta spazio vettoriale (topologico) localmente convesso. In altri termini, la topologia T (P) `e quella per cui gli insiemi aperti sono ∅ e tutte le possibili le unioni di insiemi (2.27), per ogni scelta dei centri x ∈ X, dei numeri n = 1, 2, . . ., degli indici i1 , . . . , in ∈ I e dei raggi δ1 > 0, . . . δn > 0. ` chiaro che se la classe P si riduce ad un unico elemento Osservazione 2.77. E dato da una norma, la topologia indotta da P `e la solita topologia indotta da una norma studiata all’inizio del capitolo. Nel caso in cui tale unico elemento sia una seminorma, si ha ancora una topologia simile a quella indotta da una norma, ma con l’importante differenza che non `e garantita la validit` a della propriet` a di Hausdorff. Dato che le operazioni di somma di vettori e prodotto di vettore e scalare sono continue rispetto a ciascuna seminorma (la dimostrazione `e la stessa che abbiamo dato nel caso di una norma), segue subito che tali operazioni sono continue anche rispetto alla topologia generata da una famiglia P di seminorme nel senso detto sopra. In altre parole, la struttura di spazio vettoriale `e compatibile con la topologia generata da P. Uno spazio vettoriale dotato di topologia compatibile con la struttura di spazio vettoriale `e detto spazio vettoriale topologico. Uno spazio localmente convesso `e quindi uno spazio vettoriale topologico. Tenendo conto della definizione 2.6 si prova facilmente che vale la seguente proposizione. Proposizione 2.78. Una successione {xn }n∈N ⊂ X converge a x0 ∈ X nella topologia T (P) se e solo se, per ogni pi ∈ P, pi (xn ) → pi (x0 ) quando n → +∞. Il primo esempio di topologia indotta da seminorme `e quella che si costruisce su uno spazio normato X, usando il suo duale X .
2.4 I teoremi fondamentali negli spazi di Banach
53
Definizione 2.79. Se X `e uno spazio normato, la topologia debole su X `e quella indotta dalla classe di seminorme pf su X, definite come, per ogni f ∈ X : pf (x) := |f(x)| se x ∈ X. Se consideriamo coppie di spazi normati e gli insiemi di operatori costruiti su tali spazi, con la nozione di topologia indotta da una classe di seminorme, si possono definire alcune topologie “standard” sugli spazi vettoriali: L(X, Y), B(X, Y) e sul duale X , rendendoli spazi vettoriali topologici localmente convessi. Una di queste topologie (e la corrispondente sul duale) la conosciamo gi`a perch´e `e quella indotta dalla norma operatoriale. Definizione 2.80. Siano X, Y spazi normati sullo stesso campo K = C o R. (a) Si definiscono su L(X, Y) e B(X, Y) le seguenti topologie operatoriali. (i) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme px,f , definite come, per fissati x ∈ X e f ∈ Y : px,f (T ) := |f(T (x))|
se T ∈ L(X, Y) (rispettivamente B(X, Y),
che `e detta topologia debole su L(X, Y) (rispettivamente B(X, Y)); (ii) La topologia indotta su L(X, Y) (ovvero B(X, Y)) dalla classe di tutte le seminorme px , definite come, per ogni fissato x ∈ X: px (T ) := ||T (x)||Y
se T ∈ L(X, Y) (rispettivamente B(X, Y)),
che `e detta topologia forte su L(X, Y) (rispettivamente B(X, Y)); (iii) La topologia indotta su B(X, Y) dalla norma operatoriale (2.14) `e detta topologia uniforme su B(X, Y). (b) Se Y = K – e quindi stiamo considerando possibili topologie su X – la topologia uniforme definita in (iii) prende il nome di topologia (duale) forte di X e le topologie debole e forte definite in (i) e (ii), che risultano coincidere, prendono il nome di topologia ∗ -debole di X . La topologia topologia ∗ -debole su X `e dunque indotta dalla classe di tutte le seminorme p∗x , definite come, per ogni fissato x ∈ X: p∗x(f) := |f(x)|
se f ∈ X .
Osservazioni 2.81. (1) Si prova facilmente che, su uno spazio normato, gli aperti della topologia debole sono aperti anche nella topologia standard, ma non vale il viceversa. Similmente, in L(X, Y), gli aperti della topologia debole sono aperti anche nella topologia forte ma non vale il viceversa. Questo fatto si enuncia, sinteticamente, dicendo che: la topologia standard su X e forte su L(X, Y) sono, sui rispettivi spazi, pi` u fini (o pi` u forti) delle corrispondenti deboli sui rispettivi spazi X e L(X, Y). Nello stesso modo, riferendosi agli spazi di operatori, si prova facilmente che: la topologia uniforme `e pi` u fine (o pi` u forte) della topologia forte.
54
2 Spazi normati e spazi di Banach, esempi e applicazioni
Per gli spazi duali vale ovviamente l’analoga propriet` a: la topologia forte `e pi` u fine (cio`e pi` u forte) della topologia ∗ -debole. (2) Dalla proposizione 2.78 si ha subito che valgono le seguenti proposizioni. Proposizione 2.82. Sia {xn }n∈N ⊂ X con X spazio normato. Vale xn → x ∈ X, per n → +∞, nella topologia debole, se e solo se: f(xn ) → f(x) ,
per n → +∞, per ogni scelta di f ∈ X .
Proposizione 2.83. Se {Tn }n∈N ⊂ L(X, Y) (o B(X, Y)) e T ∈ L(X, Y) (risp. B(X, Y)), vale Tn → T , per n → +∞, nella topologia debole, se e solo se: f(Tn (x)) → f(T (x)) ,
per n → +∞, per ogni scelta di x ∈ X e f ∈ Y .
Proposizione 2.84. Tn → T per n → +∞, nella topologia forte se e solo se: ||Tn (x) − T (x)||Y → 0 ,
per n → +∞, per ogni scelta di x ∈ X.
` chiaro allora che: E (a) La convergenza di una successione di vettori di uno spazio normato X in senso standard (cio`e rispetto alla topologia indotta dalla norma) implica la convergenza della stessa successione in senso debole (cio`e rispetto alla topologia debole). (b) La convergenza di una successione di operatori di B(X, Y) in senso uniforme (cio`e rispetto alla topologia uniforme) implica la convergenza della stessa successione in senso forte (cio`e rispetto alla topologia forte). (c) La convergenza di una successione di operatori di L(X, , Y) o B(X, Y) in senso forte implica la convergenza della stessa successione in senso debole (cio`e rispetto alla topologia debole). (3) Dalla proposizione 2.78 segue ancora che: Proposizione 2.85. Data una successione di funzionali {fn }n∈N ⊂ X e un funzionale f ∈ X , vale fn → f, per n → +∞, nella topologia ∗ -debole se e solo se: fn (x) → f(x) ,
per n → +∞ per ogni scelta di x ∈ X.
` chiaro allora che: la convergenza di una successione di funzionali di X E in senso forte (cio`e rispetto alla topologia duale forte) implica la convergenza della stessa successione in senso ∗ -debole (cio`e rispetto alla topologia ∗ -debole). (4) Su X `e possibile definire un’ulteriore topologia debole, ottenuta pensando X come spazio sul quale agisce (X ) . In tal caso le seminorme che inducono la topologia sono definite come: ps (f) := |s(f)|
2.4 I teoremi fondamentali negli spazi di Banach
55
per ogni s ∈ (X ) . Se X non `e riflessivo, questa topologia debole non coincide in generale con la topologia ∗-debole vista sopra, dato che X si identifica solo con un sottospazio proprio di (X ) e pertanto le seminorme della topologia ∗-debole sono meno di quelle della topologia debole. La topologia topologia debole `e pi` u fine di quella ∗-debole: in altre parole, un aperto per la topologia debole `e anche aperto per la topologia ∗-debole ma non `e detto che valga il viceversa. Similmente, la convergenza di successioni in X nella topologia debole implica quella nella topologia ∗-debole, ma non vale il viceversa. Notazione 2.86. Per denotare i limiti rispetto alle topologie forti e deboli negli spazi di operatori solitamente si usano le seguenti convenzioni notazionali, che adotteremo anche in questo testo. T = s- lim Tn significa che T `e il limite nella topologia forte della successione di operatori {Tn }n∈N . La stessa notazione si usa nel caso in cui gli operatori coinvolti siano funzionali e la topologia `e quella duale forte. T = w- lim Tn significa che T `e il limite nella topologia debole della successione di operatori {Tn }n∈N . f = w ∗ - lim fn significa che f `e il limite nella topologia ∗ -debole della successione {fn }n∈N . Le nozioni topologiche acquisite permettono di provare l’ultimo rilevante corollario del teorema di Banach-Steinhaus. Sappiamo gi` a che, se X `e uno spazio normato, allora X `e completo rispetto alla topologia duale forte come provato in (ii) di (c) del teorema 2.54. Si pu` o provare che la completezza, nel senso che segue, sussiste anche rispetto alla topologia ∗ -debole purch´e X sia spazio di Banach. Corollario 2.87. (Del Teorema di Banach-Steinhaus.) Se X `e spazio di Banach su K = C o R, allora X `e completo rispetto alla topologia ∗-debole nel senso che segue. Se {fn }n∈N ⊂ X `e tale che, per ogni x ∈ X, {fn (x)}n∈N `e una successione di Cauchy, allora esiste f ∈ X tale che f = w ∗ -limfn . Dimostrazione. Il campo di X `e completo per ipotesi, di conseguenza, per ` immediato verificare ogni x ∈ X esister`a f(x) ∈ K con fn (x) → f(x). E che f : X x → f(x) definisce un funzionale lineare. Per concludere la dimostrazione proviamo che f `e continuo. Per ogni x ∈ X, fn (x) `e limitata (perch´e di Cauchy) per cui, dal teorema di B-S, |fn (x)| ≤ K < +∞ per ogni x ∈ X con ||x|| ≤ 1. Facendo il limite a n → +∞ segue che |f(x)| ≤ K se ||x|| ≤ 1 da cui ||f|| ≤ K < +∞ e pertanto, dal teorema 2.53, f `e continuo.
56
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.4.4 Breve digressione: spazi metrici, spazi localmente convessi metrizzabili e spazi di Fr´ echet Facciamo qui una brevissima digressione su alcune importanti propriet` a degli spazi localmente convessi in relazione al problema della metrizzabilit`a. Ricordiamo la seguente nozione che dovrebbe essere nota dai corsi elementari. Definizione 2.88. Uno spazio metrico `e un insieme M dotato di una funzione, detta distanza o metrica, d : M × M → R soddisfacente: D1. d(x, y) = d(y, x), D2. d(x, y) ≥ 0, dove = vale se solo se x = y, D3. d(x, z) ≤ d(x, y) + d(y, x) per x, y, z ∈ M. Osservazioni 2.89. (1) La propriet` a D1 `e nota come simmetria, la propriet` a D2 `e nota come positivit` a e propriet` a D3 `e nota come (propriet` a della) disuguaglianza triangolare. (2) Ogni spazio normato (X, || ||) (e quindi in particolare Rn e Cn ) ammette una naturale struttura di spazio metrico (X, d) definendo d(x, x) := ||x − x || se x, x ∈ X. In questo caso, evidentemente, vale: d(x + z, y + z) = d(x, y) comunque si scelgano x, y, z ∈ X,
in questo senso, la distanza d `e invariante per traslazioni.
Nel caso generale, la struttura di spazio metrico `e molto pi` u semplice di quella di spazio normato, dato che la struttura di spazio vettoriale `e del tutto assente negli spazi metrici. Abbiamo comunque la seguente definizione, del tutto analoga a quella per gli spazi normati. Definizione 2.90. In uno spazio metrico (M, d), una palla metrica aperte con centro x e raggio r > 0 `e l’insieme: Bδ (x) := {y ∈ M | d(x, y) < δ} .
(2.28)
Similmente agli spazi normati, gli spazi metrici hanno una topologia naturale in cui gli aperti sono, oltre all’insieme vuoto ∅, le unioni di palle metriche aperte con centri e raggi arbitrari. Definizione 2.91. Si consideri uno spazio metrico (M, d). (a) A ⊂ M `e aperto se A = ∅ oppure A `e unione di palle aperte. (b) La topologia naturale di M `e la famiglia degli insiemi aperti di X. Osservazioni 2.92. (1) Come per gli spazi normati risulta immediatamente, verificando gli assiomi corrispondenti, che la topologia naturale `e una topologia nel senso generale e che le palle metriche aperte sono una base di essa. Inoltre la topologia naturale degli spazi metrici `e banalmente di Hausdorff come nel caso degli spazi normati.
2.4 I teoremi fondamentali negli spazi di Banach
57
(2) Se uno spazio metrico (X, d) `e separabile, cio`e esiste S ⊂ X denso e numerabile, allora `e uno spazio topologico a base numerabile: ammette una base topologica B numerabile. B `e la famiglia delle palle aperte, centrate nei punti di S, di raggio razionale. Si pu` o provare che vale anche il viceversa: uno spazio metrico `e a base numerabile se e solo se `e separabile [KoFo80]. (3) Si noti che, per uno spazio normato (X, || ||), le palle aperte costruite con la norma || || coincidono con le palle aperte costruite con la metrica d(x, x) := ||x − x ||. Pertanto le due topologie su X, pensato come spazio normato oppure come spazio metrico, coincidono. Esattamente come negli spazi normati, negli spazi metrici, la definizione 2.9 di funzione continua pu` o essere equivalentemente enunciata come segue. Definizione 2.93. Un’applicazione f : M → N, con (M, dM) e (N, dN ) spazi metrici, `e detta continua in x0 ∈ M se, per ogni > 0 esiste un corrispondente δ > 0 tale che dN(f(x), f(x0 )) < se dM (x, x0) < δ. Una funzione f : M → N `e detta essere continua se `e continua in ogni punto di M. Esattamente come per gli spazi normati, la nozione di successione convergente (definizione 2.6) si specializza nel modo seguente negli spazi metrici. Definizione 2.94. Se (M, d) `e uno spazio metrico, una successione {xn }n∈N ⊂ M `e detta convergere ad un vettore x ∈ M, detto il limite della successione, e si scrive: xn → x
per
n → +∞
e anche
lim xn = x ,
n→+∞
se e solo se, per ogni > 0 esiste N ∈ R tale che d(xn , x) < se n > N , altrimenti scritto come: lim d(xn , x) = 0 . n→+∞
Come nel caso degli spazi normati, risulta che le successioni convergenti rispetto alla topologia naturale di uno spazio metrico sono successioni di Cauchy (vedi sotto), ma non vale il viceversa nel caso generale. Vale la seguente definizione. Definizione 2.95. Sia (M, d) spazio metrico. (a) Una successione {xn }n∈N ⊂ M `e detta di Cauchy se: per ogni > 0 esiste N ∈ R tale che d(xn , xm) < se n, m > N . (a) (M, d) `e detto essere completo se ogni successione di Cauchy converge a qualche punto dello spazio. Una questione tecnicamente importante `e quella di capire se uno spazio topologico, in particolare uno spazio vettoriale topologico localmente convesso, ammetta una funzione distanza (che in generale non esiste, se la topologia `e indotta da seminorme), la cui topologia metrica coincida con quella preesistente dello spazio topologico. Quando questo accade, lo spazio topologico di partenza `e detto essere metrizzabile.
58
2 Spazi normati e spazi di Banach, esempi e applicazioni
Consideriamo uno spazio vettoriale localmente convesso X. Nel caso generale, la topologia indotta da una seminorma o da una classe di seminorme P = {pi }i∈I su X non sar` a di Hausdorff. Si vede facilmente che la propriet`a di Hausdorff vale se e solo se ∩i∈I p−1 i (0) = 0, il secondo 0 essendo il vettore nullo di X. In particolare ci` o accade se almeno una delle pi `e una norma. Tornando agli spazi vettoriali topologici, si prova che ogni spazio vettoriale localmente convesso (X, P) che soddisfi entrambe le richieste: (a) P = {pn }n=1,2,... cio`e P `e numerabile, (b) ∩n=1,2,...p−1 n (0) = 0 `e, non solo di Hausdorff, ma `e addirittura metrizzabile: la topologia associata alle seminorme coincide con la topologia naturale dello spazio metrico (X, d), precisando in modo opportuno la distanza d : X × X → R+ . In particolare, tale distanza pu` o essere sempre scelta (risultando in tal modo invariante per traslazioni) come: +∞ 1 pn (x − y) d(x, y) := . 2n 1 + pn (x − y) n=1 Si osservi che, in generale, questa non `e l’unica distanza possibile che riproduca la topologia di X indotta dalle sue seminorme. Per esempio moltiplicando d per un fissato numero positivo, la nuova distanza riproduce la stessa topologia della vecchia. Uno spazio di Fr´ echet `e uno spazio X localmente convesso la cui topologia `e di Hausdorff, `e indotta da una classe finita o numerabile di seminorme, e, come spazio metrico, (X, d) `e completo. Si prova che una successione {xn }n∈N ⊂ X `e di Cauchy rispetto ad una distanza d di uno spazio localmente convesso metrizzabile X, se e solo se `e di Cauchy rispetto ad ogni seminorma (p) p della classe generante la topologia: per ogni > 0 esiste N ∈ R tale che (p) p(xn − xm ) < se n, m > N . Di conseguenza la propriet` a di completezza non dipende, in realt` a, dalla distanza usata per generare la topologia dello spazio localmente convesso. Gli spazi di Fr´echet, di cui non ci occuperemo in questo libro, sono di fondamentale importanza nella fisica teorica e matematica per quanto concerne le teorie quantistiche dei campi. Ovviamente ogni spazio di Banach `e un caso elementare di spazio di Fr´echet. Esempio 2.96. Un esempio importante di spazio di Fr´echet `e dato dallo spazio di Schwartz. Per definirlo introduciamo le seguenti notazioni, che useremo anche alla fine del capitolo 3. I punti di Rn saranno indicati con singole lettere e le componenti con la stessa lettera ed un indice basso, in tal modo x = (x1 , . . . , xn ). Diremo multindice ogni n-pla, α = (α 1n, . . . , αn ) con αi = 0, 1, 2, . . . e indicheremo con |α| la somma |α| := i=1 αi . Useremo infine le seguenti notazioni: ∂ |α| ∂xα := . α1 n ∂x1 · · · ∂xα n
2.4 I teoremi fondamentali negli spazi di Banach
59
Lo spazio di Schwartz S(Rn ), come spazio vettoriale complesso `e il sottospazio di C ∞ (Rn ) (lo spazio vettoriale complesso delle funzioni su Rn , infinitamente differenziabili, a valori complessi) delle funzioni f che si annullano all’infinito, con tutte le derivate, pi` u velocemente di qualsiasi potenza inversa n 2: di |x| := x i=1 i pN (f) := sup sup (1 + |x|2)N |(∂xα f)(x)| < +∞ per ogni N = 0, 1, 2, . . . |α|≤N x∈Rn
Le funzioni definite sopra pN : S(Rn ) → R+ sono seminorme, che soddisfano evidentemente la richiesta ∩N∈N p−1 e una norma. N (0) = 0, dato che p0 = || ||∞ ` In questo modo S(Rn ), dotato della topologia indotta dalla famiglia di norme {pN }N∈N , acquista la struttura di spazio localmente convesso. Si dimostra facilmente che S(Rn ) `e uno spazio di Fr´echet [Rud91]. Gli elementi del duale topologico S(R) di S(R), cio`e i funzionali lineari da S(Rn ) in C che sono continui rispetto alla topologia generata dalla classe di seminorme {pN }N∈N , sono le famose distribuzioni di Schwartz. 2.4.5 Il teorema dell’applicazione aperta e dell’operatore inverso continuo dal teorema di Baire Concludiamo la sezione con l’ultimo importante teorema generale, quello dell’applicazione aperta, che avr` a come conseguenza il teorema dell’operatore inverso continuo. Per provare tali teoremi vogliamo introdurre il minimo indispensabile della teoria degli spazi di Baire. Ricordiamo alcune definizioni di topologia generale. Definizione 2.97. Sia (X, T ) uno spazio topologico e S ⊂ X. (a) L’interno, Int(S), di S `e l’insieme: Int(S) := {x ∈ X | ∃A ⊂ X , A aperto e x ∈ A ⊂ S} . (b) S si dice ovunque non denso (nowhere dense) se Int(S) = ∅. (c) S `e detto insieme di prima categoria o anche insieme magro (meager set), se `e l’unione di una classe numerabile di insiemi ovunque non densi. (d) S `e detto insieme di seconda categoria o anche insieme non magro se non `e di prima categoria. Si provano immediatamente i seguenti risultati. (1) L’unione numerabile di insiemi di prima categoria `e ancora di prima categoria. (2) Se h : X → X `e un omeomorfismo di spazi topologici, allora S ⊂ X `e di prima (seconda) categoria se e solo se h(S) `e di prima (risp. seconda) categoria. (3) Se A ⊂ B ⊂ X e B `e di prima categoria nello spazio topologico X, allora A `e di prima categoria. (4) Se B ⊂ X `e un insieme chiuso dello spazio topologico X e Int(B) = ∅, allora B `e di prima categoria in X.
60
2 Spazi normati e spazi di Banach, esempi e applicazioni
Vale infine l’importante teorema di Baire (si tenga conto delle definizioni 2.88 e 2.95). Teorema 2.98. (Di Baire.) Sia (X, d) uno spazio metrico completo, valgono i fatti seguenti. (a) Se {Un }n∈N `e una famiglia numerabile di aperti di X, ciascuno denso in X, allora anche ∩n∈NUn `e un insieme denso in X. (b) X `e di seconda categoria. Dimostrazione. (a) Sia A ⊂ X un insieme aperto. Se fosse U0 ∩ A = ∅, avremmo che z ∈ A ammette un intorno aperto di che non interseca U0 che, di conseguenza, non potrebbe essere denso in X. Quindi U0 ∩ A `e un aperto (in quanto intersezione di aperti) non vuoto. Esiste allora una palla metrica aperta Br0 (x0 ) di raggio r0 > 0 (2.28) e centro x0 ∈ X (vedi la 2.28) tale che Br0 (x0 ) ⊂ U0 ∩ A. Possiamo ripetere la procedura usando Br0 (x0 ) al posto di A, U1 al posto di U0 , e trovando una nuova palla aperta Br1 (x1 ) con Br1 (x1 ) ⊂ U1 ∩ Br0 (x0 ). Iterando la procedura, troviamo una classe numerabile di palle aperte Brn (xn ) con 0 < rn < 1/n, tali che Brn (xn ) ⊂ Un ∩ Brn−1 (xn−1 ). Dato che xn ∈ Brm (xm ) quando m ≥ n, la successione {xn }n∈N deve essere di Cauchy. Essendo X completo, xn → x ∈ X se n → +∞. Per costruzione, per ogni n ∈ N, x ∈ Brn−1 (xn−1 ) ⊂ Brn (xn ) ⊂ · · · ⊂ U0 ∩ A ⊂ A. Concludiamo che x ∈ A ∩ Un per ogni n ∈ N e pertanto (∩n∈NUn ) ∩ A = ∅ per ogni sottoinsieme aperto A ⊂ X. Di conseguenza ∩n∈N Un `e denso in X, dato che interseca ogni intorno aperto di ogni elemento di X. (b) Supponiamo ora che {Ek }k∈N sia una collezione numerabile di insiemi Ek ⊂ X ovunque non densi. Se Vk `e il complemento di Ek , per ogni k ∈ N, Vk deve essere aperto (perch´e complemento di un chiuso) e denso in X (perch´e `e aperto e l’interno del suo complemento `e vuoto). La prima parte del teorema dimostra che ∩k∈N Vn = ∅ e quindi, prendendo il complemento X = ∪k∈NEk ed, a maggior ragione, X = ∪k∈N Ek . Per cui X non `e di prima categoria ed `e dunque di seconda categoria. Osservazioni 2.99. (1) Il teorema di Baire afferma tra le altre cose che: ogni classe, finita o infinita numerabile, di aperti densi in uno spazio metrico completo ha sempre intersezione non vuota (oltre che densa). Nel caso finito `e sufficiente specializzare l’enunciato alla situazione in cui Un = Um per n, m ≥ N per qualche N . (2) Il teorema di Baire, vale anche nel caso in cui X sia uno spazio topologico di Hausdorff localmente compatto. La dimostrazione della prima parte `e simile a quella della prima parte del caso dello spazio metrico completo [Rud91], la seconda `e identica alla corrispondente. (3) Il teorema di Baire si applica ovviamente agli spazi di Banach pensandoli come spazi metrici completi, usando la distanza associata alla norma. Passiamo ad enunciare e provare il teorema dell’applicazione aperta. Ricordiamo che una funzione f : X → Y tra due spazi normati (pi` u in generale,
2.4 I teoremi fondamentali negli spazi di Banach
61
tra spazi topologici) `e detta aperta se f(A) `e aperto in Y quando A ⊂ X `e (Z) aperto. Nell’enunciato, al solito, Br (z) indica la palla aperta di raggio r e centro z nello spazio normato (Z, || ||Z). Teorema 2.100. (Dell’applicazione aperta di Banach-Schauder.) Siano X e Y due spazi di Banach sullo stesso campo C o R. Se T ∈ B(X, Y) `e suriettivo, allora: (X)
(Y)
T (B1 (0)) ⊃ Bδ (0)
se δ > 0 `e abbastanza piccolo .
(2.29)
Conseguentemente T `e una funzione aperta. (X)
Dimostrazione. Definiamo in X la palla aperta Bn := B2−n (0), di raggio 2−n e centrata nell’origine. Proveremo che esiste un intorno aperto W0 dell’origine 0 ∈ Y con: W0 ⊂ T (B1 ) ⊂ T (B0 ) . (2.30) Questo risultato implica immediatamente la tesi. Per provare (2.30), notiamo che, come si prova facilmente B1 ⊃ B2 −B2 (dove, d’ora in poi, facciamo uso delle notazioni in notazione 2.75) e quindi T (B1 ) ⊃ T (B2 ) − T (B2 ) ed infine T (B1 ) ⊃ T (B2 ) − T (B2 ). D’altra parte valendo A + B ⊃ A + B se A, B ⊂ Y con Y spazio normato (provarlo per esercizio), abbiamo trovato che: T (B1 ) ⊃ T (B2 ) − T (B2 ) ⊃ T (B2 ) − T (B2 ) .
(2.31)
La prima inclusione di (2.30) (partendo da sinistra) risulta quindi essere vera se T (B2 ) ha interno non vuoto: se z ∈ Int(T (B2 )) allora z ⊂ A ⊂ T (B2 )) con A aperto e quindi 0 ∈ W0 := A − A ⊂ T (B2 ) − T (B2 ) ⊂ T (B1 ) dove W0 `e ancora aperto. Per provare che Int(T (B2 )) = ∅, notiamo che, nelle nostre ipotesi: Y = T (X) =
+∞
kT (B2 ) ,
(2.32)
k=1
dal momento che B2 `e un intorno aperto di 0. Dato che Y `e di seconda categoria, almeno uno dei kT (B2 ) deve essere di seconda categoria (se fossero tutti di prima categoria, Y sarebbe di prima categoria e questo non pu`o accadere per la seconda affermazione nel teorema 2.98 di Baire essendo Y completo). Dato che y → ky `e un omeomorfismo da Y a Y, T (B2 ) deve essere di seconda categoria in Y. Concludiamo che la chiusura di T (B2 ) ha interno non vuoto. Questo prova la prima inclusione in (2.30). Per provare la rimanente inclusione in (2.30) (la seconda, partendo da sinistra), usiamo una successione di elementi yn ∈ Y costruita induttivamente come segue. Fissiamo y1 ∈ T (B1 ). Assumiamo quindi n ≥ 1 e che yn sia stato
62
2 Spazi normati e spazi di Banach, esempi e applicazioni
scelto in T (Bn ) e passiamo a definire yn+1 tenendo conto delle considerazioni che seguono. Quanto abbiamo provato per T (B1 ) vale similmente modo per T (Bn+1 ), e dunque T (Bn+1 ) contiene un intorno aperto dell’origine. Allora: yn − T (Bn+1 ) ∩ T (Bn ) = ∅ . (2.33) Questo implica che esiste xn ∈ Bn tale che: T (xn ) ∈ yn − T (Bn+1 ) .
(2.34)
Definiamo allora: yn+1 := yn − T xn . Si noti che yn+1 ∈ T (Bn+1 ), e la costruzione induttiva procede in questo modo ad ogni passo. Dato che ||xn || < 2−n , per n = 1, 2, . . ., la somma x1 + · · · + xn forma una successione di Cauchy che converge a qualche x ∈ X, per la completezza di X, e vale ||x|| < 1. Quindi x ∈ B0 . Dal momento che: m n=1
T xn =
m
(yn − yn+1 ) = y1 − ym+1 ,
(2.35)
n=1
e dato che ym+1 → 0 per m → +∞ (per continuit` a di T ), concludiamo che y1 = T x ∈ T (B0 ). Dato che y1 era un generico elemento di T (B1 ), questo risultato dimostra la seconda inclusione in (2.30) e conclude la dimostrazione della prima affermazione. Passiamo alla seconda affermazione. (2.29) e la linearit`a di T implicano che (X) l’immagine secondo T di qualunque palla aperta B (x) = x + B1 (0) centrata in qualunque punto x ∈ X, contiene la palla aperta di Y centrata in (Y) (Y) T x: Bδ (0) := T x + Bδ (0) (per δ > 0 sufficientemente piccolo). Quindi (X)
l’immagine secondo T di un qualsiasi aperto di X, A = ∪x∈A Bx (x) risulta (Y) essere un aperto di Y: T (A) = ∪x∈A Bδ (T x). In altre parole, la funzione T `e x aperta. La conseguenza elementare pi` u importante del teorema dell’applicazione aperta `e sicuramente il Teorema di Banach dell’operatore inverso nel caso di spazi di Banach (esiste una versione che usa solo l’ipotesi di spazi vettoriali metrici completi). Teorema 2.101. (Di Banach dell’operatore inverso.) Siano X e Y due spazi di Banach sullo stesso campo C o R. Se T ∈ B(X, Y) `e iniettivo e suriettivo, allora valgono i seguenti due fatti. (a) T −1 : Y → X `e un operatore limitato cio`e T −1 ∈ B(Y, X). (b) Esiste c > 0 tale che: ||T x|| ≥ c||x|| ,
per ogni x ∈ X.
(2.36)
Dimostrazione. (a) Il fatto che T −1 sia lineare `e di immediata verifica. Bisogna solo provare che T −1 `e continuo. Essendo T aperta, la controimmagine di un
2.4 I teoremi fondamentali negli spazi di Banach
63
aperto di X secondo T −1 `e un aperto, quindi T −1 `e continua. (b) Dato che T −1 `e limitata, esiste K ≥ 0 tale che ||T −1y|| ≤ K||y|| per ogni y ∈ Y. Notare che K > 0, altrimenti varrebbe T −1 = 0 e di conseguenza T −1 e T non sarebbero biettive. Per ogni x ∈ X definiamo y = T x. Sostituendo in ||T −1 y|| ≤ K||y|| troviamo la (2.36) ponendo c = 1/K. 2.4.6 Teorema del grafico chiuso Per concludere passiamo a dimostrare un utilissimo teorema in teoria degli operatori chiamato il teorema del grafico chiuso. Notazione 2.102. (1) Se X `e spazio vettoriale e ∅ = X1 , . . . , Xn ⊂ X, allora: < X1 , · · · , Xn > denota il sottospazio generato dagli insiemi Xi , cio`e il sottospazio vettoriale di X contenente tutte le combinazioni lineari finite di elementi degli insiemi Xi . (2) Se X `e spazio vettoriale e ∅ = X1 , . . . , Xn ⊂ X sono sottospazi di X, Y = X1 ⊕ · · · ⊕ Xn significa che Y ⊂ X `e somma diretta degli spazi Xi , cio`e valgono insieme: (i) Y =< X1 , · · · , Xn > (quindi Y `e sottospazio di X) e (ii) Xi ∩ Xj = {0} per ogni coppia di indici i, j = 1, . . . , n con i = j. Come noto dai corsi elementari, (i) e (ii) insieme equivalgono al fatto che: x ∈ Y ⇒ x = x1 + · · · + xn con xk ∈ Yk unicamente determinato da x per k = 1, . . . , n. (3) Se X1 , . . . , Xn sono spazi vettoriali sullo stesso campo K = C o R, possiamo dotare X1 × · · · × Xn di una struttura di spazio vettoriale su K definendo: α(x1 , . . . , xn ) := (αx1 , . . . , αxn) e (x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ) per ogni scelta di α ∈ K e (x1 , . . . , xn ), (y1 , . . . , yn ) ∈ X1 × · · · × Xn . Se: ΠXk : (x1 , . . . , xk−1, xk , xk+1 , . . . , xn) → (0, . . . , 0, xk, 0, . . . , 0) , denota la k-esima proiezione canonica, lo spazio vettoriale costruito su X1 ×· · ·×Xn risulta coincidere con Ran(ΠX1 )⊕· · ·⊕Ran(ΠXn ). Dato che ogni Xk si identifica naturalmente con il corrispondente Ran(ΠXk ), noi useremo la notazione X1 ⊕ · · · ⊕ Xn per indicare la struttura naturale di spazio vettoriale di X1 × · · · × Xn costruita come detto sopra, anche nel caso in cui gli spazi vettoriali Xk non siano a priori sottospazi di un comune spazio vettoriale assegnato.
64
2 Spazi normati e spazi di Banach, esempi e applicazioni
Per enunciare e dimostrare il teorema abbiamo bisogno di introdurre alcuni risultati elementari. Prima di tutto notiamo che se (X, NX ) e (Y, NY ) sono spazi normati sullo stesso campo K = C o R, possiamo considerare lo spazio X ⊕ Y nel senso di (3) in notazione 2.102. X ⊕ Y `e dotato naturalmente della topologia prodotto indotta da quella di X e Y e presentata nella definizione 2.11. Le operazioni della struttura di spazio vettoriale di X⊕Y sono continue rispetto alla topologia prodotto di X e Y come `e facile provare (la prova `e la stessa che abbiamo usato per provare che, in uno spazio normato, le operazioni di somma di due vettori e di prodotto di scalare e vettore sono continue nelle corrispondenti topologie naturali). Infine le proiezioni canoniche ΠX : X⊕Y → X e ΠY : X⊕Y → Y sono continue nella topologia prodotto nel dominio e quella di X e, rispettivamente, di Y nel codominio, come si prova immediatamente. La topologia prodotto di X ⊕ Y `e normabile: cio`e esiste un norma su X ⊕ Y la cui topologia associata `e proprio la topologia prodotto di X ⊕ Y. Una possibile norma `e: ||(x, y)|| := max{NX (x), NY (y)} per ogni (x, y) ∈ X ⊕ Y .
(2.37)
Il fatto che questa norma generi la topologia prodotto, cio`e gli insiemi aperti siano unione di prodotti delle palle aperte di X e Y, si prova come segue. Consideriamo l’intorno aperto di (x0 , y0 ) dato dal prodotto di due palle aperte (X) (Y) Bδ (x0 )×Bμ (y0 ) rispettivamente in X e Y. La palla aperta di X⊕Y centrata ancora in (x0 , y0 ): {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < min{δ, μ}/2} (X)
(Y)
(X)
(Y)
`e contenuta in Bδ (x0 )×Bμ (y0 ). Viceversa, il prodotto Bδ (x0 )×Bδ (y0 ), che contiene il punto (x0 , y0 ), `e incluso nella palla aperta centrata in (x0 , y0 ) {(x, y) ∈ X × Y | ||(x, y) − (x0 , y0 )|| < } , se > δ. Questo conclude la prova, perch´e ne segue che ogni unione di prodotti di palle metriche di X e Y `e anche unione di palle metriche della norma (2.37) ed ogni unione di palle metriche della norma (2.37) `e anche unione di prodotti di palle metriche di X e Y. Quindi le due topologie coincidono. Si prova immediatamente che (X ⊕ Y, || ||) `e uno spazio di Banach se sono tali (X, NX ) e (Y, NY ). (Questo fatto implica, in base alla proposizione 2.110 provata nel seguito, che qualunque norma che generi la topologia prodotto rende X⊕Y spazio di Banach.) Sia infatti {(xn , yn )} una successione di Cauchy in X⊕Y, allora {xn } e {yn } risultano essere di Cauchy in X e Y rispettivamente dalla stessa definizione di norma su X ⊕ Y data sopra. Siano x ∈ X e y ∈ Y i limiti di queste due successioni, che esistono essendo X e Y spazi di Banach. Se > 0, esistono Nx e Ny interi positivi tali che, se n > max{Nx , Ny } allora: ||(x, y) − (xn , yn )|| < , e quindi (xn , yn ) → (x, y) per n → +∞ nella topologia indotta dalla norma di X ⊕ Y. Tale spazio `e quindi spazio di Banach.
2.5 Proiettori
65
Definizione 2.103. Siano X, Y spazi normati sullo stesso campo C o R. T ∈ L(X, Y) `e detto chiuso se il grafico dell’operatore T , cio`e il sottospazio di X ⊕ Y: G(T ) := {(x, T x) ∈ X ⊕ Y | x ∈ X} , `e chiuso nella topologia prodotto. Ci` o equivale a dire che T `e chiuso se e solo se verifica la seguente propriet` a. Per ogni successione {xn }n∈N ⊂ X tale che {xn }n∈N e {T xn }n∈N convergono in X e Y rispettivamente, vale: lim T (xn ) = T ( lim xn ) .
n→∞
n→∞
L’equivalenza asserita nella seconda parte della definizione segue immediatamente dal risultato topologico generale che un insieme (G(T ) nel nostro caso) `e chiuso se e solo se coincide con la sua chiusura, e cio`e se e solo se contiene i suoi punti di accumulazione, esplicitando tale requisito in termini della topologia prodotto. Possiamo enunciare e dimostrare il teorema dell’operatore chiuso o grafico chiuso. Teorema 2.104. (Dell’operatore chiuso o del grafico chiuso.) Siano (X, || ||X ) e (Y, || ||Y ) spazi di Banach sullo stesso campo K = C. T ∈ L(X, Y) `e limitato se e solo se `e chiuso. Dimostrazione. Se T `e limitato allora `e banalmente chiuso come segue dalla definizione di operatore chiuso. Supponiamo che T sia chiuso e mostriamo che `e limitato. Consideriamo l’applicazione lineare biettiva M : G(T ) (x, T x) → x ∈ X. G(T ) `e per ipotesi un sottospazio chiuso nello spazio di Banach X ⊕ Y, per cui `e a sua volta uno spazio di Banach rispetto alla restrizione della norma || || (2.37). Dalla definizione di tale norma troviamo che vale banalmente ||M (x, T x)||X = ||x||X ≤ ||(x, T x)|| per cui M `e limitato. Per il teorema dell’inverso limitato di Banach M −1 : X → G(T ) ⊂ X ⊕ Y `e limitato. Dato che la proiezione canonica di ΠY : X ⊕ Y → Y `e continua, concludiamo che l’applicazione lineare ΠY ◦ M −1 : x → T x `e continua ossia limitata.
2.5 Proiettori Introduciamo, usando il teorema del grafico chiuso, la nozione e le propriet`a elementari di alcuni operatori continui detti proiettori. La nozione di proiettore giocher` a il ruolo centrale nella formulazione della Meccanica Quantistica quando lo spazio normato sar` a uno spazio di Hilbert. Definizione 2.105. Sia (X, || ||) spazio normato sul campo C o R. P ∈ B(X) `e detto proiettore se `e idempotente, cio`e se PP = P .
(2.38)
M := P (X) `e detto spazio di proiezione di P e si dice anche che P proietta su M.
66
2 Spazi normati e spazi di Banach, esempi e applicazioni
I proiettori sono naturalmente associati ad una decomposizione diretta (somma diretta) di X in una coppia di sottospazi chiusi. Proposizione 2.106. Sia P ∈ B(X) un proiettore sullo spazio normato (X, || ||). Vale quanto segue. (a) Se Q : X → X `e l’applicazione lineare che soddisfa Q+P =I ,
(2.39)
P Q = QP = 0 ,
(2.40)
Q `e proiettore e: dove 0 `e l’operatore nullo (quello che trasforma nel vettore 0 ogni vettore di X). (b) Gli spazi di proiezione M := P (X) ed N := Q(X) sono sottospazi chiusi di X e vale: X = M⊕N. (2.41) Dimostrazione. (a) Q `e continuo perch´e somma di operatori continui, QQ = (I − P )(I − P ) = I − 2P + P P = I − 2P + P = I − P = Q. P Q = P (I − P ) = P − P P = P − P = O, (I − P )P = P − P P = P − P = O. (b) Se P (xn) → y per n → +∞ allora, dalla continuit` a di P : P P (xn) → P (y). Per (2.38) questo si scrive P (xn ) → P (y) da cui y = P (y) per l’unicit` a del limite (essendo X di Hausdorff). In definitiva y ∈ M implica y ∈ M(⊂ M) per cui M = M ed M `e dunque un insieme chiuso. Con lo stesso ragionamento si prova che N `e chiuso. Il fatto che M ed N siano sottospazi `e immediata conseguenza della linearit`a di P e Q rispettivamente. Sia ora x ∈ X, dalla definizione di Q vale x = P (x) + Q(x) , di conseguenza X =< M, N >. Per concludere basta provare che M ∩ N = {0}. Sia x ∈ M∩ N. Allora x = P (x) e dunque x = Q(x) per (2.38) (se x ∈ M allora x = P z per qualche z ∈ X, ma allora P x = P P z = P z = x). Applicando Q all’identit` a x = P x e tenendo conto di x = Qx si ha: x = Q(x) = QP (x) = 0 per (2.40), e quindi x = 0. Il teorema del grafico chiuso prova che la proposizione 2.106 pu` o essere invertita come segue, assumendo l’ulteriore ipotesi che lo spazio ambiente sia di Banach. Proposizione 2.107. Sia (X, || ||) spazio di Banach e M, N ⊂ X due sottospazi chiusi tali che X = M ⊕ N. Si considerino le applicazioni P : X → M e Q : X → N che associano a x ∈ M i rispettivi elementi di M ed N secondo la decomposizione diretta X = M ⊕ N. Allora vale quanto segue. (a) P e Q sono proiettori che proiettano rispettivamente su M ed N. (b) Valgono le identit` a (2.39) e (2.40).
2.6 Norme equivalenti
67
Dimostrazione. Per ipotesi, se x ∈ X allora vale la decomposizione x = uM +uN con uM ∈ M e un ∈ N e tale decomposizione `e l’unica possibile rispetto a tale coppia di sottospazi. L’unicit` a ed il fatto che M ed N sono rispettivamente chiusi per combinazioni lineari implicano che le funzioni P : x → uM e Q : x → uN siano lineari e che valga P P = P e QQ = Q. Si noti anche che P (X) = M e Q(X) = N per costruzione e che (2.39) vale in quanto X =< M, N >, mentre (2.40) vale perch´e M ∩ N = {0}. Per concludere la dimostrazione bisogna solo provare che P e Q sono continui. Mostriamo che P `e chiuso, il teorema dell’operatore chiuso implica allora che P `e continuo. La dimostrazione per Q `e analoga. Sia {xn } ⊂ X una successione che converge a x ∈ X e tale che {P xn} converge anch’essa ad un elemento di X. Proviamo che: P x = lim P xn . n→+∞
Dato che N `e chiuso: N Qxn = xn − P xn → x − lim P xn = z ∈ N . n→+∞
Abbiamo ottenuto che: x = lim P xn + z , n→+∞
con z ∈ N, ma anche limn→+∞ P xn ∈ M, perch´e M `e chiuso e P xn ∈ M per ogni n. D’altra parte sappiamo che vale anche x = P x + Qx . Per l’unicit` a della decomposizione di x come somma di vettori in N ed M deve essere P x = lim P xn n→+∞
e z = Qx, quindi l’operatore P `e chiuso ed `e pertanto continuo.
2.6 Norme equivalenti Un’interessante applicazione del teorema dell’operatore inverso di Banach `e un criterio per stabilire quando due norme sullo stesso spazio vettoriale, che risulta essere completo per entrambe, sono associate alla stessa topologia. Introduciamo qualche nozione prima di enunciare il criterio detto nella proposizione 2.110. Concluderemo la sezione con la dimostrazione del fatto che tutte le norme sugli spazi vettoriali di dimensione finita sono equivalenti e rendono tali spazi spazi di Banach. Definizione 2.108. Due norme N1 e N2 sullo stesso spazio vettoriale X (su C o R) si dicono equivalenti se esistono due costanti c, c > 0 tali che: cN2 (x) ≤ N1 (x) ≤ c N2 (x) ,
per ogni x ∈ X.
(2.42)
68
2 Spazi normati e spazi di Banach, esempi e applicazioni
Osservazioni 2.109. (1) Si osservi che (2.42) `e equivalente all’analoga disuguaglianza che si ottiene scambiando N1 con N2 e sostituendo c, c con 1/c , 1/c rispettivamente. (2) Si prova immediatamente, dalla definizione e dall’osservazione precedente, che: se uno spazio normato `e completo allora `e tale ogni altro spazio normato sullo stesso spazio vettoriale dotato di una norma equivalente. (3) Se due norme sullo stesso spazio sono equivalenti allora generano la stessa topologia. La proposizione di sotto prova che vale anche il viceversa. (4) Nello spazio delle norme su un fissato spazio vettoriale, la nozione di norma equivalente definisce una relazione di equivalenza. La prova di ci`o `e immediata dalle definizioni date. Proposizione 2.110. Sia X uno spazio vettoriale su C o R. Le norme N1 e N2 su X sono equivalenti se e solo se l’applicazione identica I : (X, N2 ) x → x ∈ (X, N1 ) `e un omeomorfismo (che equivale a dire che le topologie metriche generate dalle due norme coincidono). Dimostrazione. Bisogna solo dimostrare che se I `e omeomorfismo allora le norme sono equivalenti. L’altra implicazione `e ovvia dalla definizione di norme equivalenti. Se I `e un omeomorfismo allora `e continuo nell’origine e quindi, in particolare, la palla aperta rispetto alla norma N1 di raggio 1 e centrata in 0 deve contenere completamente una palla aperta rispetto alla norma N2 centrata in 0 di raggio δ > 0 sufficientemente piccolo. Ossia N2 (x) ≤ δ ⇒ N1 (x) < 1. In particolare, per x = 0, N2 (δx/N2 (x)) ≤ δ per cui: N1 (δx/N2 (x)) < 1 ossia δN1 (x) ≤ N2 (x). Per x = 0 vale banalmente l’uguaglianza. Abbiamo provato che esiste c = 1/δ > 0 per cui N1 (x) ≤ c N2 (x) per ogni x ∈ X. L’altra parte della (2.42) si prova analogamente scambiando il ruolo dei due spazi. Proposizione 2.111. Sia X uno spazio vettoriale su C o R. Si supponga che X sia spazio di Banach rispetto ad entrambe le norme N1 , N2 . Se esiste c > 0 tale che, per ogni x ∈ X: cN2 (x) ≤ N1 (x) allora le due norme sono equivalenti. Dimostrazione. Si consideri la funzione identit` a I : x → x. Tale funzione `e lineare e continua quando la pensiamo come I : (X, N1 ) → (X, N2 ) perch´e N2 (x) ≤ (1/c)N1 (x) per ogni x ∈ X. Per il punto (b) nella tesi del teorema di Banach della funzione inversa esister`a c > 0 tale che N1 (x) ≤ c N2 (x) per ogni x ∈ X. N1 e N2 soddisfano allora la (2.42). Come ultima proposizione diamo il seguente importante risultato, che vale anche per spazi reali (scambiando C con R usando la stessa dimostrazione). Proposizione 2.112. Sia X uno spazio vettoriale sul campo C di dimensione finita. Tutte le norme su X sono a due a due equivalenti ed ognuna di esse definisce una struttura di spazio di Banach su X.
2.6 Norme equivalenti
69
` chiaro che possiamo ridurci a studiare il caso dello spazio Dimostrazione. E Cn , visto che ogni spazio vettoriale complesso di dimensione finita n `e isomorfo a Cn . Come conseguenza delle osservazioni (2) e (4) di sopra, `e sufficiente provare che ogni norma su Cn `e equivalente alla norma standard. Si tenga in particolare conto del fatto, noto dall’analisi elementare, che Cn con la norma standard `e completo e quindi ogni altra norma equivalente ad essa rende lo spazio vettoriale uno spazio di Banach in virt` u di (2) nelle osservazioni2.109. Sia N una norma su Cn e sia e1 , · · · , en la base canonica di Cn . Se x = i xi ei e y = i yi ei sono elementi generici di Cn , dalla propriet` a di positivit` a (N0), dalla disuguaglianza triangolare (N2) e dalla propriet` a di omogeneit` a (N1) della definizione di norma: 0 ≤ N (x − y) ≤
n
|xi − yi |N (ei ) ≤ Q
i=1
dove Q := su Cn
i
n
|xi − yi | ,
i=1
N (ei ). D’altra parte vale banalmente, se ||·|| `e la norma standard
n |xj − yj | ≤ M ax{|xi − yi | | i = 1, 2, · · · , n} ≤ |xi − yi |2 = ||x − y|| , i=1
da cui 0 ≤ N (x − y) ≤ nQ||x − y|| . Questo prova che N `e continua rispetto alla topologia della norma standard. Se S := {x ∈ Cn | ||x|| = 1} e N `e una seconda norma su Cn , che quindi sar`a continua rispetto alla topologia della norma standard, la funzione S x → f(x) :=
N (x) N (x)
sar`a continua perch´e rapporto di funzioni continue con denominatore mai nullo. Dato che S `e compatto nella topologia della norma standard, esisteranno il minimo m ed il massimo M di f. In particolare M ≥ m > 0 perch´e N, N sono strettamente positive su S e i valori m, M sono assunti da f per opportuni vettori xm , xM in S. Per costruzione: mN (x) ≤ N (x) ≤ M N (x) ,
per ogni x ∈ S .
Questa disuguaglianza vale in realt` a per ogni vettore x ∈ Cn dato che x = λx0 con x0 ∈ S e λ ≥ 0 e quindi, moltiplicando per λ ≥ 0 i membri della disuguaglianza trovata valutata in x0 ed usando la propriet` a N1 delle norme: mN (x) ≤ N (x) ≤ M N (x) per ogni x ∈ Cn . Scegliendo N := || · || si conclude che ogni norma su Cn `e equivalente a quella standard.
70
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.7 Il teorema del punto fisso e applicazioni Per concludere il capitolo, ci occuperemo di un teorema elementare che ha importanti conseguenze in analisi, in particolare per la teoria delle equazioni differenziali: il teorema del punto fisso. Enunciamo il teorema per spazi metrici completi e poi specializzeremo il risultato agli spazi di Banach. 2.7.1 Il teorema del punto fisso di Banach-Caccioppoli Partiamo da una definizione che si riferisce alla nozione di spazio metrico introdotta con la definizione 2.88. Definizione 2.113. Sia (M, d) uno spazio metrico. Una funzione, G : M → M `e detta mappa di contrazione, se esiste un numero reale λ ∈ [0, 1) per cui: d(G(x), G(y)) ≤ λd(x, y) .
(2.43)
Ricordando che gli spazi normati (X, ||||) sono spazi metrici, quando si definisce la distanza naturale d(x, y) := ||x − y|| (e la topologia metrica indotta da d coincide con la topologia naturale associata alla norma || || come discusso nella sezione 2.4.4), possiamo specializzare la definizione precedente al caso degli spazio normati come segue. Definizione 2.114. Sia (Y, || ||) uno spazio normato e X ⊂ Y un sottoinsieme chiuso (eventualmente coincidente con Y stesso). Una funzione, G : X → X `e detta mappa di contrazione, se esiste un numero reale λ ∈ [0, 1) per cui: ||G(x) − G(y)|| ≤ λ||x − y|| .
(2.44)
Osservazioni 2.115. (1) Notare che `e esplicitamente escluso il valore λ = 1. (2) La richiesta (2.43) implica immediatamente che ogni mappa di contrazione `e continua nella topologia naturale dello spazio metrico (M, d). La richiesta (2.44) implica immediatamente che ogni mappa di contrazione `e continua sull’insieme X rispetto alla topologia indotta dalla topologia naturale dello spazio normato (Y, || ||). (3) Si osservi che, nella definizione 2.114: (a) la funzione G non `e richiesta essere lineare e (b) X non `e richiesto essere un sottospazio di Y, ma solo un sottoinsieme. Le strutture lineari non giocano alcun ruolo fondamentale. Passiamo ad enunciare e provare il teorema del punto fisso (di BanachCaccioppoli) per spazi metrici. Teorema 2.116. (Del punto fisso per spazi metrici.) Sia G : M → M una mappa di contrazione sullo spazio metrico completo (M, d). Esiste ed, `e unico, un elemento z ∈ M, detto punto fisso, tale che: G(z) = z .
(2.45)
2.7 Il teorema del punto fisso e applicazioni
71
Se pi` u debolmente G : M → M non `e una mappa di contrazione, ma lo `e una sua potenza positiva: Gn = G ◦ · · · ◦ G (dove la composizione `e eseguita n volte) per qualche fissato n = 1, 2, . . ., allora G ammette comunque un unico punto fisso. Dimostrazione. Cominciamo a provare che il punto fisso z esiste. Si consideri la successione, dove x0 ∈ M `e arbitrario, definita per induzione da xn+1 = G(xn ). Vogliamo provare che questa successione `e di Cauchy. Proveremo infine che tale limite `e un punto fisso di G. Assumiamo, senza perdere generalit`a che valga m ≥ n. Se m = n, banalmente, d(xm , xn ) = 0, se m > n possiamo usare ripetutamente la disuguaglianza triangolare ottenendo: d(xm , xn ) ≤ d(xm , xm−1 ) + d(xm−1 , xm−2 ) + · · · + d(xn+1 , xn) .
(2.46)
Consideriamo il generico termine a secondo membro: d(xp+1 , xp ). Vale: d(xp+1 , xp ) = d(G(xp), G(xp−1 )) ≤ λd(xp , xp−1 ) = λd(G(xp−1 ), G(xp−2 )) ≤ λ2 d(xp−1 , xp−2 ) ≤ · · · ≤ λp d(x1 , x0) . Quindi, per ogni p = 1, 2, . . . vale la disuguaglianza d(xp+1 , xp ) ≤ λp d(x1 , x0 ). Inserendo questa nel secondo membro di (2.46) otteniamo la stima: m−1
d(xm , xn ) ≤ d(x1 , x0)
m−n−1 n
p
λ = d(x1 , x0)λ
p=n
λp
p=0
+∞ λn ≤ λn d(x1 , x0 ) λp ≤ d(x1 , x0) 1−λ p=0
dove abbiamo usato il fatto che, se 0 ≤ λ < 1, Concludiamo che: λn d(xm , xn) ≤ d(x1 , x0 ) . 1−λ
+∞ p=0
λp = (1 − λ)−1 . (2.47)
Nelle nostre ipotesi |λ| < 1 per cui d(x1 , x0 )λn /(1 − λ) → 0 se n → +∞. Quindi d(xm , xn ) pu` o essere reso piccolo a piacere scegliendo sufficientemente grande il pi` u piccolo tra m ed n. Questo risultato implica immediatamente che la successione {xn }n∈N sia di Cauchy. Dato che M `e completo, sar`a limn→+∞ xn = x ∈ M per qualche x. Dato che G `e continua essendo una mappa di contrazione:
G(x) = G lim xn = lim G(xn ) = lim xn+1 = x , n→+∞
n→+∞
per cui G(x) = x come volevamo provare.
n→+∞
72
2 Spazi normati e spazi di Banach, esempi e applicazioni
Proviamo che il punto fisso trovato `e unico. Supponiamo che x e x soddisfino entrambi G(x) = x e G(x ) = x . Vale allora d(x, x) = d(G(x), G(x)) ≤ λd(x, x ) . Se fosse d(x, x) = 0, dividendo il primo e l’ultimo membro per d(x, x ), otterremmo la disuguaglianza 1 ≤ λ che `e impossibile per ipotesi. Quindi deve essere d(x, x) = 0 da cui x = x per la stretta positivit` a della distanza. Passiamo a provare l’esistenza ed unicit`a sotto l’ipotesi che B := Gn sia una mappa di contrazione. In tal caso, sfruttando la dimostrazione precedente, B ammette un unico punto fisso z. Chiaramente, se G ammette un punto fisso, questo deve coincidere con z. Bisogna solo dimostrare che z `e un punto fisso di G. Se z `e il punto fisso di B, allora: G(z) = G(B k (z)) = B k (G(z)) = B k (z0 ) → z
per k → +∞,
dato che, essendo B una contrazione, la successione B(z0 ), B 2 (z0 ), B 3 (z0 ), . . . converge al punto fisso z, qualunque sia z0 ∈ M, come visto nella precedente parte della dimostrazione. Di conseguenza: G(z) = z. Passando agli spazi normati, il teorema precedente ha come conseguenza il seguente teorema usando come distanza la distanza naturale dello spazio normato: d(x, y) := ||x − y||. Teorema 2.117. (Del punto fisso per spazi normati.) Sia G : X → X una mappa di contrazione, sull’insieme chiuso X ⊂ B con B spazio di Banach sul campo R o C. Esiste ed, `e unico, un elemento z ∈ X, detto punto fisso, tale che: G(z) = z . (2.48) Se pi` u debolmente G : X → X non `e una mappa di contrazione, ma lo `e una sua potenza positiva: Gn = G ◦ · · · ◦ G (dove la composizione `e eseguita n volte) per qualche fissato n = 1, 2, . . ., allora G ammette comunque un unico punto fisso. Dimostrazione. Definiamo M := X e d(x, y) := ||x − y|| per x, y ∈ X. In tal modo X diventa spazio metrico. (X, d) `e anche completo. Infatti, se {xn }n∈N ⊂ X `e una successione di Cauchy rispetto a d, lo `e anche rispetto a || ||, come `e immediato verificare. Dato che (Y, || ||) `e completo, esiste il limite x ∈ Y della successione {xn }n∈N. Dato che X `e un chiuso di Y, x ∈ X. Quindi ogni successione di Cauchy di (X, d) ammette limite in X e quindi (X, d) `e completo. A questo punto la dimostrazione si conclude usando il teorema precedente per lo spazio metrico (X, d). L’importanza del teorema del punto fisso, tra le altre cose, `e data dal fatto che esso viene usato spesso per costruire teoremi di esistenza ed unicit`a per equazioni di vario genere, specialmente integrali e differenziali, mostrando che
2.7 Il teorema del punto fisso e applicazioni
73
l’equazione di cui si cerca la soluzione z pu` o essere scritta come un’equazione del punto fisso G(z) = z in qualche opportuno spazio di Banach (o spazio metrico completo). Un caso abbastanza elementare (dato che la funzione G che considereremo sar`a lineare) `e dato da (1) nei prossimi esempi, ma l’esempio successivo riguarda un caso generalmente non lineare. Esempi 2.118. Diamo di seguito due esempi elementari dell’uso della teoria del punto fisso. L’esempio pi` u importante sar`a trattato separatamente nella prossima sezione. (1) Si consideri l’equazione di Volterra omogenea su C([a, b]) nell’incognita data dalla funzione f ∈ C([a, b]): x f(x) = K(x, y)f(y)dy , (2.49) a
dove K `e una funzione continua e limitata da M ≥ 0. Lavoriamo dunque nello spazio di Banach C([a, b]) con norma dell’estremo superiore || ||∞. L’equazione pu` o essere riscritta nella forma f = Af, dove A : C([a, b]) → C([a, b]) `e l’operatore integrale individuato dal nucleo integrale K sopra scritto: x (Af)(x) := K(x, y)f(y)dy per ogni f ∈ C([a, b]). (2.50) a
` chiaro che ogni soluzione, se esiste, non `e altro che un punto fisso di A. Non E solo, ma `e anche un punto fisso di ogni operatore An per ogni scelta della potenza n = 1, 2, . . .. Mostriamo ora che `e possibile fissare n in modo tale che An sia una contrazione. Questo risultato, in base al teorema 2.117 del punto fisso assicura che l’equazione di Volterra omogenea ammette una ed una sola soluzione. Il calcolo diretto mostra che:
x
|(Af)(x)| = K(x, y)f(y)dy
≤ M (x − a)||f||∞ . a
Iterando la procedura si trova: |(A2 f)(x)| ≤ M 2
(x − a)2 ||f||∞ , 2
|(An f)(x)| ≤ M n
(x − a)n ||f||∞ , n!
e, per n iterazioni:
da cui: ||Anf||∞ ≤ M n
(b − a)n ||f||∞ , n!
e dunque: ||An|| ≤ M n
(b − a)n . n!
74
2 Spazi normati e spazi di Banach, esempi e applicazioni
Risulta allora chiaro che, per n abbastanza grande, comunque siano stati fissati a, b, M , risulta: (b − a)n Mn 0 naturali fissati e Ω ⊂ Kr × Kn aperto non vuoto. F : Ω → Km `e detta localmente lipschitziana (nella variabile x ∈ Kn se r > 0), se per ogni p ∈ Ω esiste una costante Lp ≥ 0 tale che, in un aperto Op p: ||F (z, x) − F (z, x)||Km ≤ Lp ||x − x ||Kn ,
per ogni coppia (z, x), (z, x) ∈ Op , (2.52)
Ogni F : Ω → Km di classe C 1 `e localmente lipschitziana nella variabile x, come discuteremo tra poco. Passiamo ad enunciare e provare il teorema. Teorema 2.120. (Esistenza ed unicit` a locale per sistemi di equazioni differenziali del prim’ordine.) Sia f : Ω → Kn una funzione continua e localmente lipschitziana nella variabile x ∈ Kn sull’aperto Ω ⊂ R × Kn e si consideri il problema di Cauchy del primo ordine (scritto in forma normale), dove (t0 , x0 ) ∈ Ω: dx = f (t, x(t)) , (2.53) dt x(t0 ) = x0 . Esiste un intervallo aperto I t0 in cui esiste, ed `e unica, la soluzione di (2.53). Inoltre tale soluzione `e necessariamente una funzione in C 1 (I). Dimostrazione. Prima di tutto notiamo che ogni soluzione x = x(t) di (2.53) `e necessariamente di classe C 1 . Infatti `e sicuramente continua in quanto difdx ferenziabile, ma allora, direttamente da dx dt = f (t, x(t)) concludiamo che dt deve essere continua essendo il secondo membro dell’equazione una funzione continua di t in quanto composizione di funzioni continue. Passiamo all’esistenza ed all’unicit`a. Supponiamo che x : I → Kn sia differenziabile e soddisfi (2.53). Tenendo conto del secondo teorema fondamentale del calcolo ed integrando (2.53) (la derivata di x(t) `e continua), x : I → Kn deve soddisfare, t x(t) = x0 + f (τ, x(τ )) dτ , per ogni t ∈ I. (2.54) t0
Viceversa, se x : I → Kn `e continua e soddisfa (2.54) allora, per il primo teorema fondamentale del calcolo (f `e continua), x = x(t) `e differenziabile e soddisfa (2.53). Concludiamo che funzioni continue x = x(t), definite su un intervallo aperto I t0 e che risolvono l’equazione integrale (2.54), sono tutte e sole le soluzioni di (2.53) definite sullo stesso intervallo I. Invece di risolvere (2.53) risolviamo il problema integrale equivalente (2.54). Cominciamo a provare l’esistenza della soluzione. Fissiamo, una volta per tutte, un insieme aperto Q (t0 , x0 ) a chiusura compatta e con Q ⊂ Ω. Prendendo Q sufficientemente piccolo possiamo sfruttare anche la locale lipschitzianit`a di f nella variabile x. Nel seguito || || indicher` a la norma standard in Kn e porremo:
2.7 Il teorema del punto fisso e applicazioni
77
(i) 0 ≤ M := max{||f(t, x)|| | (t, x) ∈ Q}, (ii) L ≥ 0 `e la costante per cui ||f(t, x) − f(t, x )|| ≤ L||x − x || se (t, x), (t, x) ∈ Q, (iii) B (x0 ) := {x ∈ Kn | ||x − x0 || ≤ } per > 0. Consideriamo un intervallo chiuso Jδ = [t0 −δ, t0 +δ] con δ > 0 e consideriamo lo spazio di Banach (vedi la proposizione 2.31) C(J; Kn ) delle funzioni continue X : Jδ → Kn , con norma || ||∞ . In questo spazio definiamo la funzione G, che associa ad ogni funzione X la nuova funzione G(X) definita da: t G(X)(t) := x0 + f (τ, X(τ )) dτ , per ogni t ∈ Jδ . t0
Si osservi che G(X) ∈ C(Jδ ; Kn ) se X ∈ C(Jδ ; Kn ) per la continuit` a della funzione integrale come funzione dell’estremo superiore quando l’integrando `e continuo. Mostriamo che G `e una mappa di contrazione su un sottoinsieme chiuso di C(Jδ ; Kn )4 : n M(δ) := {X ∈ C(Jδ ; K ) | ||X(t) − x0 || ≤ , ∀t ∈ Jδ }
se 0 < δ < min{/M, 1/L} e δ, > 0 sono piccoli a sufficienza da soddisfare la richiesta Jδ × B (x0 ) ⊂ Q. (In tutto il seguito assumeremo quindi sempre di (δ) aver scelto > 0 e δ > 0 in modo che valga Jδ × B (x0 ) ⊂ Q.) Se X ∈ M vale:
t
||G(X)(t) − x0 || ≤
f (τ, X(τ )) dτ
t0 t
≤
t0 (δ)
(δ)
t
||f (τ, X(τ ))|| dτ ≤
M dτ ≤ δM . t0 (δ)
se 0 < δ < /M . Se X, X ∈ M
Quindi G(M ) ⊂ M t ∈ Jδ :
G(X)(t) − G(X )(t) =
t
si ha, per ogni
[f (τ, X(τ )) − f (τ, X (τ ))] dτ ,
t0
t
||G(X)(t) − G(X )(t)|| ≤
[f (τ, X(τ )) − f (τ, X (τ ))] dτ
t0 t ≤ ||f (τ, X(τ )) − f (τ, X (τ ))|| dτ .
t0
Dato che nelle nostre ipotesi vale la maggiorazione lipschitziana ||f(t, x) − f(t, x )|| < L||x − x || , 4
(δ)
M = {X ∈ C(Jδ ; Kn ) | ||X − X0 ||∞ ≤ }, dove X0 indica la funzione (δ) costantemente x0 su Jδ . Pertanto M `e la chiusura della palla aperta di raggio n centrata in X0 in C(Jδ ; K ).
78
2 Spazi normati e spazi di Banach, esempi e applicazioni
si ha ancora:
t
||G(X)(t) − G(X )(t)|| ≤ L t0
||X(τ ) − X (τ )|| dτ ≤ δL||X − X ||∞ .
Infine, prendendo l’estremo superiore anche del primo membro si ha: ||G(X) − G(X )||∞ ≤ δL||X − X ||∞ . (δ)
(δ)
Se, in aggiunta alle richieste di sopra, δ < 1/L, G : M → M `e una (δ) mappa di contrazione sull’insieme chiuso M . Per il teorema 2.117 esister`a un punto fisso per G, cio`e una funzione continua x = x(t) ∈ Kn con t ∈ Jδ , che soddisfa la (2.54) per definizione di G. La restrizione di x all’intervallo aperto I := (t0 − δ, t0 + δ) `e una soluzione del problema di Cauchy (2.53). Passiamo all’unicit` a. Consideriamo, nell’intervallo I := (t0 − δ, t0 + δ), una seconda soluzione x = x (t) dell’equazione integrale (2.54) a priori differente dalla soluzione x = x(t). Per costruzione, per ogni intervallo chiuso Jδ := (J ) (J ) [t0 − δ , t0 + δ ] con 0 < δ < δ la funzione G : M δ → M δ `e ancora una mappa di contrazione e x = x (t) `e un suo punto fisso e pertanto coincide con la restrizione x = x(t) all’intervallo Jδ , per l’unicit` a del punto fisso. Dato che δ `e arbitrario in (0, δ), le due soluzioni coincidono su I = (t0 − δ, t0 + δ). Per completezza notiamo che il teorema precedente si applica al caso in cui f sia una funzione di classe C 1 , come conseguenza della seguente proposizione elementare. Usiamo le solite notazioni x = (x1 , . . . , xn), z = (z1 , . . . , zl ) e, per una funzione arbitraria F : Ω → Rm con Ω = A × B con A ⊂ Rl e B ⊂ Rn aperti non vuoti, usiamo la notazione F (z, x) = (F1 (z, x), . . . , Fm (z, x)). Proposizione 2.121. Sia Ω = A × B con A ⊂ Rl e B ⊂ Rn aperti non vuoti. La funzione F : Ω → Rm `e localmente lipschitziana nella variabile x se, per ogni z ∈ A, tutte le funzioni B x → Fk (z, x) sono differenziabili e le derivate parziali, al variare di (z, x), definiscono funzioni continue su Ω. Dimostrazione. Sia q = (z0 , x0 ) ∈ Ω e siano B ⊂ Rl , B ⊂ Rn palle aperte centrate rispettivamente in z0 e x0 con B ×B ⊂ Ω. Allora x(t) = p+t(r −p) ∈ B per t ∈ [0, 1], se p, r ∈ B. Fissiamo z ∈ B e applichiamo il teorema di Lagrange alla funzione [0, 1] t → Fk (z, x(t)):
n ∂Fk
(rj − pj ) , Fk (z, r) − Fk (z, p) = Fk (z, x(1)) − Fk (z, x(0)) = ∂xj (z,x(ξ)) j=1 dove (z, x(ξ)) ∈ B × B. Applicando la disuguaglianza di Schwarz:
2 n
n
∂F
k
|Fk (z, r) − Fk (z, p)| ≤ |rj − pj |2
∂xi
j=1
i=1
(z,x(ξ))
Esercizi
79
2 n
∂F
k ≤ ||r − p||
≤ Mk ||r − p|| se (z, r), (z, p) ∈ B × B ,
∂xi (z,x(ξ)) i=1
Mk < +∞ esiste dato che le funzioni sotto radice sono continue sul compatto B × B. Dato che B × B `e un intorno aperto del punto generico (z0 , x0 ) ∈ Ω, la funzione F `e localmente lipschitziana nella variabile x, valendo: m ||F (z, x1) − F (z, x2 )|| ≤ Mk2 ||x1 − x2 || se (z, x1 ), (z, x2 ) ∈ B × B . k=1
Osservazione 2.122. Questa dimostrazione del teorema di esistenza ed unicit`a per il problema di Cauchy richiede la validit`a della condizione di Lipschitz locale sulla funzione f in (2.53), per poter usare il teorema del punto fisso. In realt` a tale richiesta, per il solo problema di esistenza non `e necessaria. Un teorema di esistenza pi` u generale, dovuto a Peano, pu` o essere dimostrato (usando il teorema 2.34 di Arzel` a-Ascoli) assumendo la sola continuit`a di f [KoFo80]. La non validit` a della propriet` a di Lipschitz pregiudica per` o, in generale, l’unicit` a della soluzione, come `e evidente per il controesempio classico: dx = f(x(t)) , x(0) = 0 dt √ dove la funzione f : R → R, definita come f(x) = 0 se x ≤ 0 e f(x) = x per x > 0, `e continua ma non `e localmente lipschitziana in x = 0. Tale problema di Cauchy ammette due soluzioni (entrambe massimamente estese): (1) x1 (t) = 0 per ogni t ∈ R (2) x2 (t) = 0 se t ≤ 0, ma x2 (t) = t2 /4 se t > 0.
Esercizi 2.1. Provare che ogni seminorma p soddisfa p(x) = p(−x). 2.2. Dimostrare che se S `e uno spazio vettoriale di funzioni limitate sull’insieme X a valori in C (oppure tutte a valori in R), allora l’applicazione: S f → ||f||∞ := sup |f(x)| x∈X
definisce una norma su S. 2.3. Dimostrare che lo spazio delle funzioni complesse limitate L(X) e quello delle funzioni complesse misurabili e limitate Mb (X) (vedi gli esempi 2.39) sullo spazio topologico X, sono spazi di Banach rispetto alla norma || ||∞.
80
2 Spazi normati e spazi di Banach, esempi e applicazioni
Soluzione. Facciamo la dimostrazione per Mb (X), dato che quella per L(X) ´e uguale. Sia {fn }n∈N ⊂ Mb (X) una successione di Cauchy, mostriamo che converge uniformemente a f ∈ Mb (X). Per ipotesi, la successione dei numeri {fn (x)}n∈N sar`a di Cauchy, per ogni x ∈ X. In questo modo esister`a f : X → C tale che fn (x) → f(x) se n → +∞ per ogni x ∈ X. Tale funzione sar`a misurabile perch`e limite di funzioni misurabili. Non resta da dimostrare che f deve essere una funzione limitata e che fn → f in senso uniforme. Partiamo dalla prova della seconda propriet` a. Vale: |f(x) − fm (x)| = lim |fn (x) − fm (x)| ≤ lim ||fn − fm ||∞ , n→+∞
n→+∞
ma, usando il fatto che la successione iniziale `e di Cauchy nella norma || ||∞, abbiamo che, per ogni > 0 esiste N tale che: lim ||fn − fm ||∞ < se m > N .
n→+∞
Quindi: |f(x) − fm (x)| < se m > N e per qualsiasi x ∈ X. In altre parole ||f −fm ||∞ → 0 per m → +∞ come volevamo. A questo punto, la limitatezza di f `e ovvia: sup |f(x)| ≤ sup |f(x) − fm (x)| + sup |fm (x)| < + ||fm ||∞ < +∞ .
x∈X
x∈X
x∈X
2.4. Dimostrare che gli spazi di Banach (L(X), || ||∞) e (Mb (X), || ||∞) (vedi gli esempi 2.39) sono algebre di Banach con unit` a. Traccia della soluzione. Evidentemente l’unit` a `e la funzione che vale ovunque 1. La propriet` a ||f · g||∞ ≤ ||f||∞||g||∞ segue dalla definizione di || ||∞, tutte le altre richieste sono banalmente soddisfatte. 2.5. Dimostrare che lo spazio delle funzioni complesse continue che si annullano all’infinito C0 (X) (vedi gli esempi 2.39) sullo spazio topologico X, `e un’algebra di Banach rispetto alla norma || ||∞. Discutere se tale algebra contiene o no l’unit` a. Soluzione. Sia {fn }n∈N ⊂ C0 (X) una successione di Cauchy, mostriamo che converge uniformemente a f ∈ C0 (X). Per ipotesi, la successione dei numeri {fn (x)}n∈N sar`a di Cauchy, per ogni x ∈ X. In questo modo esister`a f : X → C tale che fn (x) → f(x) se n → +∞ per ogni x ∈ X. La prova del fatto che ||f − fn ||∞ → 0 se n → +∞ `e la stessa che per l’esercizio 2.3. Dato che il limite uniforme di funzioni continue `e una funzione continua, non resta che verificare che f ∈ C0 (X). Fissato > 0, sia n tale che ||f − fn || < /2 e sia K ⊂ X un compatto con |fn (x)| < /2 se x ∈ X \ K . Per costruzione: |f(x)| ≤ |f(x) − fn (x)| + |fn (x)| < se x ∈ X \ K .
Esercizi
81
Le propriet`a che rendono lo spazio di Banach trovato un’algebra di Banach rispetto alle solite operazioni si dimostrano banalmente. Per costruzione l’unit` a, se esiste deve essere la funzione che vale ovunque 1. Se X `e compatto, la funzione che vale ovunque 1 appartiene a allo spazio. Se X non `e compatto, non pu` o appartenere allo spazio, perch´e gli elementi dello spazio C0 (X) si possono rimpicciolire a piacimento fuori dai compatti in X e questo non `e possibile per una funzione costante. 2.6. Dimostrare che lo spazio delle funzioni complesse continue e limitate Cb (X) (vedi gli esempi 2.39) sullo spazio topologico X, `e uno spazio di Banach rispetto alla norma || ||∞ ed `e anche un’algebra di Banach con unit` a. 2.7. Dimostrare che nella proposizione 2.27 vale in realt`a il “se e solo se”. In altre parole, dimostrare che la proposizione detta pu`o essere completata come segue. Sia (X, || ||) unospazio normato. (X, || ||) `e uno spazio di Banach se e so+∞ lo se ogni serie n=0 xn di elementi di X che converge assolutamente (cio`e +∞ n=0 ||xn|| < +∞) converge a qualche elemento di X. +∞ Soluzione. Si consideri una serie n=0 xn di elementi di X che sia assolutamente convergente. Allora la successione delle ridotte delle norme dovr`e essere una successione di Cauchy. In altre parole, per ogni > 0, esiste M > 0 con
n m
||xj || − ||xj ||
< , se n, m > M .
j=0 j=0 Supponendo n ≥ m sar`a allora:
n
||xj ||
< ,
j=m+1
se n, m > M .
Di conseguenza:
m n
n
n
xj − x j
=
x j
≤ ||xj || <
j=m+1
j=m+1
j=0 j=0
se n, m > M .
Abbiamo in questo modo provato che la successione delle somme parziali n x ` e di Cauchy. Dato che lo spazio `e completo, la serie converger`a a n j=0 un elemento di X. 2.8. Dimostrare che lo spazio delle funzioni complesse continue a supporto compatto Cc(X) (vedi gli esempi 2.39) sullo spazio topologico X, non `e, in generale, uno spazio di Banach rispetto alla norma || ||∞ e non `e nemmeno denso in Cb (X) se X non `e compatto.
82
2 Spazi normati e spazi di Banach, esempi e applicazioni
Traccia di soluzione. Nel primo caso `e sufficiente esibire un controesempio per X = R. Per esempio si consideri la successione di funzioni continue fn : R → C, n = 1, 2, . . . , definite come segue: fn (x) := sinx x se 0 < |x| < 2nπ, fn (0) = 1 e fn (x) = 0 nei rimanenti punti di R. Evidentemente questa successione di funzioni converge puntualmente alla funzione continua che vale sinx x su tutto R\ {0} e 1 nell’origine. La convergenza `e anche uniforme come `e facile provare. La funzione detta non ha supporto compatto. Per quanto riguarda la seconda questione, si osservi che ogni funzione costante c = 0 appartiene a Cc(X) in ogni caso, ma, se X non `e compatto ||f − c||∞ ≥ |c| > 0, per ogni funzione f ∈ Cc (X) a causa dei valori assunti dalle funzioni considerate fuori dal supporto di f. 2.9. Sia A un’algebra di Banach senza unit` a. Si consideri lo spazio vettoriale somma diretta A ⊕ C e si definisca su di esso il prodotto: (x, c) · (y, c ) := (x ◦ y + cy + c x, cc)
se (x , c ), (x, c) ∈ A ⊕ C
dove ◦ `e il prodotto in A. Si definisca anche la norma: ||(x, c)|| := ||x|| + |c| se (x, c) ∈ A ⊕ C. Mostrare che lo spazio vettoriale A ⊕ C dotato del prodotto e della norma definita sopra `e un’algebra di Banach con unit` a. 2.10. Si consideri un’algebra di Banach A con unit` a I ed un elemento a ∈ A con ||a|| < 1. Dimostrare che I − a ammette inverso, cio`e esiste b ∈ A tale che b(I − a) = (I − a)b = I. +∞ Suggerimento. Si consideri la serie n=0 an con a0 := I. Si dimostri che converge nella topologia di A e che la somma `e l’inverso di I − a. 2.11. (Difficile.) Dimostrare la disuguaglianza di H¨older:
|f(x)g(x)|dμ(x) ≤ X
dove p, q > 0 soddisfano 1 = misura positiva su X.
1/p
1/q q |f(x)| dμ(x) |g(x)| dμ(x) p
X 1 p
X
+ 1q , f e g sono funzioni misurabili e μ una
|f(x)| |g(x)|dμ(x), A := X 1/p 1/q q e B := . Se A (o B) `e nullo X |f(x)| dμ(x) X |g(x)| dμ(x) oppure infinito (adottando la convenzione che ∞ · 0 = 0 · ∞ = 0), la disuguaglianza `e banalmente vera. Mettiamoci allora nel caso che 0 < A, B < +∞ e definiamo: F (x) := |f(x)|/A, G(x) := |g(x)|/B. In questo modo
1 1 1 1 ln(F (x)G(x)) = ln(F (x)p ) + ln(G(x)q ) ≤ ln F (x)p + G(x)q , p q p q
Soluzione. p
Nel
seguito:
I
:=
Esercizi
83
dove, nell’ultimo passaggio, abbiamo usato il fatto che la funzione logaritmo `e una funzione convessa. Esponenziando abbiamo che: F (x)G(x) ≤
1 1 F (x)p + G(x)q . p q
Integrando e tenendo conto che l’integrale a secondo membro coincide con 1/p + 1/q = 1 si trova immediatamente la disuguaglianza di H¨older nella forma: |f(x)g(x)|dμ(x) X 1/p 1/q ≤ 1 . p q X |f(x)| dμ(x) X |g(x)| dμ(x) 2.12. (Difficile.) Facendo uso della disuguaglianza di H¨ older, dimostrare la disuguaglianza di Minkowski:
1/p
1/p
1/p |f(x) + g(x)|p dμ(x) ≤ |f(x)|p dμ(x) + |g(x)|pdμ(x) X
X
X
dove p ≥ 1, f e g sono funzioni misurabili e μ una misura positiva su X. p Soluzione. Nel seguito: I := := X |f(x) + g(x)| dμ(x), A 1/p 1/p p p |f(x)| dμ(x) e B := |g(x)| dμ(x) . La disuguaglianza ` e banalX X mente vera se p = 1 oppure nel caso in cui A o B siano infiniti. Supponiamo allora che p > 1 e A, B < +∞. In questo caso anche I deve essere finito. Ci`o segue dalla disuguaglianza numerica (a + b)p ≤ 2p (ap + bp ) valida per a, b ≥ 0 e p ≥ 15 . Infine, se I = 0, la disuguaglianza di Minkowski `e banalmente vera. Pertanto restringiamoci a studiare il caso: p > 1, A, B < +∞ e 0 < I < +∞. Osserviamo che: |f + g|p = |f| |f + g|p−1 + |g| |f + g|p−1 . Applicando la disuguaglianza di H¨ older a ciascuno dei due addendi a secondo membro abbiamo che: 1/q
p (p−1)q |f(x) + g(x)| dμ(x) ≤ |f(x) + g(x)| dμ(x) X
×
1 p
X
1/p
1/p , |f(x)|p dμ(x) + |g(x)|p dμ(x) X
1 q.
dove 1 = + La disuguaglianza ottenuta, nelle notazioni usate si scrive: 1/q I ≤ I (A + B), da cui, dividendo per I 1/q si ha: I 1/p ≤ A + B , che `e la disuguaglianza di Minkowski. 5 Questa si prova osservando che (a + b) ≤ 2 max{a, b}, per cui elevando alla potenza p: (a + b)p ≤ 2p max{ap , bp } ≤ 2p (ap + bp ).
84
2 Spazi normati e spazi di Banach, esempi e applicazioni
2.13. Si considerino due spazi normati di dimensione finita X, Y e T ∈ L(X, Y) = B(X, Y). Si fissino due basi in X e Y rispettivamente, in modo tale che T sia rappresentato da una matrice M (T ) rispetto a tali basi. Mostrare che, con una scelta naturale di basi negli spazi duali X e Y , l’operatore T `e individuato dalla matrice trasposta M (T )t . 2.14. Si consideri una coppia di spazi normati X, Y, con Y spazio di Banach, e un sottospazio S ⊂ X con S = X. Sia poi T : S → Y un operatore lineare limitato su S. Si dimostri che esiste un’unica estensione di T , T˜ : X → Y che sia continua. Soluzione. Se x ∈ X ci sar`a una successione {xn } di elementi di S che converge a x. Vale ||T xn − T xm || ≤ K||xn − xm || con K < +∞ per ipotesi. Dato che xn → x, la successione degli xn `e di Cauchy e quindi lo `e anche quella dei vettori T xn . Dato che Y `e completo, esiste dunque T˜x := limn→∞ T xn ∈ Y. Tale limite dipende solo da x e non dalla successione in S usata per approssimarlo: se S zn → x allora per la continuit` a delle norme || lim T xn − lim T zn || = lim ||T xn − T zn || ≤ lim K||xn − zn || n→+∞
n→+∞
n→+∞
n→+∞
= K||x − x|| = 0 . ˜ S = T , cio`e T˜ `e un’estensione di T e questo si prova scegliendo Ovviamente T per ogni x ∈ S la successione costante di termini xn := x che tende a x banalmente. Le propriet` a di linearit` a di T˜ sono di verifica immediata dalla stessa definizione. Infine prendendo il limite a n → +∞ ad ambo membri di ||T xn|| ≤ K||xn || si ricava che ||T˜x|| ≤ K||x|| per cui T˜ `e limitato. Veniamo alla prova dell’unicit` a. Se U `e un’altra estensione limitata di T su X allora, per ogni x ∈ X, per continuit` a T˜x − U x = limn→+∞ (T˜xn − U xn ) dove gli xn ˜ S = T = US il limite `e banale e appartengono a S (denso in X). Essendo T ˜ ˜ fornisce T x = U x per ogni x ∈ X ossia T = U . 2.15. In riferimento all’esercizio precedente, si provi che l’unica estensione limitata T˜ di T soddisfa anche ||T˜ || = ||T ||. Soluzione. Se x ∈ X e {xn } ⊂ S converge a x: ||T˜x|| = lim ||T xn || ≤ lim ||T ||||xn|| = ||T ||||x|| , n→+∞
n→+∞
per cui ||T˜ || ≤ ||T ||. Ma essendo anche S ⊂ X e T˜ S = T ,
||T˜x||
||T˜x||
˜ ||T || = sup
0 = x ∈ X ≥ sup
0 = x ∈ S ||x|| ||x||
||T x||
0 = x ∈ S . = sup ||x|| L’ultimo termine nella catena di identit` a scritta sopra `e ||T ||. Quindi ||T˜ || ≥ ||T ||. Allora ||T˜ || = ||T ||.
Esercizi
85
2.16. Dimostrare la proposizione 2.78. 2.17. Considerando lo spazio B(X) per uno spazio normato X, si provi che la topologia forte `e pi` u forte di quella debole (cio`e gli aperti della topologia debole sono aperti anche nella topologia forte) e che la topologia uniforme `e pi` u forte della topologia forte. 2.18. Dimostrare le proposizioni 2.82, 2.83, 2.84 e 2.85. 2.19. Se X `e uno spazio normato, dimostrare che se {xn }n∈N ⊂ X tende debolmente a x ∈ X (vedi proposizione 2.82), allora l’insieme {xn }n∈N `e limitato. Suggerimento. Applicare il corollario 2.74. 2.20. Provare che se B `e uno spazio di Banach e T, S ∈ B(B) allora: (i) (T S) = S T , (ii) (T )−1 = (T −1 ) se T `e biettivo. 2.21. Dimostrare che se X e Y sono spazi di Banach riflessivi e se T ∈ B(X, Y), allora (T ) = T . 2.22. Se definiamo un isomorfismo di spazi normati come un’applicazione lineare continua con inversa continua, la propriet` a di completezza di uno spazio normato `e invariante sotto isomorfismi? Suggerimento. Estendere la proposizione 2.110 al caso di due spazi normati connessi da un’applicazione lineare continua con inversa continua.
3 Spazi di Hilbert e operatori limitati Non ci sono teoremi profondi, solo teoremi che non abbiamo capito molto bene. Nicholas P. Goodman
In questa sezione introdurremo le prime nozioni matematiche relative agli spazi di Hilbert che ci serviranno per dare un fondamento matematico alla MQ. Una parte importante del capitolo sar` a dedicata alla nozione di base hilbertiana (detta anche sistema ortonormale completo), che tratteremo nel modo pi` u generale possibile, non assumendo obbligatoriamente la separabilit`a dello spazio di Hilbert. Prima di tale nozione discuteremo il teorema pi` u importante della teoria degli spazi di Hilbert: il teorema della rappresentazione di Riesz, che prova che esiste un anti isomorfismo naturale tra uno spazio di Hilbert ed il suo duale topologico. La terza parte del capitolo, sar` a dedicata a discutere la nozione di operatore aggiunto (nel caso di operatori limitati), introdotta tramite il teorema di Riesz, e tutte le sue fondamentali conseguenze nella teoria degli operatori limitati. Introdurremo in particolare la nozione di C ∗ -algebra (di operatori ed in senso astratto) e nelle esemplificazioni presenteremo la struttura di algebra di von Neumann, citando il celebre teorema del doppio commutante. In tale sezione introdurremo le classi degli operatori autoaggiunti, unitari e normali, discutendone le loro propriet` a elementari. La quarta sezione sar` a interamente dedicata alla nozione di proiettore ortogonale e alle propriet`a elementari pi` u importanti di tali tipi di operatori. La penultima sezione sar`a dedicata all’importante teorema di decomposizione polare per operatori limitati definiti su tutto lo spazio di Hilbert. Come strumento tecnico, sar`a introdotta la nozione di radice quadrata positiva di un operatore limitato. L’ultima sezione riguarder`a la teoria elementare della trasformata di Fourier e di Fourier-Plancherel, che introdurremo in modo molto rapido e conciso, senza fare riferimento (purtroppo) alla teoria delle distribuzioni di Schwartz (si vedano a tal proposito [Rud91, ReSi80, Vla81]).
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
88
3 Spazi di Hilbert e operatori limitati
3.1 Nozioni elementari, teorema di Riesz e riflessivit` a In questa sezione ci occuperemo delle nozioni e dei risultati elementari della teoria degli spazi di Hilbert partendo dalle definizioni elementari di prodotto scalare hermitiano e spazio con prodotto scalare hermitiano. 3.1.1 Spazi con prodotto scalare e spazi di Hilbert Definizione 3.1. Se X `e uno spazio vettoriale sul campo complesso, un’applicazione S : X × X → C si dice prodotto scalare hermitiano e (X, S) spazio con prodotto scalare, quando S soddisfa: H0. S(u, u) ≥ 0 per ogni u ∈ X, H1. S(u, αv + βw) = αS(u, v) + βS(u, w) per ogni α, β ∈ C e u, v, w ∈ X, H2. S(u, v) = S(v, u) per ogni u, v ∈ X, H3. S(u, u) = 0 ⇒ u = 0, per ogni u ∈ X. Se valgono H0, H1, H2 ma non necessariamente H3, S si dice semiprodotto scalare hermitiano. Due vettori u, v ∈ X si dicono ortogonali, e si scrive u ⊥ v, se S(u, v) = 0. In tal caso si dice anche che u `e ortogonale (o, equivalentemente, normale) a v e che v `e ortogonale (o, equivalentemente, normale) a u. Se ∅ = K ⊂ X, lo spazio ortogonale a K `e: K ⊥ := {u ∈ X | u ⊥ v , per ogni v ∈ K} . Osservazioni 3.2. (1) H1 e H2 implicano insieme che S sia antilineare nel primo argomento: S(αv + βw, u) = αS(v, u) + βS(w, u)
per ogni α, β ∈ C e u, v, w ∈ X.
(2) Dalla H2 segue che u `e ortogonale a v se e solo se v `e ortogonale a u. (3) Si verifica immediatamente che K ⊥ `e un sottospazio vettoriale di X per la propriet` a H1, per cui il termine spazio ortogonale `e appropriato. (4) In ogni spazio (X, S) con prodotto scalare hermitiano, dalla definizione di ortogonale, segue immediatamente l’utile propriet`a che useremo molto spesso: K ⊂ K1
⇒
K1⊥ ⊂ K ⊥
se K, K1 ⊂ X.
(5) Nel seguito, quando ci`o non sar`a fonte di fraintendimenti, “(semi) prodotto scalare” significher`a sempre “(semi) prodotto scalare hermitiano”. Proposizione 3.3. Sia X uno spazio vettoriale su C con semi prodotto scalare S. (a) Vale la disuguaglianza di Cauchy-Schwarz: |S(x, y)|2 ≤ S(x, x)S(y, y)
se x, y ∈ X ;
(3.1)
(i) in (3.1) vale il segno di uguaglianza se x e y sono linearmente dipendenti,
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
89
(ii) se S `e prodotto scalare, in (3.1) vale il segno di uguaglianza se e solo se x e y sono linearmente dipendenti. (b) Al variare di x ∈ X, p(x) := S(x, x) (3.2) definisce una seminorma, ovvero una norma se S `e un prodotto scalare, che si dice essere indotta da S. (c) p soddisfa l’identit` a del parallelogramma: p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 )
se x, y ∈ X .
(3.3)
(d) vale l’identit` a di polarizzazione: S(x, y) =
1 (p(x + y) − p(x − y) − ip(x + iy) + ip(x − iy)) 4
se x, y ∈ X . (3.4)
Dimostrazione. (a) Se α ∈ C vale, usando le propriet` a del semiprodotto scalare, 0 ≤ S(x − αy, x − αy) = S(x, x) − αS(x, y) − αS(y, x) + |α|2S(y, y) . (3.5) Supponiamo S(y, y) = 0. In tal caso, ponendo α := S(x, y)/S(y, y), da (3.5) si ottiene: 0 ≤ S(x, x) − |S(x, y)|2 /S(y, y) , che `e la tesi. Se S(y, y) = 0, da (3.5) troviamo invece che deve comunque valere, per ogni α ∈ C: 0 ≤ S(x, x) − αS(x, y) − αS(y, x) .
(3.6)
Scegliendo α ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.6) `e impossibile a meno che S(x, y)+S(y, x) = 0. Scegliendo poi α = iλ con λ ∈ R sufficientemente grande in valore assoluto, si vede che la disuguaglianza (3.5) pu` o valere solo se oltre all’identit` a S(x, y) = −S(y, x) provata sopra, vale anche S(x, y) − S(y, x) = 0 e quindi S(x, y) = 0. In definitiva, se S(y, y) = 0 vale ancora (3.1) perch´e S(x, y) = 0. Se x e y sono linearmente dipendenti allora vale x = αy oppure y = αx per qualche α ∈ C. Si verifica immediatamente che in tal caso i due membri di (3.1) sono uguali. Supponiamo ora che S sia un prodotto scalare e che valga |S(x, y)|2 = S(x, x)S(y, y), proviamo che esistono α, β ∈ C non entrambi nulli, per cui αx + βy = 0. Se almeno uno dei due vettori x, y `e nullo ci` o `e banalmente vero. Mettiamoci allora nel caso in cui entrambi i vettori siano non nulli, per cui S(x, x) > 0 < S(y, y) per H3. In tal caso, ridefinendo u = x/ S(x, x) e v = y/ S(y, y), vale |S(u, v)| = 1 e quindi S(u, v) = eiη per qualche η ∈ R. Per H3, α u + β v = 0 equivale a S(α u + β v, α u + β v) = 0 e cio`e: |α |2 + |β |2 + α β eiη + β α e−iη = 0 .
90
3 Spazi di Hilbert e operatori limitati
Scegliendo α = eiμ e β = eiν in modo che −μ + ν + η = π, l’identit` a di iμ sopra risulta essere vera e quindi, come volevamo, se α := e S(y, y) e iν β := e S(x, x) allora α, β = 0 e αx + βy = 0. (b) Tutte le propriet` a delle seminorme si verificano immediatamente dalla definizione di p e dalle propriet` a del prodotto scalare, eccetto la disuguaglianza triangolare N2 che proviamo ora. Dalle propriet` a del prodotto scalare risulta subito che p(x + y)2 = p(x)2 + 2ReS(x, y) + p(y)2 , dove Re indica la parte reale. Dato che: ReS(x, y) ≤ |S(x, y)|, per la (3.1), vale anche ReS(x, y) ≤ p(x)p(y). Sostituendo nell’identit` a trovata sopra, si ottiene: p(x + y)2 ≤ p(x)2 + 2p(x)p(x) + p(y)2 , ossia p(x, y)2 ≤ (p(x) + p(y))2 , che implica N2. La propriet` a N3 segue immediatamente da H3, nel caso S sia un prodotto scalare. Gli enunciati in (c) e (d) si verificano immediatamente usando la definizione di p e le propriet` a del prodotto scalare. Osservazioni 3.4. (1) La disuguaglianza di Cauchy-Schwarz ha come diretta conseguenza il fatto che un prodotto scalare S : X × X → C sia una funzione continua sullo spazio X × X dotato della topologia prodotto, quando su X si usi la topologia indotta dalla norma associata al prodotto scalare tramite la norma (3.2). In particolare il prodotto scalare `e anche continuo nei suoi singoli argomenti separatamente. (2) Nel caso in cui il campo di X sia R invece di C, sussistono definizioni analoghe a quelle della definizione 3.1, definendo un prodotto scalare reale S : X × X → R che soddisfa H0, H1 e H3, ma rimpiazzando H2 con la condizione di simmetria: H2’. S(u, v) = S(v, u) per ogni u, v ∈ X. La nozione di semi prodotto scalare reale si ottiene ancora da quella di prodotto scalare reale lasciando cadere la condizione H3. (3) Si prova facilmente che la proposizione 3.3 continua a valere nel caso di (semi) prodotto scalare reale, con l’unico cambiamento che l’identit`a di polarizzazione `e: 1 S(x, y) = (p(x + y) − p(x − y)) , (3.7) 4 se il campo dello spazio vettoriale `e R.
Un noto risultato – ma poco spesso esplicitamente dimostrato – `e il seguente teorema dovuto a Fr´echet, von Neumann e Jordan. La dimostrazione si trova (svolta) negli esercizi 3.1-3.3.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
91
Teorema 3.5. Sia X uno spazio vettoriale complesso e sia p : X → R una norma (seminorma). p soddisfa l’identit` a del parallelogramma (3.3) se e solo se esiste – ed in tal caso `e unico – un prodotto scalare (rispettivamente, un semi prodotto scalare) S che induce p tramite (3.2). Dimostrazione. Se la norma (seminorma) `e indotta da un prodotto scalare hermitiano allora l’identit` a del parallelogramma (3.3) `e valida per (c) in proposizione 3.3. La dimostrazione del fatto che se vale (3.3) allora esiste un prodotto scalare (semi prodotto scalare) S che induce p tramite (3.2) `e data nella soluzione degli esercizi 3.1-3.3. Passiamo a definire la nozione di isomorfismo di spazi con prodotto scalare. Definizione 3.6. Se (X, SX ) e (Y, SY ) sono spazi con prodotto scalare, un’applicazione lineare L : X → Y `e detta isometria se soddisfa: SY (L(x), L(y)) = SX (x, y)
per ogni x, y ∈ X.
Se l’isometria L : X → Y `e suriettiva `e detta isomorfismo di spazi con prodotto scalare. Se esiste un isomorfismo (L) di spazi con prodotto scalare dallo spazio X allo spazio Y, tali spazi si dicono isomorfi (secondo L). Osservazione 3.7. ` chiaro che ogni isometria L : X → Y `e iniettiva per H3, ma pu` E o non essere suriettiva (anche quando X = Y, se la dimensione dello spazio X non `e finita). Inoltre ogni isometria `e ovviamente continua rispetto alle due topologie dei due spazi normati (con norme indotte dai prodotti scalari) e, se `e suriettiva (cio`e se `e un isomorfismo), la sua inversa `e ancora un’isometria (e quindi un isomorfismo). Dato che uno spazio con prodotto scalare `e anche uno spazio normato, esistono due nozioni di isometria, in riferimento ad una trasformazione lineare L : X → Y. Una `e riferita alla conservazione del prodotto scalare ed `e quella definita sopra, l’altra `e quella valida per gli spazi normati (definizione 2.21) e corrisponde alla richiesta, riferita alle norme indotte dai prodotti scala` chiaro che il primo tipo di isometria ri: ||Lx||Y = ||x||X per ogni x ∈ X. E `e anche del secondo tipo. Dall’identit` a di polarizzazione (3.4), si dimostra immediatamente che, in realt`a, queste due nozioni sono equivalenti. Proposizione 3.8. Un operatore lineare L : X → Y, con X e Y spazi con prodotto scalare, `e un’isometria nel senso della definizione 3.6 se e solo se soddisfa: ||Lx||Y = ||x||X per ogni x ∈ X, dove le norme sono quelle associate ai prodotti scalari dei corrispondenti spazi di Hilbert.
92
3 Spazi di Hilbert e operatori limitati
Notazione 3.9. Nel seguito, se non sar`a specificato altrimenti, ( | ) denoter`a un prodotto scalare e || || la norma indotta da esso come in proposizione 3.3 Possiamo infine dare la definizione pi` u importante di tutto il libro: quella di spazio di Hilbert. Definizione 3.10. Uno spazio vettoriale sul campo complesso con prodotto scalare hermitiano si dice spazio di Hilbert se `e spazio di Banach rispetto alla norma indotta dal prodotto scalare. Un isomorfismo di spazi con prodotto scalare tra due spazi di Hilbert `e detto: (i) isomorfismo di spazi di Hilbert o, equivalentemente, (ii) trasformazione unitaria o, equivalentemente, (iii) operatore unitario. Deve essere chiaro che se U : H → H1 `e un isomorfismo di spazi con prodotto scalare, H1 `e uno spazio di Hilbert se e solo se `e tale H. In tal caso U `e una trasformazione unitaria. Vale un teorema del completamento analogo a quello visto per spazi di Banach. Teorema 3.11. (Del completamento per spazi di Hilbert.) Sia X uno spazio vettoriale sul campo C dotato di un prodotto scalare S. (a) Esiste uno spazio di Hilbert (H, ( | )), detto completamento di X, tale che X si identifica con un sottospazio denso (rispetto alla topologia di H indotta dalla norma associata al prodotto scalare ( | )) di H tramite un’applicazione lineare iniettiva J : X → H che estende il prodotto scalare S in ( | ). In altre parole, esiste un’applicazione lineare iniettiva J : X → H con J(X) = H
e
(J(x)|J(y)) = S(x, y) per ogni x, y ∈ X.
(b) Se la terna (J1 , H1 , ( | )1 ) con J1 : X → H1 lineare isometrica e (H1 , ( | )1 ) spazio di Hilbert `e tale che X si identifica con un sottospazio denso di H1 tramite J1 estendendo il prodotto scalare S in ( | )1 , allora esiste ed `e unico una trasformazione unitaria φ : H → H1 tale che J1 = φ ◦ J. Schema della dimostrazione. (a) Conviene usare il teorema del completamento per gli spazi di Banach e costruire il completamento di Banach dello spazio normato (X, N ) dove N (x) := S(x, x). Dato che S `e continuo e X `e denso nel completamento secondo la funzione lineare J, S induce un semi prodotto scalare (|) sul completamento di Banach H. In realt` a, (|) `e un prodotto scalare su H in quanto, sempre per continuit` a, risulta indurre la stessa norma dello spazio di Banach. Di conseguenza H `e spazio di Hilbert e la funzione lineare J che identifica X con un sottospazio denso di H soddisfa le propriet` a prescritte nella tesi. (b) La dimostrazione `e essenzialmente uguale a quella data nel caso di spazi di Banach.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
93
Esempi 3.12. n (1) Cn dotato del prodotto scalare (u|v) := i=1 ui vi , dove u = (u1 , . . . , un ) e v = (v1 , . . . , vn ), `e uno spazio di Hilbert. (2) Un esempio di spazio di Hilbert estremamente importante in fisica si ricava da (6) in esempi 2.39: lo spazio L2 (X, μ), dove X `e uno spazio con misura positiva σ-additiva μ su una σ-algebra Σ. Sappiamo che L2 (X, μ) `e uno spazio di Banach rispetto alla norma: ||f||2 := f(x)f(x)dμ(x) X
essendo f un qualsiasi rappresentante della classe di equivalenza [f] ∈ L2 (X, μ) (al solito, nel seguito, scriveremo f in luogo di [f]). Se f, g ∈ L2 (X, μ), la disuguaglianza di H¨ older (vedi (6) in esempi 2.39) implica immediatamente che deve essere f(x)g(x) ∈ L1 (X, μ), pertanto: f(x)g(x)dμ(x) se f, g ∈ L2 (X, μ) (3.8) (f|g) := X
`e ben definito. Le propriet` a elementari dell’integrale provano che il secondo ` ovvio membro di (3.8) definisce un prodotto scalare hermitiano su L2 (X, μ). E 2 che tale prodotto scalare induce la norma || ||2. Quindi L (X, μ) `e uno spazio di Hilbert rispetto al prodotto scalare (3.8). (3) Nel caso in cui X = N e μ `e la misura che conta i punti (vedi (7) in esempi 2.39), si ha, come sottocaso dell’esempio precedente, lo spazio di Hilbert di successioni complesse a quadrato sommabile 2 (N) con: ( {xn }n∈N | {yn }n∈N ) :=
+∞
xn yn .
n=0
3.1.2 Il teorema di Riesz e le sue conseguenze Vogliamo arrivare a provare che gli spazi di Hilbert sono riflessivi. Per fare ci`o dobbiamo introdurre alcuni utili strumenti legati al concetto di spazio ortogonale, e dobbiamo provare il famoso teorema di Riesz. Ricordiamo la seguente definizione di insieme convesso. Definizione 3.13. Se ∅ = K ⊂ X, con X spazio vettoriale, K `e detto convesso se: λu + (1 − λ)v ∈ K
se λ ∈ [0, 1] e u, v ∈ K.
Chiaramente ogni sottospazio di X `e convesso, ma non tutti i sottoinsiemi convessi di X sono sottospazi di X: una palla aperta (di raggio finito) in spazio normato `e un insieme convesso che non `e sottospazio. Per il prossimo teorema, ricordiamo che se K ⊂ X, < K > denota il sottospazio di X generato da K e K indica la chiusura di K.
94
3 Spazi di Hilbert e operatori limitati
Teorema 3.14. Sia (H, ( | )) spazio di Hilbert e K ⊂ H un sottoinsieme non vuoto. (a) K ⊥ `e un sottospazio chiuso di H. ⊥ (b) K ⊥ =< K >⊥ = < K >⊥ = < K > . (c) Se K `e chiuso e convesso, allora per ogni x ∈ H esiste ed `e unico PK (x) ∈ K tale che ||x − PK (x)|| = min{||x − y|| | y ∈ K}, dove || || denota la norma indotta da ( | ). (d) Se K `e un sottospazio chiuso, allora ogni x ∈ H si decompone in modo unico come zx + yx con zx ∈ K e yx ∈ K ⊥ e quindi vale: H = K ⊕ K⊥ .
(3.9)
Infine risulta zx := PK (x) definito in (c). (e) (K ⊥ )⊥ = < K >. Osservazione 3.15. In realt` a (a) e (b) valgono anche se lo spazio non `e di Hilbert ma solo spazio vettoriale con prodotto scalare e la topologia `e quella indotta dal prodotto scalare. Prova del teorema 3.14. (a) K ⊥ `e sottospazio per le propriet`a di (anti)linearit` a del prodotto scalare. Dalla continuit`a del prodotto scalare segue subito che se {xn } ⊂ K ⊥ converge a x ∈ H allora (x|y) = 0 per ogni y ∈ K, per cui x ∈ K ⊥ . Quindi K ⊥ `e chiuso contenendo tutti i suoi punti di accumulazione. (b) La dimostrazione della prima identit`a (partendo da sinistra) `e ovvia per definizione di ortogonale e dalla linearit` a (antilinearit` a) del prodotto scalare. La seconda identit`a segue quindi immediatamente da (a). Riguardo all’ultima identit`a notiamo che sicuramente, essendo < K >⊂ < K > vale ⊥ ⊥ < K >⊥ ⊃ < K > . D’altra parte < K >⊥ ⊂ < K > per la continuit` a del ⊥ prodotto scalare. Di conseguenza < K >⊥ = < K > , che conclude la catena di uguaglianze avendo gi` a provato che < K >⊥ = < K >⊥ . (c) Sia 0 ≤ d = inf y∈K ||x − y||, che esiste perch´e l’insieme dei numeri ||x − y|| con y ∈ K `e limitato inferiormente e non vuoto. Sia {yn } ⊂ K una successione di punti per cui ||x − yn || → d. Mostriamo che si tratta di una successione di Cauchy. Dall’identit` a del parallelogramma (3.3), con x e y in tale formula sostituiti con x − yn e x − ym rispettivamente, segue che ||yn − ym ||2 = 2||x − yn ||2 + 2||x − ym ||2 − ||2x − yn − yn ||2 . Osserviamo ora che ||2x − yn − yn ||2 = 4||x − (yn + ym )/2||2 ≥ 4d2 , dato che yn /2+ym /2 ∈ K nell’ipotesi di convessit`a di K e che d `e l’estremo inferiore dei numeri ||x − y|| se y ∈ K. Fissato > 0, prendendo n e m grandi a sufficienza avremo che vale: ||x − yn ||2 ≤ d2 + , ||x − ym ||2 ≤ d2 + , da cui ||yn − ym ||2 ≤ 4(d2 + ) − 4d2 = 4 . Quindi la successione `e di Cauchy. Essendo H completo, yn converge a qualche y ∈ K dato che K `e chiuso. Per la continuit` a della norma d = ||x − y||.
3.1 Nozioni elementari, teorema di Riesz e riflessivit`a
95
Mostriamo che y ∈ K `e l’unico punto che soddisfa d = ||x − y||. Ogni altro y ∈ K con la stessa propriet`a soddisfa, dall’identit` a del parallelogramma: ||y − y ||2 = 2||x − y||2 + 2||x − y ||2 − ||2x − y − y ||2 ≤ 2d2 + 2d2 − 4d2 = 0 , dove abbiamo ancora usato ||2x − y − y||2 = 4||x − (y + y)/2||2 ≥ 4d2 (dato che y/2 + y /2 ∈ K nell’ipotesi di convessit`a di K e che d `e l’estremo inferiore dei numeri ||x − z|| se z ∈ K). Valendo ||y − y || = 0 deve essere y = y . Quindi PK (x) := y soddisfa tutte le richieste. (d) Sia x ∈ H e x1 ∈ K a distanza minima da x. Poniamo x2 := x − x1 e mostriamo che x2 ∈ K ⊥ . Sia y ∈ K, la funzione R t → f(t) := ||x−x1 +ty||2 ha un minimo per t = 0. Si noti che tale fatto vale nell’ipotesi che K sia sottospazio, per cui −x1 + ty ∈ K per ogni t ∈ R se x1 , y ∈ K. Quindi la sua derivata si annulla in t = 0: f (0) = lim
t→0
||x2 + ty||2 − ||x2||2 = (x2 |y) + (y|x2 ) = 2Re(x2 |y) . t
Di conseguenza Re(x2 |y) = 0. Sostituendo y con iy si ricava che anche la parte immaginaria di (x2 |y) vale zero, per cui (x2 |y) = 0 e x2 ∈ K ⊥ . Con questo abbiamo provato che < K, K ⊥ >= H. Non resta che mostrare che K ∩ K ⊥ = {0}. Ma questo `e ovvio dal fatto che se x ∈ K ∩ K ⊥ allora x deve essere ortogonale a x allora ||x||2 = (x|x) = 0 e quindi x = 0. (e) Se y ∈ K, allora y `e ortogonale ad ogni elemento di K ⊥ ; per linearit` a e continuit` a del prodotto scalare questo vale anche se y ∈ < K >. In altre parole < K > ⊂ (K ⊥ )⊥ . (3.10) Usando (d) e sostituendo al posto di K il sottospazio chiuso < K > otteniamo ⊥ che H = < K > ⊕ < K > . Ossia, tenendo conto di (b) H = < K > ⊕ K⊥ .
(3.11)
Se u ∈ (K ⊥ )⊥ , in base alla (3.11) c’`e una decomposizione fatta di vettori ortogonali ((u0 |v) = 0) u = u0 + v con u0 ∈ < K > e v ∈ K ⊥ e quindi (u|v) = (v|v). Valendo (u|v) = 0 (perch´e u ∈ (K ⊥ )⊥ e v ∈ K ⊥ ) deve essere (v|v) = 0 e dunque (K ⊥ )⊥ u = u0 ∈ < K >. Concludiamo che < K > ⊃ (K ⊥ )⊥ da cui la tesi valendo (3.10). Il teorema provato ha il seguente corollario che segue immediatamente da (b) e (d). Corollario 3.16. (Del teorema 3.14.) Se S `e un sottoinsieme di uno spazio di Hilbert H, < S > `e denso in H se e solo se S ⊥ = {0}. Possiamo ora enunciare e provare il teorema dovuto a F. Riesz, che `e sicuramente il teorema pi` u importante della teoria degli spazi di Hilbert.
96
3 Spazi di Hilbert e operatori limitati
Teorema 3.17. (Di Riesz.) Sia (H, ( | )) spazio di Hilbert. Per ogni funzionale lineare continuo f : H → C esiste ed `e unico yf ∈ H tale che: f(x) = (yf |x)
per ogni x ∈ H .
La funzione H f → yf ∈ H `e biettiva. Dimostrazione. Proviamo che per ogni f ∈ H esiste yf ∈ H suddetto. Il nucleo di f, Kerf := {x ∈ H | f(x) = 0}, `e un sottospazio chiuso dato che f `e continuo. Dato che H `e spazio di Hilbert, vale H = Kerf ⊕ (Kerf)⊥ per il teorema 3.14. Se Kerf = H definiamo yf = 0 e la dimostrazione finisce. Se Kerf = H mostriamo che (Kerf)⊥ ha dimensione 1. Sia 0 = y ∈ (Kerf)⊥ . In f(z) tal caso f(y) = 0 (y ∈ Kerf!). Per ogni z ∈ (Kerf)⊥ , il vettore z − f(y) y cade ⊥ ⊥ in (Kerf) perch´e combinazione lineare di elementi di (Kerf) , ma anche f(z) z − f(y) y ∈ Kerf come si verifica immediatamente dalla linearit` a di f. Quindi z − f(z) y ∈ Kerf ∩ (Kerf)⊥ e dunque z − f(z) y = 0. Quindi y `e una base per f(y) f(y) ⊥ (Kerf) dato che ogni altro vettore z ∈ (Kerf)⊥ `e una combinazione lineare di y: z = f(z) e come sopra, definiamo: f(y) y. Se y ` yf :=
f(y) y (y|y)
e mostriamo che yf rappresenta f nel senso voluto. Se x ∈ H, possiamo decomporre x rispetto alla decomposizione Kerf ⊕ (Kerf)⊥ ottenendo: x = n + x⊥ , dove f(x) f(x⊥ ) x⊥ = y= y f(y) f(y) per quanto provato sopra ed avendo tenuto conto del fatto che f(x⊥ ) = f(x) per linearit` a essendo f(n) = 0. Vale quindi, come si voleva:
f(y)
f(x) f(y) (y|y) (yf |x) = y n + y =0+ f(x) = f(x) . (y|y) f(y) f(y) (y|y) L’applicazione H f → yf ∈ H `e iniettiva, cio`e f individua yf univocamente: se (y|x) = (y |x) per ogni x ∈ K allora (y − y |x) = 0 per ogni x ∈ K e, scegliendo x = y − y , segue che: ||y − y ||2 = (y − y |y − y ) = 0. Da cui y = y . L’applicazione H f → yf ∈ H `e suriettiva, dato che, per ogni y ∈ H, la funzione H x → (y|x) definisce un elemento di H per linearit` a e continuit`a del prodotto scalare. Corollario 3.18. (Del teorema di Riesz.) Ogni spazio di Hilbert `e riflessivo. Dimostrazione. Prima di tutto notiamo che possiamo mettere su H un prodotto scalare definito come, se f, g ∈ H , (f|g) := (yg |yf ), dove f(x) = (yf |x)
3.2 Basi hilbertiane
97
e g(x) = (yg |x) per ogni x ∈ H. Si osservi che la norma indotta da ( | ) in H coincide con la norma naturale di H , ||f|| := sup |f(x)| , ||x||=1
rispetto alla quale H `e completo per il teorema 2.54. Infatti questa definizione si pu` o scrivere, per il teorema 3.17: ||f|| = sup |(yf |x)| ; ||x||=1
la disuguaglianza di Cauchy-Schwarz implica subito che ||f|| ≤ ||yf ||, inoltre vale |(yf |x)| = ||yf || se x = yf /||yf ||. Quindi ||f|| = ||yf ||, ma quest’ultima `e proprio, come volevamo, la norma di f indotta dal prodotto scalare ( | ) . Quindi (H , ( | ) ) `e uno spazio di Hilbert e (H ) il suo duale. Il teorema 3.17 assicura che gli elementi di (H ) , F , sono tutti e soli quelli per cui esiste qualche gF ∈ H tale che F (f) = (gF |f) per ogni f ∈ H . Ma (gF |f) = (yf |ygF ) = f(ygF ). Abbiamo cio`e che, per ogni F ∈ (H ) , esiste (ed `e unico per il corollario 2.69 del teorema di Hahn-Banach) un vettore ygF ∈ H tale che, per ogni f ∈ H : F (f) = f(ygF ) . Questa propriet` a altro non `e che la riflessivit`a di H.
Osservazione 3.19. Dalla dimostrazione del corollario, risulta che lo spazio duale topologico H dotato del prodotto scalare ( | ) , definito come (f|g) := (yg |yf ), `e uno spazio di Hilbert. L’applicazione H f → yf ∈ H risulta essere anti-lineare, iniettiva e suriettiva e preserva il prodotto scalare per costruzione. In questo senso H e H sono anti isomorfi.
3.2 Basi hilbertiane Passiamo ora ad introdurre tutto l’armamentario matematico relativo al concetto di base hilbertiana. Si tratta, come ben noto, della generalizzazione, nel caso infinito dimensionale, della nozione di base ortonormale. Noi lavoreremo nel caso completamente generale di spazio di Hilbert non necessariamente separabile in cui le basi hilbertiane possono avere cardinalit` a qualsiasi, anche non numerabile. Abbiamo bisogno di qualche risultato preliminare sul significato della somma infinita su insiemi, in generale non numerabili, di numeri non negativi. Chiameremo insieme indicizzato, e lo indicheremo con {αi }i∈I , ogni applicazione I i → αi . L’insieme I `e detto insieme degli indici; la coppia (i, αi ), indicata impropriamente come αi , `e detta elemento i-esimo dell’insieme indicizzato. Si osservi che pu`o accadere che αi = αj con i = j.
98
3 Spazi di Hilbert e operatori limitati
Definizione 3.20. Se A = {αi }i∈I `e un insieme non vuoto di numeri reali non negativi indicizzati sull’insieme I di cardinalit` a arbitraria, la somma dell’insieme indicizzato A `e il numero in [0, +∞) ∪ {+∞} definito come: ⎫ ⎧
⎬ ⎨
(3.12) αi := sup αj
F ⊂ I , F finito . ⎭ ⎩
i∈I j∈F Osservazione 3.21. D’ora in poi un insieme si dir` a numerabile quando pu` o essere messo in corrispondenza biunivoca con l’insieme dei numeri naturali N. Quindi il caso numerabile non include il caso finito. Proposizione 3.22. In riferimento alla definizione 3.20 vale quanto segue. (a) Se I `e finito onumerabile, la somma dell’insieme indicizzato A coincide con la somma i∈I αi , ovvero, rispettivamente, con la somma della se+∞ rie n=0 αin (che converge sempre, al pi` u a +∞, essendo serie di termini non negativi) indipendentemente dall’ordinamento, cio`e dalla funzione biettiva N n → in ∈ I. (b) Se la somma dell’insieme A `e finita, allora il sottoinsieme di I per cui αi = 0 `e finito o numerabile. In tal caso, restringendosi al sottoinsieme detto, la somma di A coincide con la somma su un insieme finito di indici o, rispettivamente, la somma di una serie come precisato in (a). (c) Se μ `e la misura che conta i punti di I definita sulla σ-algebra dell’insieme della parti di I (se J ⊂ I allora μ(J) ≤ +∞ `e il numero di elementi di J per definizione), allora: αi = αi dμ(i) . (3.13) i∈I
A
Dimostrazione. (a) Il caso di I finito `e ovvio; consideriamo il caso di I infinito numerabile e supponiamo di avere scelto un particolare ordinamento di I, per cui possiamo riscrivere A come A = {αin }n∈N . Mostriamo che la somma della +∞ serie di elementi {αin }n∈N , n=0 αin , coincide con la somma nel senso (3.12) che, per definizione, non dipende dall’ordinamento scelto. Vale, per (3.12): N
α in ≤
n=0
αi .
i∈I
E quindi, prendendo il limite per N → +∞, che esiste e coincide con l’estremo superiore dell’insieme delle ridotte della serie, essendo non decrescente la successione delle ridotte: +∞ α in ≤ αi . (3.14) n=0
i∈I
D’altra parte, se F ⊂ I `e finito, possiamo sempre fissare NF sufficientemente grande in modo tale che {αi }i∈F ⊂ {αi0 , αi1 , αi2 , . . . , αiNF }. In tal modo i∈F
αi ≤
NF n=0
α in .
3.2 Basi hilbertiane
99
Prendendo l’estremo superiore di entrambi i membri della disuguaglianza precedente al variare degli insiemi F ⊂ I finiti, e ricordando che l’estremo superiore dell’insieme delle ridotte coincide con la somma della serie, abbiamo: i∈I
αi ≤
+∞
α in .
(3.15)
n=0
Le (3.14) e (3.15) implicano la tesi. (b) sia S < +∞, S ≥ 0, la somma dell’insieme indicizzato A. Se S = 0, tutti gli elementi di A devono essere nulli e la tesi `e verificata banalmente. Si supponga ` chiaro che ogni αi `e contenuto in [0, S] – altrimenti la somma che S > 0. E sarebbe maggiore di S – e in particolare, se αi = 0, allora αi ∈ (0, S]. Poniamo Sn := S/n per n = 1, 2, . . .. Se Nk `e il numero di elementi i ∈ I per cui αi cade nell’intervallo (Sk+1 , Sk ], sicuramente S ≥ Sk+1 Nk e quindi Nk `e finito per ogni k. Essendo ∪+∞ k=1 (Sk+1 , Sk ] = (0, S] tutti gli αi = 0 sono contati al variare di k = 1, 2, . . .. Tali valori possono essere al pi` u una quantit` a numerabile, dato che: (i) gli intervalli (Sk+1 , Sk ] sono numerabili e (ii) ciascuno di essi contiene una quantit` a finita di αi = 0. (c) Notando che ogni funzione `e misurabile rispetto alla misura detta (dato che la σ-algebra `e l’insieme delle parti) l’identit`a (3.13) `e immediata conseguenza della definizione di integrale di una funzione positiva [Rud82]. Passiamo a definire, in vari passi, il concetto di sistema ortonormale completo anche detto base hilbertiana. Definizione 3.23. Sia (X, ( | )) spazio con prodotto scalare e ∅ = N ⊂ X. (a) N `e detto insieme ortogonale se (i) N 0 e (ii) x ⊥ y se x, y ∈ N con x = y. (b) N `e detto insieme ortonormale se `e ortogonale e (x|x) = 1 per ogni x ∈ N. Se (H, ( | )) `e spazio di Hilbert, N ⊂ H `e detto sistema ortonormale completo o, equivalentemente, base hilbertiana, se `e un insieme ortonormale e soddisfa: N ⊥ = {0} . (3.16) ` chiaro che un insieme di vettori ortogonali N `e liOsservazione 3.24. E nearmente indipendente: seF ⊂ N `e finito e 0 = x∈F αx x, allora 0 = ( x∈F αx x| y∈F αy y) = x∈F y∈F αx αy (x|y) = x∈F |αx|2 ||x||2. Dato che ||x|| > 0 e |αx|2 ≥ 0, deve necessariamente essere |αx| = 0, e quindi αx = 0, per ogni x ∈ F . Teorema 3.25. (Disuguaglianza di Bessel.) Se (X, ( | )) `e spazio con prodotto scalare e N ⊂ X `e un insieme ortonormale, vale: |(x|z)|2 ≤ ||x||2 per ogni x ∈ X . (3.17) z∈N
In particolare solo una quantit` a numerabile di elementi (x|z) sono non nulli.
100
3 Spazi di Hilbert e operatori limitati
Dimostrazione. Per la definizione 3.20 e per (b) della proposizione 3.22, la tesi `e vera se (3.17) vale per i sottoinsiemi F ⊂ N finiti. Sia dunque F = n {z1 , . . . , zn }, x ∈ X e α1 , . . . , αn ∈ C. Sviluppando la norma ||x− k=1 αk zk ||2 in termini del prodotto scalare di X e tenendo conto dell’ortonormalit`a degli elementi zp e zq e delle propriet`a di (anti-)linearit` a del prodotto scalare, si trova subito che:
2 n n n n
2 2 αk zk
= ||x|| + |αk | − αk (x|zk ) − αk (x|zk ) .
x −
k=1
k=1
k=1
k=1
Il secondo membro pu`o riscriversi come: ||x||2 −
n
|(x|zk )|2 +
k=1
n
|(x|zk )|2 − αk (x|zk ) − αk (x|zk ) + |αk |2
.
k=1
Abbiamo trovato che:
2 n n n
2 2 αk zk
= ||x|| − |(x|zk )| + | (zk |x) − αk |2 .
x −
k=1
k=1
k=1
` chiaro che il secondo membro ha un unico minimo assoluto per αk = (zk |x), E k = 1, . . . , n. In tal caso si ottiene proprio:
2 n n
0 ≤
x − (zk |x)zk
= ||x||2 − |(x|zk )|2 ,
k=1
k=1
da cui, come volevamo provare: n
|(x|zk )|2 ≤ ||x||2 .
k=1
Lemma 3.26. Sia {xn }n∈N un insieme ortogonale numerabile indicizzato su N nello spazio di Hilbert (H, ( | )). Sia || || la norma indotta da ( | ). Se +∞
||xn ||2 < +∞ ,
(3.18)
n=0
allora: (a) esiste, ed `e unico, x ∈ H tale che +∞
xn = x ,
(3.19)
n=0
dove la convergenza della serie `e intesa come convergenza della successione delle ridotte nella topologia associata a || ||.
3.2 Basi hilbertiane
101
(b) la serie in (3.20) pu` o essere riordinata, cio`e, per ogni f : N → N biettiva, +∞
xf(n) = x .
(3.20)
n=0
n a di ortonormalit` a dei Dimostrazione. (a) Sia An := k=0 xk ; dalle propriet` vettori xk e dalla definizione della norma in termini di prodotto scalare segue subito che, se n > m, allora: ||An − Am ||2 =
n
||xk ||2 .
k=m+1
Dato che la serie a secondo membro converge per ipotesi, ||An − Am ||2 =
n
||xk ||2 ≤
k=m+1
+∞
||xk ||2 → 0 per m → +∞
k=m+1
e questo implica immediatamente che la successione delle ridotte {An } sia di Cauchy. Dato che H `e completo, esister`a x ∈ H limite di tali successioni e quindi, per definizione, limite della serie. Dato che H `e spazio normato, vale la propriet` a di Hausdorff che implica l’unicit` a dei limiti e quindi in particolare quella di x. n (b) Si fissi f : N → N biettiva. Poniamo come sopra An := k=0 xn e σn := +∞ n 2 e la sue k=0 xf(n) . La serie a termini positivi k=0 ||xf(k) || converge perch´ ridotte sono maggiorate dalle ridotte della serie convergente a termini positivi +∞ 2 ||x || . Come conseguenza di (a), esister` a il limite in H delle ridotte k k=0 σn , ovvero anche la serie riordinata converger`a in H. Mostriamo che la serie riordinata converge sempre a x. Se definiamo rn := max{f(0), f(1), . . . , f(n)}, vale allora ||xk ||2 ||Arn − σn ||2 ≤ k∈Jn
dove Jn si ottiene eliminando dall’insieme {0, 1, 2, . . . , max{f(0), f(1), . . . , f(n)}} ` chiaro che, per la biettivit` i numeri f(0), f(1), . . . , f(n). E a della funzione, i numeri che rimangono corrisponderanno ad alcuni elementi dell’insieme infinito {f(n + 1), f(n + 2), . . .} . Di conseguenza ||Arn − σn ||2 ≤
k∈Jn
||xk ||2 ≤
+∞ k=n+1
||xf(k)||2 .
(3.21)
102
3 Spazi di Hilbert e operatori limitati
Dato che
+∞ k=0
||xf(k)||2 < +∞, (3.21) implica che: lim (Arn − σn ) = 0 .
n→+∞
D’altra parte vale anche rn ≥ n (dato che f `e iniettiva, se fosse: max{f(0), f(1), . . . , f(n)} < n , gli f(n) dovrebbero essere n + 1 numeri interi non negativi strettamente inferiori a n e questo `e impossibile) e quindi limn→+∞ rn = +∞ per cui: x = lim An = lim Arn = lim σn . n→+∞
n→+∞
n→+∞
Questo conclude la dimostrazione.
Possiamo quindi enunciare e dimostrare il teorema fondamentale delle basi hilbertiane. Tale teorema prova che le basi hilbertiane soddisfano propriet` a che sono dirette generalizzazioni di quelle delle basi ortonormali negli spazi vettoriali di dimensione finita dotati di prodotto scalare. La differenza `e che ora sono ammesse, usando la topologia di H, anche combinazioni lineari infinite: ogni elemento dello spazio di Hilbert pu`o essere scritto in modo univoco come una combinazione lineare infinita di elementi di una base hilbertiana. Si deve osservare che, indipendentemente dal fatto che negli spazi di Hilbert esistano tali basi hilbertiane, esistono comunque, come conseguenza del lemma di Zorn (o assioma della scelta) anche basi algebriche che non richiedono alcuna nozione topologica. La differenza tra le basi hilbertiane e quelle algebriche `e quindi che le seconde riguardano solo combinazioni lineari finite: ogni elemento dello spazio vettoriale (in questo caso di Hilbert) pu`o essere scritto in modo univoco come una combinazione lineare finita degli elementi della base (che comunque sono infiniti). Teorema 3.27. Sia (H, ( | )) spazio di Hilbert e N ⊂ H un insieme ortonormale. I seguenti fatti sono equivalenti. (a) N `e una base hilbertiana (ossia N `e insieme ortonormale e N ⊥ = {0}). (b) Fissato x ∈ H, una quantit` a al pi` u numerabile di numeri (z|x) `e non nulla per z ∈ N e vale: x= (z|x)z , (3.22) z∈N
dove la convergenza della serie `e intesa come convergenza della successione delle ridotte nella topologia indotta dal prodotto scalare. (c) Fissati x, y ∈ H, una quantit` a al pi` u numerabile di numeri (z|x), (y|z) `e non nulla se z ∈ N e vale: (x|y) = (x|z)(z|y) . (3.23) z∈N
3.2 Basi hilbertiane
103
(d) Se x ∈ H, vale, nel senso della definizione 3.20: ||x||2 =
|(z|x)|2 .
(3.24)
z∈N
(e) < N > = H, cio`e il sottospazio generato da N `e denso in H. Se vale una delle propriet` a equivalenti dette sopra, in (3.22) e (3.23) non conta l’ordine con cui si etichettano i coefficienti (x|z), (z|x) = (x|z) e (z|y) non nulli. Dimostrazione. (a) ⇒ (b). Per il teorema 3.25 solo una quantit`a al pi` u numerabile di coefficienti (z|x) `e non nullo. Indichiamo con (zn |x) tali coefficienti, n ∈ N, e N e per costruzione poniamo SN := n=0 (zn |x)zn . L’insieme {(zn |x)zn }n∈N ` ortogonale, inoltre essendo ||z || = 1 la disuguaglianza di Bessel implica che n +∞ 2 ||(z |x)z || < +∞. Usando (a) del lemma 3.26 segue che la serie (3.22) n n n=0 +∞ o esseconverge ad un unico x ∈ H con x = n=0 (zn |x)zn . Inoltre la serie pu` re riordinata pur convergendo allo stesso x per (b) di lemma 3.26. Mostriamo che x = x. Dalla linearit` a e continuit` a del prodotto scalare si ha che, se z ∈ N : (x − x |z ) = (x|z ) −
(x|z)(z|z ) = (x|z ) − (x|z ) = 0
z∈N
dove si `e tenuto conto del fatto che l’insieme dei coefficienti z costituisce un insieme ortonormale. Dato che z ∈ N `e arbitrario, x − x ∈ N ⊥ e quindi x − x = 0 in quanto N ⊥ = {0} per ipotesi. Questo prova che (3.22) vale indipendentemente dall’ordine con cui si etichettano i coefficienti (z|x) = 0. (b) ⇒ (c). Se (b) `e valida, (c) `e una sua ovvia conseguenza dovuta alla continuit` a e (anti-)linearit` a del prodotto scalare e al fatto che N `e ortonormale. (c) ⇒ (d). (d) `e un caso particolare di (c) quando y = x. (d) ⇒ (a). Se (d) `e vera e se x ∈ H `e tale che (x|z) = 0 per ogni z ∈ N , allora ||x|| = 0 ossia x = 0. In altre parole N ⊥ = {0}, cio`e vale (a). Abbiamo provato che (a),(b),(c) e (d) sono equivalenti. Per concludere notiamo che (b) implica immediatamente (e), mentre (e) implica (a): se x ∈ N ⊥ allora, per la linearit` a del prodotto scalare, x ∈ < N >⊥ ⊂ < N >⊥ . Ma per ⊥ (b) del teorema 3.14 < N >⊥ = < N > . Essendo < N > = H per ipotesi, x ∈ H⊥ = {0}. In altre parole, essendo N ⊥ = {0}, vale (a). Il fatto che la serie di numeri complessi in (3.23) pu` o essere riordinata arbitrariamente conservandone la somma si ottiene dal seguente ragionamento. Si consideri l’insieme: A := {z | (x|z) = 0 oppure (y|z) = 0} .
104
3 Spazi di Hilbert e operatori limitati
Tale insieme `e numerabile. La disuguaglianza di Cauchy-Schwarz in 2 (A) produce: |(x|z)||(z|y)| ≤ ( |(x|z)|2)1/2 ( |(y|z)|2 )1/2 < +∞ z∈A
z∈A
z∈A
o essere riordiper (d). Quindi la serie z∈N (x|z)(z|y) = z∈A (x|z)(z|y) pu` nata arbitrariamente perch´e `e assolutamente convergente. Il lemma di Zorn implica immediatamente che ogni spazio di Hilbert ammette una base hilbertiana. Teorema 3.28. Ogni spazio di Hilbert ammette una base hilbertiana. Dimostrazione. Sia H uno spazio di Hilbert. Consideriamo la classe A i cui elementi sono gli insiemi ortonormali in H. Definiamo in A la relazione d’ordine parziale data dall’inclusione insiemistica. Per costruzione ogni sottoinsieme ordinato E di A `e superiormente limitato dall’elemento costituito dall’unione degli elementi di E. Per il lemma di Zorn esiste allora in A un elemento massimale N . Con le definizioni date, la massimalit` a di N implica che non ci sono in H vettori normali a tutti gli elementi di N , non nulli e non appartenenti a N stesso. In altre parole, N `e un sistema ortonormale completo. Prima di passare al caso degli spazi di Hilbert separabili, diamo ancora un importante risultato della teoria generale. Teorema 3.29. Sia H uno spazio di Hilbert con base hilbertiana N . Valgono i seguenti fatti. (a) H `e isomorfo come spazio di Hilbert a L2 (N, μ) dove μ `e la misura positiva che conta i punti di N (vedi (6) e (7) in esempi 2.39 e (2) in esempi 3.12); la trasformazione unitaria che identifica i due spazi `e data dall’applicazione H x → {(z|x)}z∈N ∈ L2 (N, μ) .
(3.25)
(b) Tutte le basi hilbertiane di H hanno la stessa cardinalit` a (pari a quella di N ), che si dice dimensione dello spazio di Hilbert. (c) Se H1 `e spazio di Hilbert con la stessa dimensione di H, allora i due spazi sono isomorfi come spazi di Hilbert. Dimostrazione. (a) L’applicazione U : H x → {(z|x)}z∈N ∈ L2 (N, μ) `e ben definita, in quanto, se x ∈ H e N `e una base hilbertiana, allora vale la propriet` a (d) del teorema 3.27, la quale afferma proprio che {(z|x)}z∈N ∈ L2 (N, μ). Tale applicazione `e sicuramente iniettiva: se x, x ∈ H producono gli stessi coefficienti (z|x) = (z|x ) per ogni z ∈ N , allora x = x per (b) 2 del teorema 3.27. L’applicazione `e anche suriettiva: se {αz }z∈N ∈L (N, μ) e quindi z∈N |αz |2 < +∞, allora per il lemma 3.26 esiste x := z∈N αz z e (z|x) = αz per la continuit` a del prodotto scalare e l’ortonormalit`a dell’insieme N . Infine (c) del teorema 3.27 implica che U sia isometrica. Pertanto U : H →
3.2 Basi hilbertiane
105
L2 (N, μ) `e un operatore unitario e quindi H e L2 (N, μ) sono isomorfi come spazi di Hilbert. (b) Se una delle basi hilbertiane ha cardinalit` a finita c, allora essa `e anche base algebrica di H. Con la geometria elementare si prova che se esiste una base con cardinalit` a finita c, allora ogni altro insieme di vettori linearmente indipendenti M ha cardinalit` a ≤ c e = c se e solo se M genera finitamente tutto lo spazio. Tenendo conto che ogni base hilbertiana, in quanto insieme ortogonale, `e costituita da vettori linearmente indipendenti, si conclude facilmente che ogni base hilbertiana di H deve avere cardinalit` a sicuramente ≤ c e quindi = c perch´e genera (finitamente) H. Quanto detto esclude anche il caso in cui, in H, una base hilbertiana abbia cardinalit` a finita ed un’altra abbia cardinalit` a infinita. Siano dunque N e M basi hilbertiane di H entrambe di cardinalit` a infinita. Se x ∈ M , definiamo Nx := {z ∈ N | (x|z) = 0}. Dato che 1 = (z|z) = x∈M |(z|x)|2, deve accadere che per ogni z ∈ N esiste x ∈ M tale che z ∈ Nx . Quindi N ⊂ ∪x∈M Nx e allora la cardinalit` a di N sar`a inferiore o uguale a quella di ∪x∈M Nx che coincide con quella di M dato che ogni insieme Nx `e al pi` u numerabile per (b) del teorema 3.27. Quindi la cardinalit` a di N `e inferiore o uguale a quella di M . Scambiando i ruoli di N ed M si ottiene anche che la cardinalit`a di M `e inferiore o uguale a quella di N . Il teorema di Schr¨ oder-Bernstein implica infine che la cardinalit` a di M e quella di N coincidano. (c) Siano N e N1 due basi hilbertiane di H e H1 rispettivamente, e si supponga che N e N1 abbiano la stessa cardinalit` a. Allora esiste un’applicazione biettiva che identifica i punti di N con quelli di N1 e tale applicazione genera naturalmente un isomorfismo di spazi con prodotto scalare V dallo spazio L2 su N allo spazio L2 su N1 rispetto alla misura che conta i punti che `e quindi un isomorfismo tra spazi di Hilbert. Se U1 : H1 → L2 (N1 , μ) `e l’isomorfismo analogo a U : H → L2 (N, μ) descritto sopra, U V U1−1 : H1 → H `e una trasformazione unitaria per costruzione e dunque H e H1 sono isomorfi come spazi di Hilbert. Di particolare interesse in fisica sono i cosiddetti spazi di Hilbert separabili. Definizione 3.30. Uno spazio di Hilbert si dice separabile se ammette un insieme denso e numerabile. Vale un ben noto e utile teorema di caratterizzazione. Teorema 3.31. Sia H spazio di Hilbert. (a) H `e separabile se e solo se ha dimensione finita oppure ammette una base hilbertiana numerabile. (b) Se H `e separabile, tutte le basi hilbertiane sono finite con lo stesso numero di elementi pari alla dimensione dello spazio, oppure sono tutte numerabili. (c) Se H `e separabile `e isomorfo a Cn dotato del prodotto scalare hermitiano standard con n finito pari alla dimensione di H, oppure `e isomorfo a 2 (N). Dimostrazione. (a) Se lo spazio di Hilbert ammette una base hilbertiana finita o numerabile, allora, in base a (b) del teorema 3.27, tenendo conto che i
106
3 Spazi di Hilbert e operatori limitati
razionali con segno sono densi nei reali, si ha subito che esiste un insieme denso numerabile. Tale insieme `e ovviamente quello costituito dalle combinazioni lineari finite di elementi della base usando come coefficienti numeri complessi di parte reale ed immaginaria razionale con segno. Lasciamo i dettagli della facile dimostrazione al lettore. Supponiamo viceversa che uno spazio di Hilbert sia separabile. Sappiamo che, per il teorema 3.28, esistono sempre basi hilbertiane in tale spazio: mostriamo che ciascuna di esse deve essere al pi` u numerabile. Supponiamo per assurdo che N sia base hilbertiana non numerabile per lo spazio di Hilbert H separabile. Scelti z, z ∈ N con z = z , ogni punto x ∈ H `e tale che, per la disuguaglianza triangolare riferita alla norma indotta dal prodotto scalare: ||z − z || ≤ ||x − z || + ||z − x||. D’altra parte essendo {z, z } un 2 2 insieme ortonormale ||z − z ||2 = √ (z − z |z − z ) = ||z|| + ||z || + 0 = 1 + 1 = 2. Quindi ||x − z|| + ||x − z || ≥ √2. Questo risultato implica immediatamente che palle aperte di raggio < 2/2 centrate rispettivamente in z e z sono disgiunte comunque scegliamo z, z ∈ N con z = z . Sia {B(z)}z∈N una classe di tale palle disgiunte a due a due e ciascuna centrata sul rispettivo z ∈ N . Se D ⊂ H `e l’insieme denso e numerabile che esiste per l’ipotesi di separabilit`a, dovr` a accadere che, per ogni z ∈ N , esiste x ∈ D con x ∈ B(z). Dato che le palle sono disgiunte, avremo un diverso x per ogni palla. Ma la cardinalit` a di {B(z)}z∈N non `e numerabile, per cui nemmeno D pu` o essere numerabile e questo `e assurdo. (b) e (c) sono immediate conseguenze del teorema 3.29. Tuttavia, per completezza diamo una traccia di una dimostrazione di esse. (b) Come `e noto dalla teoria elementare, se una base (hilbertiana o no) ha un numero finito di elementi, allora tutte le altre basi (hilbertiane o no) hanno lo stesso numero di elementi pari alla dimensione dello spazio; inoltre, tutti gli insiemi di vettori linearmente indipendenti (come le basi hilbertiane) contengono un numero di elementi che non supera la dimensione dello spazio. Da questo fatto segue immediatamente che, se uno spazio di Hilbert `e separabile ed una sua base hilbertiana `e finita, allora tutte le basi hilbertiane dello spazio sono finite con lo stesso numero di elementi pari alla dimensione dello spazio. Nelle stesse ipotesi, se una base hilbertiana `e numerabile allora tutte le altre basi hilbertiane devono essere numerabili per (a). (c) Fissata una base hilbertiana N ed usando il teorema3.27, si verifica immediatamente che l’applicazione che trasforma H x = u∈N αu u nell’insieme (finito o infinito a seconda del caso) {αu }u∈N `e un isomorfismo di spazi con prodotto scalare da H a Cn , oppure, da H a 2 (N), a seconda che la dimensione di H sia finita oppure non lo sia. Un’altra utile proposizione per spazi di Hilbert separabili `e la seguente. Proposizione 3.32. Sia (H, ( | )) spazio di Hilbert con H = {0}. Valgono i seguenti fatti. (a) Se Y := {yn }n∈N `e un insieme di vettori linearmente indipendenti e tali che Y ⊥ := {0} o equivalentemente < Y > = H, allora H `e separabile ed
3.2 Basi hilbertiane
107
esiste una base hilbertiana di H, X := {xn }n∈N , tale che, per ogni p ∈ N, il sottospazio generato dai vettori y0 , y1 , . . . , yp coincide con quello generato dai vettori x0 , x1 , . . . , xp. (b) Se H `e separabile e S ⊂ H `e un sottospazio (non chiuso) di H denso in H, allora S contiene una base hilbertiana di H. Dimostrazione. (a) Diamo solo una traccia della dimostrazione perch´e si tratta essenzialmente della procedura di ortogonalizzazione di Gramm-Schmidt, nota dai corsi di geometria elementare [Ser94I]. Per ipotesi `e y0 = 0. Poniamo quindi x0 := y0 /||y0 ||. Successivamente consideriamo il vettore non nullo (perch´e y0 e y1 sono linearmente indipendenti) ` chiaro che x0 , z1 sono non nulli, ortogonali (quindi z1 := y1 − (x0 |y1 )x0 . E linearmente indipendenti) e generano la stesso spazio di y0 e y1 . Non resta che porre x1 := z1 /||z1 || per ottenere l’insieme ortonormale {x0 , x1 } che genera lo stesso spazio di y0 , y1 . Possiamo ora ripetere la procedura definendo induttivamente l’insieme di vettori: zn := yn −
n−1
(xk |yn )xk ,
k=0
e quindi quello dei vettori xn := zn /||zn ||. Per induzione si verifica facilmente che i vettori z0 , . . . , zk sono non nulli, ortogonali (quindi linearmente indipendenti) e generano lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk ; di conseguenza i vettori x0 , . . . , xk formano un insieme ortonormale che genera lo stesso spazio generato dai vettori linearmente indipendenti y0 , . . . , yk . Se u ⊥ yn per ogni n ∈ N, allora vale anche (scrivendo gli xn come combinazione lineare di y0 , . . . , yn ) u ⊥ xn per ogni n ∈ N e viceversa (scrivendo ogni yn come combinazione lineare di x0 , . . . , xn). Quindi X ⊥ = Y ⊥ = {0} e dunque X `e una base hilbertiana per H. (b) S deve contenere un sottoinsieme S0 numerabile e denso in H. Sia infatti {yn }n∈N un insieme denso e numerabile in H. Per ogni yn ci sar`a una successione {xnm}m∈N ⊂ S tale che xnm → yn per m → +∞. Si verifica subito che il sottoinsieme numerabile di S, S0 := {xnm}(n,m)∈N×N , `e ancora denso in H. Rietichettiamo gli elementi di S0 sui naturali in modo che x1 = 0. Avremo dunque S0 = {xq }q∈N e dividiamo S0 in due sottoinsiemi S1 , che conterr`a almeno x1 per definizione, e S2 nel modo seguente. Se x2 `e linearmente indipendente da x1 includiamo x2 in S1 altrimenti lo includiamo in S2 . Se x3 `e linearmente indipendente dagli elementi in S1 lo includiamo in S1 altrimenti lo includiamo in S2 . Procediamo in questo modo per tutti gli elementi di S0 . S1 conterr`a, per costruzione, un insieme di generatori di S0 . In questo modo < S1 >=< S0 >⊃ S0 sar`a un insieme denso in H e composto da vettori linearmente indipendenti. Inoltre, visto che S ⊃ S1 `e sottospazio vettoriale, posto Y := S0 , avremo che la procedura di costruzione di un sistema ortonormale completo tramite combinazioni lineari finite di elementi di Y descritta in (a), produce una base hilbertiana di elementi di S stesso.
108
3 Spazi di Hilbert e operatori limitati
Esempi 3.33. (1) Consideriamo lo spazio di Hilbert L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.12), dove dx `e la solita misura di Lebesgue sui boreliani di R e L > 0. Consideriamo le funzioni misurabili (perch´e continue) definite come, per n ∈ Z e x ∈ [−L/2, L/2], 2πn ei L x fn (x) := √ . (3.26) L Si verifica immediatamente che le funzioni fn appartengono allo spazio considerato e costituiscono un insieme ortonormale rispetto al prodotto scalare di L2 ([−L/2, L/2], dx) (vedi (2) in esempi 3.12): L/2 (f|g) := f(x)g(x)dx . (3.27) −L/2
Consideriamo l’algebra di Banach di funzioni continue C([−L/2, L/2]) (che `e sottospazio di L2 ([−L/2, L/2], dx)) con norma data dalla norma dell’estremo superiore ((4) e (5) in esempi 2.39). Il sottospazio vettoriale S di C([−L/2, L/2]) generato da tutti i vettori fn , n ∈ Z, `e una sottoalgebra di C([−L/2, L/2]). S contiene 1, `e chiusa rispetto alla coniugazione complessa e, come `e facile provare, separa i punti di [−L/2, L/2] (l’insieme delle funzioni fn da solo separa i punti), per cui, per il teorema 2.40 di StoneWeierstrass, `e densa in C([−L/2, L/2]). D’altra parte `e noto che le funzioni continue di [−L/2, L/2] costituiscono uno spazio vettoriale denso in L2 ([−L/2, L/2], dx) nella topologia di quest’ultimo ([Rud82] p.85); infine la topologia di C([−L/2, L/2]) `e pi` u forte di quella di L2 ([−L/2, L/2], dx), va2 lendo (f|f) ≤ L sup |f| = L(sup |f|)2 se f ∈ C([−L/2, L/2]). Ne consegue che S `e denso in L2 ([−L/2, L/2], dx). Per (e) del teorema 3.27, i vettori fn costituiscono una base hilbertiana di L2 ([−L/2, L/2], dx), che di conseguenza risulta anche essere separabile. (2) Consideriamo lo spazio di Hilbert L2 ([0, 1], dx), dove dx `e la misura di Lebesgue. Come nell’esempio precedente l’algebra di Banach C([0, 1]) `e sottospazio denso in L2 ([0, 1], dx) nella topologia di quest’ultimo. Definiamo ora, diversamente dall’esempio precedente, per n = 0, 1, 2, . . ., x ∈ [0, 1]: gn (x) := xn .
(3.28)
Si dimostra subito che i vettori scritti sopra sono linearmente indipendenti. Il sottospazio vettoriale S di C([0, 1]) generato da tutti i vettori gn , n ∈ N, `e una sottoalgebra di C([0, 1]). S contiene 1, `e chiusa rispetto alla coniugazione complessa e separa i punti, per cui, per il teorema 2.40 di Stone-Weierstrass, `e densa in C([0, 1]) e anche in L2 ([0, 1], dx), ragionando come nell’esempio precedente. La differenza dal caso precedente `e che ora che le funzioni gn non costituiscono un insieme ortonormale. Tuttavia, usando la proposizione 3.32 si costruisce immediatamente un sistema ortonormale completo per L2 ([0, 1], dx). Gli elementi di tale base hilbertiana si chiamano i polinomi di Legendre.
3.2 Basi hilbertiane
109
(3) I due esempi precedenti esibiscono due spazi L2 separabili. Si pu` o provare che Lp (X, μ) (1 ≤ p < +∞) `e separabile se e solo se la misura μ `e separabile nel senso che segue. Si consideri lo spazio metrico (definizione 2.88) costruito sul sottoinsieme della σ-algebra Σ della misura μ contenente insiemi di misura finita, prendendo il quoziente rispetto alla relazione di equivalenza che identifica insiemi che differiscono per insiemi di misura nulla, e infine definendo la distanza come: d(A, B) := μ((A \ B) ∪ (B \ A)) . La misura μ `e detta separabile se lo spazio metrico suddetto ammette un sottoinsieme denso e numerabile. A tal fine vale la seguente proposizione sulle misure separabili [Hal69]. Proposizione 3.34. (Su misure e spazi Lp separabili.) Una misura positiva σ-additiva μ, e quindi Lp (X, μ), `e separabile se μ `e σ-finita (cio`e X `e unione numerabile di insiemi di misura finita) ed esiste una classe al pi` u numerabile di insiemi misurabili la σ-algebra generata dai quali coincide con quella della misura μ. Si osservi che, di conseguenza, vale come corollario la seguente proposizione. Proposizione 3.35. (Su misure di Borel e spazi Lp separabili.) Ogni misura di Borel σ-finita riferita ad uno spazio topologico a base numerabile produce spazi Lp separabili. In particolare questo accade per la misura di Lebesgue su Rn ristretta ai boreliani e quindi anche per gli Lp riferiti alla misura di Lebesgue stessa, dato che tali spazi Lp sono isomorfi, come spazi di Banach, ai corrispondenti ottenuti dalla misura ristretta alla σ-algebra di Borel (le eventuali funzioni misurabili aggiunte cadono nella classe di equivalenza della funzione nulla). Le misure di Borel positive σ-additive definite su spazi di Hausdorff localmente compatti si chiamano misure di Radon se sono regolari e i compatti hanno misura finita. Una misura di Radon `e σ-finita se lo spazio su cui `e definita `e σ-compatto, cio`e unione numerabile di compatti. (4) Consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione dopo avere introdotto la trasformata di Fourier e Fourier-Plancherel (proposizione 3.78): Sia f : (a, b) → C misurabile tale che (1) l’insieme {x ∈ (a, b) | f(x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f(x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni x → xn f(x) per n = 0, 1, 2, . . . `e denso in L2 ((a, b), dx). L’importanza di questo risultato `e che consente di costruire facilmente delle basi hilbertiane in L2 ((a, b), dx) anche se a o b sono infiniti (per cui non `e possibile usare il teorema 2.40 di Stone-Weierstrass). Infatti, la procedura di ortogonalizzazione di Gramm-Schmidt applicata ai vettori fn , con
110
3 Spazi di Hilbert e operatori limitati
fn (x) := xn f(x), fornisce una base hilbertiana, secondo la procedura illustrata in proposizione 3.32. 2 A titolo di esempio, se f(x) := e−x /2 , la procedura di Gramm-Schmidt 2 definisce la base hilbertiana di L (R, dx) delle cosiddette funzioni di Her2 mite, che hanno tutte la forma ψn (x) := Hn (x)e−x /2 dove Hn `e un polinomio di grado n = 0, 1, 2, . . . chiamato n-esimo polinomio di Hermite. Nella Meccanica Quantistica questa base hilbertiana `e importante quando si studia il sistema fisico detto oscillatore armonico unidimensionale. Il calcolo 2 diretto con procedura di Gramm-Schmidt mostra che ψ0 = π −1/4 e−x /2 e i successivi elementi sono individuati dalla la relazione di ricorrenza ψn+1 = d (2(n + 1))−1/2 (x − dx )ψn . Con la stessa procedura ed usando f(x) := e−x si trova una base hilbertiana di L2 ((0, +∞), dx) data dalle cosiddette funzioni di Laguerre, che sono della forma e−x Ln (x) con n = 0, 1, . . .. Ogni polinomio Ln `e di grado n e si dice n-esimo polinomio di Laguerre. In Meccanica Quantistica questa base hilbertiana `e importante quando si lavora con sistemi fisici con simmetria sferica, come l’atomo di idrogeno. (5) Consideriamo lo spazio di Hilbert separabile L2 (Rn , dx) (dove dx deno` un fatto noto [Vla81] ta la solita misura di Lebesgue sui boreliani di Rn ). E che gli spazi di funzioni su Rn infinitamente differenziabili, a valori reali (o complessi) e, rispettivamente, a supporto compatto oppure che decrescono all’infinito pi` u rapidamente di ogni potenza negativa di |x|, sono sottospazi di Lp (Rn , dx), (1 ≤ p < ∞) densi in questi spazi. Consegue immediatamente da (b) di proposizione 3.32 che tali sottospazi contengono basi hilbertiane di L2 (Rn , dx). (6) Costruiremo ora il cosiddetto spazio di Bargmann-Hilbert, anche noto come spazio di Bargmann-Fock. Si tratta di uno spazio di Hilbert che ha diverse applicazioni in meccanica quantistica ed in teoria quantistica dei campi. Consideriamo la seguente misura positiva σ-additiva definita sui boreliani E ⊂ C, e dove χE indica la funzione caratteristica di E (cio`e χE (z) = 1 se z ∈ E e χE (z) = 0 se z ∈ E): 2 1 μ(E) := χX (z)e−|z| dzdz . π C Sopra, come usuale in questo formalismo, abbiamo indicato con dzdz la misura di Lebesgue di R2 identificato con C. Una funzione f : C → C `e detta essere intera se `e ovunque olomorfa su C. Indichiamo con H(C) lo spazio delle funzioni intere. Andiamo ora a considerare il sottospazio vettoriale di L2 (C, μ) dato dall’intersezione L2 (C, μ) ∩ H(C) (dove gli elementi di H(C) sono qui usati per rappresentare le corrispondenti classi di equivalenza di funzioni, come `e appropriato nella definizione degli spazi Lp ). Non `e affatto ovvio che L2 (C, μ) ∩ H(C) sia un sottospazio chiuso di L2 (C, μ), perch´e non `e per nulla evidente che il limite, nel senso di L2 (C, μ), di una successione di funzioni
3.2 Basi hilbertiane
111
intere converga ad una funzione (che coincida, a meno di insiemi di misura nulla con una funzione) intera. Bargmann `e riuscito tuttavia a dimostrare [Bar61] che: se f ∈ H(C), allora: dove: fn =
C
√ n!an
|f(z)|2 dμ(z) =
+∞
|fn |2 ≤ +∞
(3.29)
n=0
con f(z) =
+∞
an z n .
(3.30)
n=0
Lo sviluppo in potenze nella (3.30) non `e altro che lo sviluppo di Taylor della funzione f, convergente assolutamente per ogni z ∈ C ed uniformemente su ogni compatto di C, e che esiste per il solo fatto che f `e intera. Si osservi che (3.29) stabilisce in particolare che la serie di termini non negativi a secondo membro converge se e solo se l’integrale della funzione non negativa a primo membro converge. Quindi f, g ∈ L2 (C, μ) ∩ H(C) se e solo se, con ovvie notazioni (vedi anche (7) in esempi 2.39 per 2 (N)) {fn }n∈N, {gn }n=1,2... ∈ 2 (N), e in tal caso, usando l’identit` a di polarizzazione (3.4) e la (3.29), risulta: f(z)g(z)dμ(z) = C
+∞
fn gn .
(3.31)
n=0
Con le notazioni di (3.30), consideriamo allora l’applicazione: J : L2 (C, μ) ∩ H(C) f → {fn }n∈N ∈ 2 (N) . Questa trasformazione lineare isometrica (e quindi iniettiva) `e in realt`a anche 2n suriettiva. Infatti, tenendo conto del fatto che la serie n∈N |z| (n!)2 converge per ogni z ∈ C, la disuguaglianza di Cauchy-Schwarz implica immediatamente che, se {cn }n∈N ∈ 2 (N), allora la serie: cn z n √ √ =: f(z) n! n! n∈N converge assolutamente per ogni z ∈ C, definendo una funzione intera f e, per costruzione, J(f) = {cn }n∈N. Essendo 2 (N) completo concludiamo che: (a) lo spazio vettoriale complesso B1 := L2 (C, μ) ∩ H(C) `e uno spazio di Hilbert, in altre parole `e un sottospazio chiuso di L2 (C, μ), (b) tale spazio di Hilbert `e isomorfo a 2 (N) (quindi in particolare `e separabile) secondo J, (c) l’insieme di funzioni intere {un }n∈N , con: zn un (z) = √ n!
per ogni z ∈ C e con n ∈ N
(3.32)
112
3 Spazi di Hilbert e operatori limitati
`e una base hilbertiana dello spazio di Hilbert B1 . Tale spazio di Hilbert `e detto spazio di Bargmann-Hilbert o di Bargmann-Fock. Per concludere possiamo osservare che tutte le costruzioni hanno una diretta generalizzazione al caso in cui si considerano n copie di C e quindi si lavora con lo spazio di Bargmann n-dimensionale Bn := L2 (Cn , dμn ) ∩ H(Cn ), dove, per ogni boreliano E ∈ Cn : n 2 1 χX (z)e− k=1 |zk | dz1 dz1 ⊗ · · · ⊗ dzn dzn , μn (E) := n π Cn e H(Cn ) `e lo spazio delle funzioni olomorfe in n variabili su tutto Cn e l’integrale `e calcolato rispetto alla misura prodotto delle varie misure μ su ciascuna copia di C.
3.3 Nozione di aggiunto hermitiano e applicazioni Esaminiamo ora una delle pi` u importanti nozioni della teoria degli operatori in uno spazio di Hilbert che discende dal teorema 3.17 di Riesz: la nozione di operatore aggiunto (hermitiano). Dobbiamo precisare che la nozione di operatore aggiunto si pu` o estendere al caso di operatori non limitati. In questa sezione considereremo solo il caso di operatori limitati. Il caso generale sar` a estensivamente trattato in un prossimo capitolo. Val la pena di precisare che una (collegata) nozione di operatore aggiunto (o operatore coniugato) `e stata data nella definizione 2.55, senza usare la struttura di spazio di Hilbert. Nel seguito non faremo pi` u uso tale nozione non hilbertiana, eccetto che in qualche osservazione. 3.3.1 L’operazione di coniugazione hermitiana o aggiunzione Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Consideriamo, per u ∈ H2 fissato, l’applicazione: H1 v → (u|T v)2 ∈ C .
(3.33)
L’applicazione di sopra `e sicuramente lineare ed anche limitata: |(u|T v)2 | ≤ ||u||2 ||T v||2 ≤ ||u||2 ||T || ||v||1 . Si tratta dunque di un elemento di H1 . Per il teorema 3.17 di Riesz, esister`a wT ,u ∈ H1 tale che (u|T v)2 = (wT ,u |v)1 ,
per ogni v ∈ H1 .
(3.34)
Possiamo ancora notare che l’applicazione H2 u → wT ,u ∈ H1 `e lineare. Infatti: (wT ,αu+βu |v)1 = (αu+βu |T v)2 = α(u|T v)2 +β(u |T v)2 = (αwT ,u +βwT ,u |v)1 ,
3.3 Nozione di aggiunto hermitiano e applicazioni
113
per cui, per ogni v ∈ H, 0 = (wT ,αu+βu − αwT ,u − βwT ,u |v)1 ; scegliendo v := wT ,αu+βu − αwT ,u − βwT ,u , si ha che deve essere wT ,αu+βu − αwT ,u − βwT ,u = 0 e quindi wT ,αu+βu = αwT ,u + βwT ,u per ogni α, β ∈ C e u, u ∈ H2 . Quindi esiste un operatore lineare: T ∗ : H2 u → wT ,u ∈ H1 . Per costruzione, questo operatore soddisfa (u|T v)2 = (T ∗ u|v)1 per ogni coppia u ∈ H2 , v ∈ H1 ed `e l’unico operatore lineare a soddisfare questa identit` a. Se ci fosse un altro operatore B ∈ L(H2 , H1 ) che soddisfa l’identit` a detta, varrebbe anche (T ∗ u|v)1 = (Bu|v)1 per ogni v ∈ H1 . Di conseguenza avremmo che ((T ∗ − B)u|v)1 = 0 per ogni v ∈ H1 . Scegliendo v := (T ∗ − B)u si ha che deve essere ||(T ∗ − B)u||21 = 0 e quindi T ∗ u − Bu = 0. Dato che u ∈ H2 `e arbitrario, deve infine valere T ∗ = B. Abbiamo in definitiva provato che vale la proposizione seguente. Proposizione 3.36. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). Esiste ed `e unico un operatore lineare T ∗ : H2 → H1 tale che: (u|T v)2 = (T ∗ u|v)1 ,
per ogni coppia u ∈ H2 , v ∈ H1 .
(3.35)
Possiamo ora dare la definizione di operatore aggiunto hermitiano. Nel seguito ometteremo l’aggettivo “hermitiano”, dato che in questo testo non lavoreremo mai con operatori aggiunti non hermitiani, come precisato sopra. Definizione 3.37. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) spazi di Hilbert e T ∈ B(H1 , H2 ). L’unico operatore lineare T ∗ ∈ L(H2 , H1 ) che soddisfa (3.35) si chiama aggiunto (hermitiano), o anche coniugato hermitiano, dell’operatore T . Ricordiamo che dato un operatore lineare tra due spazi vettoriali, T : X → Y, Ran(T ) := {T (x) | x ∈ X} e Ker(T ) := {x ∈ X | T (x) = 0} indicano, rispettivamente, i sottospazi di Y e X detti rango (o immagine) dell’operatore T e nucleo dell’operatore T . L’operazione di coniugazione hermitiana gode delle seguenti propriet` a elementari. Proposizione 3.38. Siano (H1 , ( | )1 ), (H2 , ( | )2 ) due spazi di Hilbert e T ∈ B(H1 , H2 ). Valgono i seguenti fatti. (a) T ∗ ∈ B(H2 , H1 ) e pi` u precisamente: ||T ∗|| = ||T || , ||T ∗T || = ||T ||2 = ||T T ∗|| .
(3.36) (3.37)
114
3 Spazi di Hilbert e operatori limitati
(b) L’operazione di coniugazione hermitiana `e involutiva: (T ∗ )∗ = T . (c) Se, rispettivamente, S ∈ B(H1 , H2 ) e α, β ∈ C, oppure S ∈ B(H1 , H), con H spazio di Hilbert, valgono le identit` a: (αT + βS)∗ = αT ∗ + βS ∗ , ∗
∗
∗
(T S) = S T .
(3.38) (3.39)
(d) Vale: Ker(T ) = [Ran(T ∗ )]⊥ ,
Ker(T ∗ ) = [Ran(T )]⊥ .
(3.40)
(e) T `e biettivo se e solo se T ∗ `e biettivo. In tal caso vale: (T ∗ )−1 = (T −1 )∗ . Dimostrazione. D’ora in poi scriveremo, per esempio, || || indifferentemente per || ||1 e || ||2 ed useremo la stessa notazione semplificata per i prodotti scalari. Quale sia la norma o prodotto scalare in uso sar` a chiaro dal contesto. (a) Per ogni coppia u ∈ H2 , x ∈ H1 vale |(T ∗u|x)| = |(u|T x)| ≤ ||u|| ||T || ||x||. Scegliendo x := T ∗ u si ha in particolare ||T ∗u||2 ≤ ||T || ||u|| ||T ∗u|| e quindi ||T ∗u|| ≤ ||T || ||u||. Quindi T ∗ `e limitato e ||T ∗|| ≤ ||T ||. Ha senso quindi definire (T ∗ )∗ ed ottenere ||(T ∗ )∗ || ≤ ||T ∗||. Questa disuguaglianza si pu` o riscrivere ||T || ≤ ||T ∗|| per (b), la cui dimostrazione usa solo il fatto che T ∗ sia limitato. Valendo ||T ∗|| ≤ ||T || e ||T || ≤ ||T ∗ ||, vale (3.36). Passiamo ` sufficiente dimostrare la prima delle due identit` a dimostrare (3.37). E a, la seconda segue dalla prima e da (3.36). Notiamo che, per (b)(i) del teorema 2.54, la cui tesi vale banalmente anche per operatori S ∈ B(Y, X), T ∈ B(Z, Y) con X, Y, Z spazi normati, ||T ∗T || ≤ ||T ∗|| ||T || = ||T ||2. D’altra parte: ||T ||2 = ( sup ||T x||)2 = sup ||T x||2 = sup (T x|T x) . ||x||≤1
||x||≤1
||x||≤1
Usando la definizione di aggiunto e poi la disuguaglianza di Cauchy-Schwarz sull’ultimo termine della catena di uguaglianze scritte sopra, troviamo che : ||T ||2 = sup (T x|T x) = sup |(T ∗ T x|x)| ≤ sup ||T ∗T x|| = ||T ∗T || . ||x||≤1
||x||≤1
||x||≤1
In definitiva abbiamo ottenuto che ||T ∗ T || ≤ ||T ||2 e ||T ||2 ≤ ||T ∗T ||, per cui vale ||T ∗T || = ||T ||2. (b) La prova segue immediatamente dall’unicit` a dell’operatore aggiunto, valendo, per le note propriet` a del prodotto scalare e per la stessa definizione di operatore aggiunto dell’operatore T : (v|T ∗ u) = (T ∗ u|v) = (u|T v) = (T v|u) . (c) Se u ∈ H2 , v ∈ H1 (u|(αT + βS)v) = α(u|T v) + β(u|Sv) = α(T ∗ u|v) + β(S ∗ u|v)
3.3 Nozione di aggiunto hermitiano e applicazioni
115
= ((αT ∗ + βS ∗ )u|v) . Per l’unicit` a dell’operatore aggiunto vale (3.38). Se v ∈ H, u ∈ H2 (u|(T S)v) = (T ∗ u|Sv) = ((S ∗ T ∗ )u|v) . Per l’unicit` a dell’operatore aggiunto vale (3.39). ` sufficiente provare la prima delle due identit`a, la seconda segue subito (d) E dalla prima usando (b). Dato che (T ∗ u|v) = (u|T v), se v ∈ Ker(T ) allora (T ∗ u|v) = 0 per ogni u ∈ H2 e quindi v ∈ [Ran(T ∗ )]⊥. Viceversa, sempre per (T ∗ u|v) = (u|T v), se v ∈ [Ran(T ∗)]⊥ , allora (u|T v) = 0 per ogni u ∈ H2 . Scegliendo u := T v segue che T v = 0 e quindi v ∈ Ker(T ). (e) Se T `e biettivo allora T −1 `e limitato per il teorema di Banach dell’operatore inverso. Di conseguenza esiste (T −1 )∗ . Vale: T −1 T = T T −1 = I. Calcolando l’aggiunto ad ambo membri, usando la seconda propriet` a in (c) e tenendo conto che I ∗ = I, abbiamo: T ∗ (T −1 )∗ = (T −1 )∗ T ∗ = I. Queste identit` a sono equivalenti a dire che T ∗ `e biettivo e che (T ∗ )−1 = (T −1 )∗ . Infine, se T ∗ `e biettivo, allora, per quanto appena provato, lo deve essere anche (T ∗ )∗ = T per (b). Osservazione 3.39. Il legame tra la nozione di aggiunto hermitiano e la nozione di operatore coniugato vista nella definizione 2.55 si ottiene nel modo che segue dalle definizioni date. Partendo da T ∈ B(H1 , H2 ) e calcolando l’operatore coniugato T ∈ B(H2 , H1 ) e l’operatore aggiunto T ∗ ∈ B(H2 , H1 ) deve valere: (T ∗ yf |x)1 = (yf |T x)2 = (T f)(x)
per ogni f ∈ H2 e ogni x ∈ H1 ,
dove f ∈ H2 e yf ∈ H2 `e l’elemento di H2 che corrisponde a f secondo il teorema 3.17 di Riesz. Per l’arbitrariet`a di x ∈ H1 possiamo allora scrivere che: T f = (T ∗ yf | )1 per ogni f ∈ H2 . (3.41) Si noti che, dato che la mappa di Riesz H2 f → yf ∈ H2 `e biettiva, la relazione scritta sopra individua completamente T quando `e assegnato T ∗ e viceversa. 3.3.2
∗
-algebre e C ∗ -algebre
L’operazione di coniugazione hermitiana consente di introdurre uno dei concetti matematici pi` u utili nelle formulazioni avanzate della Meccanica Quantistica: stiamo parlando della la struttura di C ∗ -algebra (anche detta B ∗ algebra). Torneremo ad usare tale struttura nel capitolo 8 in relazione al teorema di decomposizione spettrale. Definizione 3.40. Sia A un’algebra (commutativa, con unit` a, normata con norma || ||, di Banach) sul campo C. Se esiste un’applicazione ∗ : A → A che gode delle seguenti propriet` a:
116
3 Spazi di Hilbert e operatori limitati
I1. (antilinearit` a) (αx + βy)∗ = αx∗ + βy∗ per ogni x, y ∈ A, α, β ∈ C, I2. (involutivit` a) (x∗ )∗ = x per ogni x ∈ A, ∗ ∗ ∗ I3. (xy) = y x per ogni x, y ∈ A, tale applicazione `e detta involuzione e la struttura (A,∗ ) si dice ∗ -algebra (rispettivamente commutativa, con unit` a, normata, di Banach). Una ∗ -algebra di Banach (con unit` a) si dice C ∗ -algebra (rispettivamente con unit` a) se vale la ulteriore propriet` a: ||x∗x|| = ||x||2 .
(3.42)
Un omomorfismo tra due ∗ -algebre: f : A1 → A2 `e detto ∗ -omomorfismo se preserva l’involuzione: f(x∗1 ) = f(x)∗2 per ogni x ∈ A1 (dove ∗1 indica l’involuzione in A1 e ∗2 indica l’involuzione in A2 ), uno ∗ -omomorfismo `e detto ∗ -isomorfismo se `e anche biettivo. Un elemento x di una ∗ -algebra A `e detto: (i) normale se xx∗ = x∗ x, (ii) hermitiano o autoaggiunto se x∗ = x. u ovvia: si La nozione di sotto ∗ -algebra di una ∗ -algebra A `e quella pi` tratta di una sotto algebra che `e ancora ∗ -algebra rispetto alla restrizione dell’involuzione su di essa. Prima di tornare a B(H) (per provare che `e una C ∗ − algebra), diamo alcune immediate propriet` a generali delle ∗ -algebre che seguono dalla stessa definizione. Proposizione 3.41. Sia A una ∗ -algebra. Indicando con ∗ l’involuzione in A, vale quanto segue. (a) Se A `e C ∗-algebra con norma || || e x ∈ A `e normale, allora, per ogni m = 1, 2, . . .: ||xm || = ||x||m . (b) Se A `e C ∗ -algebra con norma || || e x ∈ A, allora ||x∗|| = ||x|| . (c) Se A ammette unit` a I, vale I∗ = I. Inoltre, x ∈ A ammette inverso se e ∗ solo se x ammette inverso ed, in tal caso, vale (x−1 )∗ = (x∗ )−1 . Dimostrazione. (a) Se ||x|| = 0 la tesi `e ovvia. Supponiamo x = 0. Usando ripetutamente (3.42), I2 e I3 e il fatto che xx∗ = x∗ x: ||x2||2 = ||(x2 )∗ x2 || = ||(x∗)2 x2 || = ||(x∗x)∗ (x∗x)|| = ||x∗x||2 = (||x||2)2 da cui ||x2 || = ||x||2 per la positivit` a della norma. Iterando la procedura si k k prova che ||x2 || = ||x||2 per ogni naturale k. Se m = 3, 4, . . . esistono due naturali n, k tali che m + n = 2k . In questo modo: ||x||m||x||n = ||x||n+m = ||xn+m|| ≤ ||xm|| ||xn || ≤ ||xm|| ||x||n ≤ ||x||m||x||n .
3.3 Nozione di aggiunto hermitiano e applicazioni
117
Ma allora tutte le disuguaglianze devono essere uguaglianze, in particolare: ||xm|| ||x||n = ||x||m||x||n e pertanto, dividendo per ||x||m (che `e non nullo perch´e x = 0 e || · || `e una norma) si ha la tesi. (b) (3.42) implica che ||x||2 = ||xx∗|| ≤ ||x|| ||x∗|| da cui ||x|| ≤ ||x∗||. Nello stesso modo ||x∗|| ≤ ||(x∗)∗ ||, ma (x∗ )∗ = x da cui la tesi. (c) II∗ = I∗ (1) per definizione di unit` a; d’altra parte II∗ = (I∗ )∗ I∗ = (I∗ I)∗ ∗ ∗ ∗ (2). Da (1) e (2) segue che I = (I I) = (I∗ )∗ = I. La seconda affermazione segue immediatamente da quanto appena provato, da I2 e dall’unicit` a dell’inverso. Esempi 3.42. (1) Le algebre di Banach di funzioni a valori complessi viste in (2),(3),(4),(8) e (9) in esempi 2.39 sono tutte C ∗ -algebre commutative in cui l’involuzione `e data dalla coniugazione complessa delle funzioni. (2) Abbiamo immediatamente che, in virt` u di (a), (b) e (c) in proposizione 3.38 vale il seguente risultato. Teorema 3.43. Se H `e spazio di Hilbert, B(H) una C ∗ -algebra con unit` a se l’involuzione `e definita come la coniugazione hermitiana. (3) Un esempio di C ∗ -algebra, fondamentale per le applicazioni di teoria quantistica dei campi (ma non solo) `e l’algebra di von Neumann che andiamo a definire in alcuni passi, dopo aver introdotto la nozione di commutate di un’algebra di operatori e dopo aver enunciato un importante teorema necessario per enunciare la definizione. Se M ⊂ B(H) `e un sottoinsieme dell’algebra degli operatori limitati sullo spazio di Hilbert complesso B(H), il commutante di M `e definito come: M := {T ∈ B(H) | T A − AT = 0
per ogni A ∈ M} .
Se M `e chiuso sotto l’operazione di coniugazione hermitiana (cio`e A∗ ∈ M se A ∈ M) il commutante M `e sicuramente una ∗-algebra con unit` a. Nel caso generale vale: M1 ⊂ M2 se M2 ⊂ M1 e anche M ⊂ (M ) , che implicano M = ((M ) ) , per cui iterando l’operazione di calcolo del commutate non si supera il secondo commutante. Dalla continuit` a del prodotto operatoriale, segue che il commutante M `e chiuso nella topologia uniforme e quindi, se M `e chiuso rispetto alla coniugazione hermitiana, il suo commutante M `e una C ∗ -algebra (sotto C ∗-algebra) di B(H). M ha altre fondamentali propriet` a topologiche nel caso generale. Si dimostra facilmente che M `e chiuso rispetto alla topologia operatoriale forte e rispetto alla topologia operatoriale debole. Il risultato vale indipendentemente dal fatto che il prodotto di operatori non `e congiuntamente continuo nei due argomenti, dato che `e sufficiente la continuit`a separatamente nei due argomenti.
118
3 Spazi di Hilbert e operatori limitati
Nel seguito, come di consuetudine nella teoria della algebre di von Neumann, scriveremo M al posto di (M ) e via di seguito. Vale il seguente fondamentale teorema dovuto a von Neumann, detto [BrRo02]. Teorema 3.44. (Del doppio commutante.) Se A `e una sotto ∗ -algebra di B(H), con H spazio di Hilbert complesso, i seguenti fatti sono equivalenti. (a) A = A . (b) A `e chiusa rispetto alla topologia operatoriale debole e I ∈ A. (c) A `e chiusa rispetto alla topologia operatoriale forte e I ∈ A. Che (a) implichi (b) che, a sua volta, implichi (c) `e abbastanza facile da provare. Il punto difficile `e dimostrare che (c) implichi (a). Siamo ora in grado di dare la definizione di algebra di von Neumann. Definizione 3.45. Un’algebra di von Neumann in B(H) `e una sotto ∗algebra di B(H) che soddisfi le propriet` a equivalenti del teorema 3.44 di von Neumann. In particolare M `e sempre un’algebra di von Neumann se M `e un sottoinsieme di B(H), valendo (M ) = M come visto sopra. Si osservi anche che, per costruzione, un’algebra di von Neumann in B(H) `e una C ∗ -algebra, pi` u precisamente una sotto C ∗-algebra di B(H). Si verifica subito che l’intersezione di due algebre di von Neumann `e ancora un’algebra di von Neumann. Se M ⊂ B(H), M risulta essere la pi` u piccola (nel senso dell’intersezione) algebra di von Neumann che include M come sottoinsieme [BrRo02]. Pertanto M si chiama algebra di von Neumann generata da M. 3.3.3 Operatori normali, autoaggiunti, isometrici, unitari, operatori positivi Tornando alla C ∗ -algebra B(H) (ma anche pi` u in generale a B(H, H1 )), possiamo dare alcune definizioni riguardanti i pi` u importanti tipi di operatori che ritorneranno ricorrentemente in uso nei prossimi capitoli. Definizione 3.46. Siano (H, ( | )) e (H1 , ( | )1 ) spazi di Hilbert e si denotino con IH e IH1 , rispettivamente, gli operatori identit` a su H e H1 . (a) T ∈ B(H) `e detto normale se T T ∗ = T ∗ T . (b) T ∈ B(H) `e detto autoaggiunto se T = T ∗ . (c) T ∈ L(H, H1 ) `e detto isometrico se `e limitato e T ∗ T = IH ; equivalentemente T ∈ L(H, H1 ) `e isometrico se (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H. (d) T ∈ L(H, H1 ) `e detto unitario se `e limitato e T ∗ T = IH , T T ∗ = IH1 ; equivalentemente T ∈ L(H, H1 ) `e unitario se `e isometrico e suriettivo, cio`e `e un isomorfismo di spazi di Hilbert. (e) T ∈ L(H) `e detto positivo, e si scrive T ≥ 0, se (u|T u) ≥ 0 per ogni u ∈ H. (f ) Se U ∈ L(H), si dice che T maggiora U , e si scrive T ≥ U , se T −U ≥ 0.
3.3 Nozione di aggiunto hermitiano e applicazioni
119
Osservazioni 3.47. (1) Si osservi, a commento dell’equivalenza enunciata in (c), che se T ∈ B(H, H1 ) e T ∗ T = IH , allora vale (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H in quanto (x|y) = (x|T ∗T y) = (T x|T y)1 . Viceversa, se T ∈ L(H, H1 ) e vale (T x|T y)1 = (x|y) per ogni x, y ∈ H, allora T `e limitato (basta porre y = x) e dunque esiste T ∗ ; infine vale T ∗ T = IH perch´e (x|T ∗T y) = (T x|T y)1 = (x|y) per ogni coppia x, y ∈ H e quindi in particolare (x|(T ∗ T − I)y) = 0 con x = (T ∗ T − I)y. A commento dell’equivalenza enunciata in (d), si osservi che ogni operatore isometrico T `e ovviamente iniettivo, perch´e T u = 0 implica ||u|| = 0 e quindi u = 0. Allora la suriettivit` a `e equivalente all’esistenza di un’inversa destra che coincida con quella sinistra, che esiste gi`a per l’iniettivit`a ed `e T ∗ . Da ci` o segue immediatamente che T ∗ T = IH e T T ∗ = IH1 insieme sono equivalenti a dire che T ∈ L(H, H1 ) `e isometrico (e quindi limitato) ed `e anche suriettivo. (La definizione data qui di operatore unitario `e quindi in accordo con la definizione 3.10). (2) Esistono operatori isometrici in B(H) che non sono operatori unitari (ovviamente ci`o non accade se H ha dimensione finita). Un esempio `e l’operatore sullo spazio 2 (N): A : (z0 , z1 , z2 , . . .) → (0, z0 , z1 , , . . .) , per ogni (z0 , z1 , z2 , . . .) ∈ 2 (N). (3) Gli operatori unitari in B(H) e quelli autoaggiunti sono operatori normali, ma non vale il viceversa in generale. Per concludere questa sezione, restringendoci a lavorare con un unico spazio di Hilbert, diamo alcune propriet` a elementari degli operatori normali, autoaggiunti, unitari e positivi nella seguente proposizione preceduta da una definizione che riportiamo bench´e dovrebbe essere gi`a nota dai corsi elementari. Definizione 3.48. Siano X spazio vettoriale sul campo K = C oppure R, e T ∈ L(X); λ ∈ K `e detto autovalore dell’operatore T se: T u = λu
(3.43)
per qualche u ∈ X\{0}. In tal caso u `e detto autovettore di T con autovalore λ (o associato all’autovalore λ). Il sottospazio di X, che contiene il vettore nullo e tutti gli autovettori con autovalore λ, `e detto autospazio di T con autovalore λ (o associato all’autovalore λ). Ecco ora la proposizione preannunciata. Proposizione 3.49. Sia (H, ( | )) spazio di Hilbert. (a) Se T ∈ B(H) `e autoaggiunto, allora: ||T || = sup {|(x|T x)| | x ∈ H , ||x|| = 1} .
(3.44)
120
3 Spazi di Hilbert e operatori limitati
Pi` u in generale, se T ∈ L(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H ed il secondo membro di (3.44) `e finito, allora T `e limitato. (b) Se T ∈ B(H) `e normale (e quindi in particolare autoaggiunto oppure unitario): (i) λ ∈ C `e autovalore di T con autovettore u se e solo se λ `e autovalore per T ∗ con lo stesso autovettore u; (ii) autospazi di T con autovalori distinti sono ortogonali. (c) Sia T ∈ L(H). Valgono i seguenti fatti: (i) se T `e positivo, i suoi possibili autovalori sono reali non negativi; (ii) se T `e limitato ed autoaggiunto, i suoi possibili autovalori sono reali; (iii) se T `e isometrico (ed in particolare unitario), i suoi possibili autovalori sono complessi con modulo uguale a 1. (d) Se T ∈ L(H) soddisfa (y|T x) = (T y|x) per ogni coppia x, y ∈ H, allora T `e limitato ed `e autoaggiunto. (e) Se T ∈ B(H) soddisfa (x|T x) = (T x|x) per ogni x ∈ H, allora T `e autoaggiunto. (f ) Se T ∈ B(H) `e positivo, allora `e autoaggiunto. (g) ≥ `e una relazione di ordine parziale in L(H) (e quindi anche in B(H)). Dimostrazione. (a) Posto Q := sup {|(x|T x)| | x ∈ H , ||x|| = 1}, dato che ||x|| = 1, |(x|T x)| ≤ ||T x||||x|| ≤ ||T x|| ≤ ||T || . Quindi: Q ≤ ||T ||. Per concludere, `e sufficiente provare che ||T || ≤ Q. Vale l’identit` a di immediata verifica: 4(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) − i(x + iy|T (x + iy)) + i(x − iy|T (x − iy)) . a e tenendo conto del fatto che (z|T z) = (T z|z) = (z|T z), si Da tale identit` ricava che 4Re(x|T y) = 2(x|T y) + 2(x|T y) pu` o essere scritto: 4Re(x|T y) = (x + y|T (x + y)) − (x − y|T (x − y)) ≤ Q||x + y||2 + Q||x − y||2 = 2Q||x||2 + 2Q||y||2 . Abbiamo provato che: 4Re(x|T y) ≤ 2Q||x||2 + 2Q||y||2 . Sia y ∈ H con ||y|| = 1. Se T y = 0, allora `e ovvio che ||T y|| ≤ Q; altrimenti definiamo x := T y/||T y|| e otteniamo dalla disuguaglianza provata sopra: 4||T y|| = 4Re(x|T y) ≤ 2Q(||x||2 + ||y||2 ) = 2Q(1 + 1) = 4Q da cui, ancora, ||T y|| ≤ Q. In definitiva ||T y|| ≤ Q se ||y|| = 1 e quindi ||T || = sup{||T y|| | y ∈ H , ||y|| = 1} ≤ Q .
3.3 Nozione di aggiunto hermitiano e applicazioni
121
La seconda proposizione segue dalla seconda parte della dimostrazione di sopra (||T || ≤ Q). (b)(i) Se A `e normale ||Au||2 = (Au|Au)2 = (A∗ Au|u) = (AA∗ u|u) = (A∗ u|A∗ u) = ||A∗u||2 . Se T `e normale, T − λI `e normale con aggiunto T ∗ − λI, per cui applicando il risultato di sopra, ||T u − λu||2 = ||T ∗u − λu||2 . La tesi segue immediatamente. (ii) Sia u autovettore di T con autovalore λ e v autovettore di T con autovalore μ. Per (i), λ(v|u) = (v|T u) = (T ∗ v|u) = (μv|u) = μ(v|u) per cui (λ−μ)(v|u) = 0. Essendo λ = μ, deve essere (v|u) = 0. (c) Se T ≥ 0 e T u = λu con u = 0, allora 0 ≤ (u|T u) = λ(u|u); essendo (u|u) > 0, segue che deve essere λ ≥ 0. Sia poi T = T ∗ e T u = λu con u = 0: allora λ(u|u) = (u|T u) = (T u|u) = λ(u|u). Essendo (u|u) = 0, si ha λ = λ ossia λ ∈ R. Se invece T `e isometrico: (u|u) = (T u|T u) = |λ|2 (u|u). Essendo u = 0, si ha che |λ| = 1. (d) La tesi si prova dimostrando che T `e limitato. L’unicit` a dell’aggiunto implica allora che T = T ∗ in quanto (y|T x) = (T y|x) per ogni coppia x, y ∈ H. A causa del teorema 2.104 del grafico chiuso, per dimostrare che T `e limitato `e sufficiente provare che T `e chiuso. Sia allora {xn }n∈N ⊂ H una successione convergente a x e supponiamo che i vettori T xn definiscano una successione convergente: dobbiamo mostrare che T xn → T x. Nelle nostre ipotesi, fissato y ∈ H, si ha: (y|T xn ) = (T y|xn ) → (T y|x) = (y|T x) . Per la continuit` a del prodotto scalare e tenendo conto per ipotesi limn→+∞ T xn esiste, possiamo allora scrivere:
y lim (T x − T xn ) = 0 . n→+∞
Dato che y `e arbitrario, scegliendo proprio y := limn→+∞ (T x − T xn ) concludiamo che limn→+∞ (T x − T xn ) = 0. (e) e (f) Nelle ipotesi fatte ((T ∗ − T )x|x) = 0 per ogni x ∈ H. Per l’esercizio 3.10 deve essere T ∗ − T = 0 ossia T = T ∗ . Se T ∈ B(H) `e positivo, allora (x|T x) `e reale e coincide quindi con il suo complesso coniugato, che vale (T x|x) per le propriet` a del prodotto scalare, per cui si ricade nel caso precedente. (g) Bisogna provare tre fatti. (i) T ≥ T : questo `e ovvio perch´e significa che ((T − T )x|x) ≥ 0 per ogni x ∈ H. (ii) se T ≥ U e U ≥ S allora T ≥ S: questo si prova immediatamente notando che T − S = (T − U ) + (U − S) e quindi ((T − S)x|x) = ((T − U )x|x) + ((U − S)x|x) ≥ 0 per ogni x ∈ H, dato che T ≥ U e U ≥ S. (iii) se T ≥ U e U ≥ T allora T = U . Per provare (iii) si osservi che nelle ipotesi fatte (x|(T − U )x) = 0 per ogni x ∈ H. Per l’esercizio 3.10 deve essere T − U = 0 ossia T = U .
122
3 Spazi di Hilbert e operatori limitati
Osservazione 3.50. Si osservi che per spazi di Hilbert sul campo reale ≥ non `e una relazione d’ordine parziale, perch´e non `e vero che se A ≥ 0 e 0 ≥ A, allora A = 0. A titolo di esempio, si consideri una matrice antisimmetrica A su Rn (visto come spazio vettoriale sul campo R), dotato del prodotto scalare ordinario. Vale A ≥ 0 e anche 0 ≥ A, in quanto (x|Ax) = 0 per ogni x ∈ Rn , ma A = 0.
3.4 Proiettori ortogonali Come ultimo concetto elementare introduciamo la nozione di proiettore ortogonale, che giocher`a il ruolo centrale nel costruire il formalismo della meccanica quantistica. In riferimento alla definizione 2.105 ed alle successive proposizioni 4.5 e 5.16, possiamo dare la seguente definizione. Definizione 3.51. Se (H, ( | )) `e spazio di Hilbert, un proiettore P ∈ B(H) `e detto proiettore ortogonale se P ∗ = P . Osservazione 3.52. Quindi i proiettori ortogonali sono tutti e soli gli operatori limitati da H in H definiti dalle due condizioni P = P P (idempotenza) e P = P ∗ (autoaggiunzione). Si osservi che, come immediata conseguenza della definizione data, si ha la positivit` a dei proiettori ortogonali: per ogni x ∈ H (u|P u) = (u|P P u) = (P ∗ u|P u) = (P u|P u) = ||P u||2 ≥ 0 .
Abbiamo la seguente coppia di proposizioni che caratterizzano i proiettori ortogonali. Proposizione 3.53. Sia P ∈ B(H) un proiettore ortogonale (nello spazio di Hilbert H) che proietta su M : allora vale quanto segue. (a) Il proiettore associato Q := I − P `e ancora un proiettore ortogonale. (b) Q(H) = M ⊥ , per cui la decomposizione diretta associata a P e Q secondo (b) di proposizione 2.106 `e quella dovuta a M ed al suo ortogonale M ⊥ : H = M ⊕ M⊥ . (c) Per ogni x ∈ H, ||x − P (x)|| = min{||x − y|| | y ∈ M }. (d) Se N `e una base hilbertiana di M , allora: P = su (u| ) , u∈N
dove il simbolo “s-” indica che la serie `e calcolata nella topologia forte se la somma `e infinita. (e) I ≥ P ; inoltre, se P non `e l’operatore nullo (il proiettore su {0}), ||P || = 1.
3.4 Proiettori ortogonali
123
Dimostrazione. (a) Sappiamo gi` a che Q := I − P `e proiettore (proposizione 2.4). Per (c) di proposizione 3.38, essendo anche I ∗ = I, segue subito che Q∗ = Q, per cui Q `e proiettore ortogonale. (b) Per la (b) della proposizione 2.106, `e sufficiente provare che Q(H) = M ⊥ . A tal fine si noti che se x ∈ Q(H) e y ∈ M , allora (x|y) = (Qx|y) = (x|Qy) = (x|y − P y) = (x|y − y) = 0, per cui Q(H) ⊂ M ⊥ . Mostriamo che deve essere anche M ⊥ ⊂ Q(H), per cui M ⊥ = Q(H). Per la proposizione 2.106, sussiste la decomposizione diretta: H = M ⊕ Q(H) . D’altra parte, per (d) di teorema 3.14, si ha anche la decomposizione diretta (e ortogonale): H = M ⊕ M⊥ . Se y ∈ M ⊥ , in base alla prima decomposizione si ha la decomposizione unica di y: y = yM + z con yM ∈ M e z ∈ Q(H). Ma, come visto, Q(H) ⊂ M ⊥ , per cui, per l’unicit` a della decomposizione, y = yM + z deve coincidere anche con la decomposizione rispetto alla seconda coppia di sottospazi: e quindi yM ∈ M e z ∈ M ⊥ . In tal caso yM = 0 per ipotesi, per cui y = z ∈ Q(H). Dato che y ∈ M ⊥ `e un vettore arbitrario, abbiamo provato che M ⊥ ⊂ Q(H) come volevamo. (c) La tesi `e immediata conseguenza di (d) del teorema 3.14, quando K := M , tenuto conto dell’unicit` a della decomposizione diretta. (d) Possiamo completare N a base hilbertiana di H tramite l’unione con una base hilbertiana N di M ⊥ (infatti N ∪ N `e un insieme ortonormale per costruzione; inoltre, valendo H = M ⊕ M ⊥ per (b), se x ∈ H `e ortogonale a N e N , deve essere il vettore nullo. Per definizione di base hilbertiana, N ∪ N `e base hilbertiana di H.) Allora si verifica immediatamente che: R=
u (u| )
u∈N
e R =
u (u| )
u∈N
(dove le somme, se contengono infiniti addendi, sono calcolate nella topologia forte) sono operatori limitati, soddisfano RR = R, R(H) = M , R R = R , R (H) = M ⊥ ed infine R R = RR = 0 e R + R = I. Per la proposizione 2.106, R ed R sono proiettori associati alla decomposizione diretta M ⊕ M ⊥ . Per l’unicit` a della decomposizione su M e M ⊥ di ogni vettore, concludiamo che deve essere R = P (e R = Q). (e) Q = I − P `e proiettore ortogonale per cui: 0 ≤ (Qx|Qx) = (x|QQx) = (x|Qx) = (x|Ix) − (x|P x) ,
124
3 Spazi di Hilbert e operatori limitati
per ogni x ∈ H. Questo significa che I ≥ P . Da quanto appena detto segue anche che: ||P x||2 = (P x|P x) = (x|P P x) = (x|P x) ≤ (x|x) = ||x||2 . Prendendo l’estremo superiore su x con ||x|| = 1, si ha ||P || ≤ 1. Se P = 0, ci sar`a x ∈ H con ||x|| = 1 per cui P x = x e quindi ||P x|| = 1. In tal caso dovr` a essere ||P || = 1. Proposizione 3.54. Sia H spazio di Hilbert e M ⊂ H un sottospazio chiuso. I proiettori P e Q associati alla somma diretta ortogonale H = M ⊕ M⊥ secondo la proposizione 2.107 (con N := M⊥ ) e che proiettano rispettivamente su M e M⊥ sono proiettori ortogonali. Dimostrazione. Bisogna solo provare che P = P ∗. Il fatto che Q = Q∗ segue da Q = I − P . Se x ∈ H, allora si ha la decomposizione univoca x = y + z con y = P (x) ∈ M e z = Q(x) ∈ M⊥ . Sia x = y + z l’analoga decomposizione per x ∈ H. Vale (x |P x) = (y +z |y) = (y |y). Ma anche (P x |x) = (y |y +z) = (y |y), per cui (x |P x) = (P x|x) ossia ((P ∗ − P )x |x) = 0 per ogni x, x ∈ H. Scegliendo x = (P ∗ − P )x , si vede che deve valere P x = P ∗ x per ogni x e quindi P = P ∗.
3.5 Radici quadrate di operatori positivi e decomposizione polare di operatori limitati In questa sezione piuttosto tecnica vedremo alcune nozioni molto utili in teoria degli operatori limitati in uno spazio di Hilbert. Il risultato pi` u importante `e il cosiddetto teorema di decomposizione polare per operatori limitati. Si tratta di una decomposizione di un operatore che generalizza la decomposizione di un numero complesso z nel prodotto del suo valore assoluto e di un esponenziale immaginario: z = |z|ei arg z . Nel caso operatoriale, se z corrisponde ad un operatore limitato, |z| corrisponde ad un certo operatore positivo, il valore assoluto dell’operatore di partenza, e ei arg z ad un operatore che `e unitario, almeno restringendosi ad un certo sottospazio. La nozione di valore assoluto di un operatore `e utile per introdurre una generalizzazione del concetto di “convergenza assoluta” di serie numeriche costruite a partire da operatori e basi hilbertiane. Useremo queste serie nel definire gli operatori di HilbertSchmidt e gli operatori di classe traccia, alcuni dei quali rappresentano gli stati in meccanica quantistica. Parte delle dimostrazioni che seguono sono tratte da [Mar82] e [KaAk80]. Definizione 3.55. Se A ∈ B(H), con H spazio di Hilbert, B ∈ B(H) si dice radice quadrata (positiva) di A se B 2 = A (e, rispettivamente, B ≥ 0).
Radici quadrate di operatori positivi e decomposizione polare
125
Mostreremo tra poco che ogni operatore limitato positivo ha una ed una sola radice quadrata positiva. Ci serve un lemma iniziale che diamo sotto forma di proposizione in quanto si tratta, a sua volta, di un utile risultato usato nella teoria spettrale, lavorando con successioni e serie di proiettori ortogonali nella topologia forte. Proposizione 3.56. Sia H spazio di Hilbert. Se {An }n∈N ⊂ B(H) `e una successione monotona non decrescente (non crescente) di operatori autoaggiunti limitata superiormente (rispettivamente inferiormente) da K ∈ B(H), allora esiste A ∈ B(H) autoaggiunto con A ≤ K (rispettivamente A ≥ K) e tale che: A = s- lim An . (3.45) n→+∞
Dimostrazione. Dimostriamo la tesi nel caso non decrescente; l’altro caso si riporta a questo considerando la successione di termini K − An . Posto Bn := An + ||A0 ||I, valgono le propriet` a seguenti. (i) La successione dei Bn `e una successione monotona non decrescente di operatori positivi. Infatti, se ||x|| = 1, (x|An x) + ||A0 || ≥ (x|A0 x) + ||A0 ||, ma −||A0 || ≤ (x|A0 x) ≤ ||A0 || per (a) di proposizione 3.49. Di conseguenza (x|An x) + ||A0 || ≥ 0 per ogni x tale che ||x|| = 1. Questo equivale a dire che (y|An y) + ||A0 ||(y|y) ≥ 0 per ogni y ∈ H, ossia Bn = An + ||A0 ||I ≥ 0, (ii) Bn ≤ K + ||A0 ||I =: K1 e K1 `e positivo (K pu` o non esserlo), (iii) (x|K1 x) ≥ (x|Bn x) − (x|Bm x) ≥ 0 per ogni x ∈ H se n ≥ m. Infatti (x|K1 x) ≥ (x|Bn x), e anche −(x|Bm x) ≤ 0 ed infine (x|Bn x) − (x|Bm x) ≥ 0. Dato che che ogni operatore positivo T definisce un semiprodotto scalare, per cui `e valida la disuguaglianza di Schwarz: |(x|T y)|2 ≤ (x|T x)(y|T y) ,
(3.46)
avremo che, se n ≥ m: |(x|(Bn − Bm )y)|2 ≤ (x|(Bn − Bm )x)(y|(Bn − Bm )y) ≤ (x|K1 x)(y|K1 y) ≤ ||K1||2 ||x||2||y||2 . Quindi: |(x|(Bn − Bm )y)|2 ≤ ||K1 ||2 ||x||2||y||2 . Se si pone x = (Bn − Bm )y e si prende l’estremo superiore sugli y ∈ H con ||y|| = 1, si ricava che: ||Bn − Bm || ≤ ||K1 || . (3.47) Dalla (3.46) con y = (Bn −Bm )x e T = Bn −Bm si ricava che, per ogni x ∈ H, se n ≥ m: ||(Bn − Bm )x||4 = ((Bn − Bm )x|(Bn − Bm )x)2 ≤ (x|(Bn − Bm )x)((Bn − Bm )x|(Bn − Bm )2 x) .
126
3 Spazi di Hilbert e operatori limitati
Per (3.47), l’ultimo termine `e maggiorato da (x|(Bn − Bm )x)||Bn − Bm ||3||x||2 ≤ ||K1 ||3 ||x||2[(x|Bn x) − (x|Bm x)] . Quindi:
||(Bn − Bm )x||4 ≤ ||K1 ||3 ||x||2[(x|Bn x) − (x|Bm x)] .
La successione non decrescente limitata di numeri positivi (x|Bk x) `e necessariamente convergente, per cui `e di Cauchy. Concludiamo che deve essere di Cauchy anche quella di vettori Bk x. Esister`a dunque il limite per k → +∞ di tale successione. Definiamo: B : H x → lim Bn x . n→+∞
Si verifica facilmente che per costruzione B `e lineare, inoltre soddisfa: 0 ≤ (Bx|x) = (x|Bx) ≤ (x|K1 x) dato che 0 ≤ (Bk x|x) = (x|Bk x) ≤ (x|K1 x) per ogni k ∈ N. Dato che K1 `e limitato ed autoaggiunto (essendo positivo), da (a) di proposizione 3.49 concludiamo che B `e limitato, valendo: sup{|(x|Bx)| | x ∈ H , ||x|| = 1} ≤ sup{|(x|K1 x)| | x ∈ H , ||x|| = 1} = ||K1 || . B `e anche autoaggiunto per (e) di proposizione 3.49. Quindi, A := B − ||A0 ||I `e un operatore limitato, autoaggiunto e vale: Ax = lim (Bn − ||A0||I)x = lim An x . n→+∞
n→+∞
Infine A ≤ K perch´e per ogni x ∈ H vale (x|An x) ≤ (x|Kx) per ipotesi e tale risultato permane prendendo il limite per n → +∞. Questo risultato ci permette di dimostrare l’esistenza delle radici quadrate degli operatori limitati positivi. Teorema 3.57. Sia H spazio di Hilbert e A ∈ B(H) un operatore positivo. √ Esiste un’unica radice quadrata positiva, che indichiamo con A. Inoltre: √ (a) A commuta con tutti gli operatori B ∈ B(H) che commutano con A: √ √ se AB = BA con B ∈ B(H), allora AB = B A. √ (b) se A `e biettivo, A `e biettivo. Dimostrazione. Senza limitare la generalit`a, possiamo assumere che ||A|| ≤ 1. Quindi poniamo A0 := I − A. Mostriamo prima di tutto che A0 ≥ 0 e ||A0 || ≤ 1. A0 ≥ 0 dato che (x|A0 x) = (x|x) − (x|Ax) ≥ ||x||2 − ||A||||x||2, dove abbiamo usato il fatto che A = A∗ per cui (per (a) di proposizione 3.49) ||A|| = sup{|(z|Az)| | ||z|| = 1} e tenendo conto che |(z|Az)| = (z|Az) per la positivit` a
Radici quadrate di operatori positivi e decomposizione polare
127
di A. Dato che (x, y) → (x|A0 y) `e un semi prodotto scalare, essendo A0 ≥ 0, vale la disuguaglianza di Cauchy-Schwarz: |(x|A0 y)|2 ≤ (x|A0 x)(y|A0 y) ≤ ||x||2||y||2 , dove abbiamo usato la positivit` a di A = I −A0 e A0 nell’ultimo passaggio. Per y = A0 x, ed usando il fatto che A = A∗ , la disuguaglianza trovata implica: |(A0 x|A0 x)|2 ≤ ||x||2||A0x||2 , e quindi ||A0 x|| ≤ ||x||, da cui infine si ha che: ||A0|| ≤ 1 .
(3.48)
Passiamo a definire una successione di operatori limitati Bn : H → H, per n = 1, 2, . . .: 1 B1 := 0 , Bn+1 := (A0 + Bn2 ) . (3.49) 2 Dalla (3.48) si verifica immediatamente, usando le propriet` a della norma, che: ||Bn || ≤ 1 per ogni n ∈ N .
(3.50)
Per induzione si verifica immediatamente che gli operatori Bn sono polinomi in A0 a coefficienti non negativi. Si tenga conto, qui e nel seguito, che tutti gli operatori Bk commutano tra di loro e commutano con A0 per costruzione. Dalla (3.49) si ha che: Bn+1 − Bn =
1 1 1 2 2 (A0 + Bn2 ) − (A0 + Bn−1 ) = (Bn2 − Bn−1 ) 2 2 2
ossia:
1 (Bn + Bn−1 )(Bn − Bn−1 ) . 2 Dall’ultima identit` a segue facilmente, per induzione, che gli operatori Bn+1 − Bn sono polinomi di A0 a coefficienti non negativi: si tenga conto del fatto che ogni Bn + Bn−1 `e somma di polinomi a coefficienti non negativi per cui `e un polinomio a coefficienti non negativi ed infine si usi il fatto che il prodotto di polinomi a coefficienti non negativi `e un polinomio dello stesso genere. Dato che A0 ≥ 0, ogni suo polinomio a coefficienti non negativi `e un operatore positivo: il polinomio `e somma di termini a2n A2n 0 che sono positivi n n n (essendo a2n ≥ 0 e A2n = A A con A autoaggiunto, per cui a2n (x|A2n 0 0 0 0 0 x) = a2n (An0 x|An0 x) ≥ 0), e di termini a2n+1 A2n+1 che sono ancora positivi (perch´ e 0 n n n n a2n+1 ≥ 0 e (x|A2n+1 x) = (x|A AA x) = (A x|A A x) ≥ 0). 0 0 0 0 0 Concludiamo che gli operatori limitati Bn e Bn+1 − Bn sono operatori positivi. In altre parole, la successione degli operatori limitati positivi (e quindi autoaggiunti) Bn `e non decrescente. Questa successione `e anche maggiorata dall’operatore I. Infatti, essendo Bn∗ = Bn ≥ 0 vale, per (a) di proposizione 3.49, (x|Bn x) = |(x|Bn x)| ≤ ||Bn ||||x||2. Da (3.50) segue subito che Bn+1 − Bn =
128
3 Spazi di Hilbert e operatori limitati
Bn ≤ I. Possiamo allora applicare la proposizione 3.56 ottenendo che esiste un operatore limitato positivo B0 ≤ I tale che: B0 = s − lim Bn . n→+∞
Vale ulteriormente per la definizione di convergenza nella topologia operaa di toriale forte, per la commutativit` a degli operatori Bk e per la continuit` essi: B0 Bm x = ( lim Bn )Bm x = lim Bn Bm x = lim Bm Bn x n→+∞
n→+∞
n→+∞
= Bm lim Bn x = Bm B0 x . n→+∞
Quindi B0 commuta con ogni Bm e di conseguenza: B02 − Bn2 = (B0 + Bn )(B0 − Bn ) da cui, per n → +∞: ||B02 x − Bn2 x|| ≤ ||B0 + Bn ||||B0 x − Bn x|| ≤ (||B0 || + ||Bn ||)||B0x − Bn x|| ≤ 2||B0 x − Bn x|| → 0 . In altre parole:
B02 x = lim Bn2 x . n→+∞
Passando allora al limite nella relazione ottenuta da (3.49): Bn+1 x =
1 (A0 x + Bn2 x) , 2
troviamo, per ogni x ∈ H, B0 x = cio`e:
1 (A0 x + B02 x) , 2
2B0 = A0 + B02 .
Per concludere, esprimendo l’identit` a di sopra in termini di B := I − B0 , troviamo immediatamente che: B 2 = I − A0 , cio`e,
B2 = A .
Quindi B `e una radice quadrata di A. Si osservi che B ≥ 0 dato che B0 ≤ I e B = I − B0 . Per cui B `e una radice quadrata positiva di A. Ancora, se C `e un operatore limitato che commuta con A, allora commuter`a con A0 e quindi
Radici quadrate di operatori positivi e decomposizione polare
129
con ogni Bn . Di conseguenza C commuter`a con B0 e con B = I − B0 . Proviamo infine l’unicit` a della radice quadrata positiva. Sia V una radice quadrata positiva di A. La radice positiva B costruita sopra ha la propriet` a di commutare con tutti gli operatori che commutano con A. Siccome: AV = V 3 = V A , V e A commutano tra di loro e quindi B dovr` a commutare con V . Fissiamo arbitrariamente x ∈ H e poniamo y := Bx − V x. Abbiamo allora: ||Bx − V x||2 = ([B − V ]x|[B − V ]x) = ([B − V ]x|y) = (x|[B ∗ − V ∗ ]y) = (x|[B − V ]y) .
(3.51)
Mostriamo ora che, nelle nostre ipotesi, By = 0 e V y = 0 separatamente. Ci`o conclude la prova perch´e, per l’arbitrariet`a di x ∈ H, ||Bx − V x|| = 0 implica B =V. Vale: (y|By) + (y|V y) = (y|[B + V ][B − V ]x) = (y|[B 2 − V 2 ]x) = (y|[A − A]x) = 0 . Poich`e (y|V y) ≥ 0 e (y|By) ≥ 0 deve quindi essere: (y|V y) = (y|By) = 0 . Questo implica che V y = By = 0, infatti, se W `e una radice quadrata positiva di V , essendo: ||W y||2 = (W y|W y) = (y|W 2 y) = (y|V y) = 0 , dovr` a essere W y = 0 e, a maggior ragione, V y = W (W y) = 0. Nello stesso modo si trova By = 0. √ Non resta che provare che A `e biettivo se lo `e A. Se A `e √ biettivo, allora −1 commuta con A−1 , di conseguenza commuta con A anche A. Si verifica √ √ −1 −1 allora immediatamente che A A = AA ` e inverso destro e sinistro di √ A, che `e di conseguenza biettivo. Corollario 3.58. Sia H spazio di Hilbert; se A, B ∈ B(H) sono positivi e commutano tra di loro, allora il loro prodotto `e un operatore limitato positivo. √ Dimostrazione. B commuta con A, perci`o √ √ √ √ √ 2 (x|ABx) = (x|A B x) = (x| BA Bx) = ( Bx|A Bx) ≥ 0 . Concludiamo la sezione mostrando che ogni operatore limitato A su uno spazio di Hilbert ammette una decomposizione, A = U P , in un prodotto di un operatore positivo P , univocamente determinato, e un operatore isometrico U definito sul rango di quello positivo ed ivi univocamente determinato. Tale decomposizione si dice decomposizione polare dell’operatore e ha molteplici applicazioni in fisica matematica. Una definizione preliminare `e necessaria.
130
3 Spazi di Hilbert e operatori limitati
Definizione 3.59. Siano H spazio di Hilbert e A ∈ B(H). L’operatore limitato, positivo e quindi autoaggiunto: √ |A| := A∗ A , (3.52) `e detto valore assoluto di A. Osservazione 3.60. Valendo, per ogni x ∈ H: || |A| x||2 = (x| |A|2x) = (x|A∗Ax) = ||Ax||2, otteniamo: || |A| x|| = ||Ax|| ,
(3.53)
Ker(|A|) = Ker(A)
(3.54)
da cui segue che: e quindi |A| `e iniettivo se e solo se lo `e A. Un’altra utile propriet` a `e: Ran(|A|) = (Ker(A))⊥ ,
(3.55)
che vale in quanto Ran(|A|) = ((Ran(|A|))⊥ )⊥ = (Ker(|A|∗ ))⊥ = (Ker(|A|))⊥ = (Ker(A))⊥ . Passiamo al teorema di decomposizione polare. Teorema 3.61. (Di decomposizione polare per operatori limitati.) Siano H spazio di Hilbert e A ∈ B(H). Valgono i fatti seguenti. (a) Esiste una sola coppia di operatori P, U ∈ B(H) tali che sono vere, insieme, le condizioni seguenti: (1) vale la decomposizione: A = UP ,
(3.56)
(2) P `e positivo, (3) U `e isometrico su Ran(P ) (ossia ||U x|| = ||x|| per ogni x ∈ Ran(P )), (4) Ker(U ) ⊃ Ker(P ) (o equivalentemente (4)’ Ker(U ) ⊃ Ker(A)). (b) Risulta essere P = |A| e quindi Ker(U ) = Ker(A) = (Ran(P ))⊥ . (c) Se A `e biettivo, U coincide con l’operatore unitario A|A|−1 . Dimostrazione. (a) Cominciamo con il provare l’unicit` a. Se esiste la decomposizione (3.56) A = U P con P ≥ 0 (oltre che limitato) e U limitato, allora A∗ = P U ∗, essendo P autoaggiunto perch´e positivo ((c) in teorema 3.57); quindi A∗ A = P U ∗U P . (3.57) La condizione che U sia isometrico su Ran(P ) si scrive (U P x|U P y) = (P x|P y) per ogni x, y ∈ H, che equivale a (x|[P U ∗U P − P 2 ]y) = 0 per ogni x, y ∈ H. Quindi P U ∗U P = P 2 . Sostituendo in (3.57) concludiamo che deve
Radici quadrate di operatori positivi e decomposizione polare
131
essere P 2 = A∗ A e dunque, essendo P positivo ed estraendo l’unica radice quadrata positiva (teorema 3.57) ad ambo membri, troviamo P = |A|. Quindi, se esiste una decomposizione con i requisiti fissati in (a), necessariamente P = |A|. Mostriamo che anche U `e fissato unicamente. Notiamo che H = Ker(P ) ⊕ (Ker(P ))⊥ ma, usando (d) di proposizione 3.38 e la (e) del teorema 3.3, vale anche (Ker(P ))⊥ = Ran(P ∗) = Ran(P ) per il fatto che P `e autoaggiunto. Quindi H = Ker(P ) ⊕ Ran(P ). Per assegnare un operatore su H, `e sufficiente assegnarlo su ciascuno dei due addendi della somma diretta scritta sopra: U = 0 su Ker(P ) nelle ipotesi del teorema, mentre la condizione U P x = Ax per ogni x ∈ H fissa univocamente U su Ran(P ). D’altra parte, essendo per ipotesi U limitato, lo sar` a anche se ristretto a Ran(P ). Un operatore limitato definito in un dominio denso `e estendibile univocamente ad un operatore limitato definito sulla chiusura del dominio (vedi proposizione 2.57). Quindi, per le ipotesi fatte, U `e in realt`a fissato su tutto Ran(P ) e quindi su tutto H. La dimostrazione di unicit` a `e conclusa. Passiamo a quella di esistenza. In base a quanto visto sopra, `e necessario, innanzi tutto, mostrare che la condizione U P = A con P = |A|, riscritta equivalentemente come U : |A|x → Ax per ogni x ∈ H, definisce effettivamente un operatore, che indicheremo con U0 , su Ran(|A|). Perch´e tale funzione sia ben definita `e necessario sufficiente che valga |A|x = |A|y ⇒ Ax = Ay, altrimenti non avremmo una funzione. Notiamo che, da (3.53), se |A|x = |A|y, allora Ax = Ay e quindi l’applicazione U0 : Ran(|A|) |A|x → Ax `e ben definita (non `e plurivoca). Il fatto che U0 sia lineare `e ovvio per costruzione, come lo `e il fatto che sia un’isometria, poich´e U0 preserva le norme per (3.53) (si tenga conto dell’esercizio 3.9). Il fatto che U0 sia un’isometria su Ran(|A|) implica, per continuit` a, che si estenda in modo unico ad un’isometria sulla chiusura di Ran(|A|). Indichiamo ancora con U0 tale estensione. Infine definiamo un operatore U : H → H tale che, rispetto alla somma diretta vista sopra H = Ker(|A|) ⊕ Ran(|A|), si decomponga in ` immediato verificare che U ∈ B(H) U Ker(|A|) := 0 e U Ran(|A|):= U0 . E e che U soddisfa (3.56) per costruzione. Infine vale Ker(U ) ⊃ Ker(|A|) per costruzione. Proviamo, per concludere, che i due nuclei in realt`a coincidono. Ogni eventuale u con U u = 0 si decompone come u0 + x, con u0 ∈ Ker(|A|), su cui U si annulla, e x ∈ Ran(|A|), per cui deve valere U0 x = 0. Dato che su tale spazio U0 `e isometrico, deve essere x = 0 e quindi u = u0 ∈ Ker(|A|). Quindi Ker(U ) ⊂ Ker(|A|) e, tenendo conto anche dell’altra inclusione, vale infine Ker(U ) = Ker(|A|) = Ker(A) per (3.54). (b) `e gi`a stato provato completamente provando (a). (c) Se A `e iniettivo, usando (b), si trova che Ker(A) = Ker(U ) `e banale e quindi U `e iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A `e suriettivo, deve esserlo U . Concludiamo che, se A `e biettivo, U deve essere tale. In tal caso, per (b), U `e un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed `e quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| `e biettivo e quindi possiamo scrivere: U = A|A|−1 .
132
3 Spazi di Hilbert e operatori limitati
Definizione 3.62. Siano H spazio di Hilbert e A ∈ B(H). Si dice decomposizione polare dell’operatore A la decomposizione A = UP ,
(3.58)
dove P, U ∈ B(H) soddisfano le propriet` a: P `e positivo, U `e isometrico su Ran(P ) e Ker(U ) = Ker(P ). Un corollario del teorema di decomposizione polare, utile in varie applicazioni, `e il seguente. Corollario 3.63. (Del teorema 3.61.) Nelle ipotesi del teorema 3.61, se U |A| = A `e la decomposizione polare di A, vale l’identit` a: |A∗| = U |A|U ∗ .
(3.59)
Dimostrazione. Da A = U |A| segue immediatamente che A∗ = |A|U ∗ = U ∗ U |A|U ∗, dove si `e tenuto conto del fatto che U ∗ U |A| = |A|, dato che U `e isometrico su Ran(|A|). Quindi, per l’operatore autoaggiunto AA∗ vale: AA∗ = U |A|U ∗ U |A|U ∗ . Dato che U |A|U ∗ `e evidentemente positivo, avremo, per l’unicit` a della radice quadrata: √ |A∗| = (A∗ )∗ A∗ = AA∗ = U |A|U ∗ .
Questo prova la tesi.
3.6 La trasformata di Fourier-Plancherel Introduciamo molto concisamente, in questa ultima sezione, i risultati pi` u importanti riguardanti la teoria della trasformata di Fourier e di FourierPlancherel, senza tuttavia introdurre la teoria delle distribuzioni di Schwartz [Rud91, ReSi80, Vla81]. Notazione 3.64. D’ora in poi faremo uso delle notazioni introdotte nell’esempio 2.96 riguardo agli operatori differenziali, in particolare xk ∈ R indicher`a la componente k-esima di x ∈ Rn , dx denoter`a l’ordinaria misura di Lebesgue in Rn , infine: αn 1 M α (x) := xα 1 · · · xn
per ogni multindice α = (α1 , . . . , αn) .
Con D(Rn ) indicheremo lo spazio (anche indicato in letteratura con Cc∞(Rn ) o anche C0∞ (Rn )) delle funzioni a valori complessi infinitamente differenziabili con supporto compatto. Con S(Rn ) indicheremo lo spazio di Schwartz (vedi esempio 2.96) su Rn . Con le notazioni introdotte, S(Rn ) `e lo spazio vettoriale complesso delle funzioni C ∞(Rn ) a valori complessi che godono dell’ulteriore
3.6 La trasformata di Fourier-Plancherel
133
propriet` a: per ogni f ∈ S(Rn ) e per ogni coppia di multindici α e β, esiste K < +∞ (dipendente da f, α e β!) tale che |M α (x)∂xβ f(x)| ≤ K,
per ogni x ∈ Rn .
(3.60)
Le norme || ||1 , || ||2 e || ||∞ in questa sezione denoteranno rispettivamente la norma di L1 (Rn , dx), L2 (Rn , dx) e L∞ (Rn , dx) (vedi (6) e (8) in esempi 2.39). Precisiamo di seguito una serie di propriet` a ben note degli spazi e degli operatori introdotti sopra. (1) Gli spazi D(Rn ) e S(Rn ) sono invarianti sotto l’azione degli operatori α M (x) (visto come operatore moltiplicativo) e ∂xα . In altre parole, le funzioni di ciascuno dei due spazi rimangono nel rispettivo spazio quando trasformate sotto l’azione di M α (x) e ∂xα . ` chiaro che D(Rn ) ⊂ Lp (R, dx) come sottospazio per ogni 1 ≤ p ≤ ∞, (2) E dato che i compatti su Rn hanno misura di Lebesgue finita e che ogni f ∈ D(Rn ) `e continua e quindi limitata sui compatti. (3) Vale anche che S(Rn ) ⊂ Lp (R, dx) per ogni 1 ≤ p ≤ ∞ come sottospazio. Infatti, se C ⊂ Rn `e un compatto contenente l’origine, f ∈ S(Rn ) `e limitata su C essendo ivi continua e, fuori da C, vale |f(x)| ≤ Cn |x|−n per ogni n = 0, 1, 2, 3, . . . pur di scegliere Cn ≥ 0 sufficientemente grande. In definitiva |f| `e limitata su Rn e quindi appartiene a L∞ ma, per ogni p ∈ [1, +∞), `e anche limitata da una funzione che appartiene a Lp : tale funzione `e costante su C e vale Cn /|x|n con n > 1/p fuori da C. (4) Oltre al fatto ovvio che D(Rn ) ⊂ S(Rn ), ricordiamo un fatto notissimo (indipendente dai risultati che troveremo in questa sezione) che sar` a utile tra poco [KiGv83]: Proposizione 3.65. Gli spazi D(Rn ) e S(Rn ) sono sottospazi densi in Lp (R, dx) per ogni 1 ≤ p < ∞. (5) Vale infine il seguente importante Lemma la cui dimostrazione si pu` o trovare in [Bre86] (Corollario IV.24) ed `e indipendente dai risultati che troveremo in questa sezione. Lemma 3.66. Se f ∈ L1 (Rn , dx) e f(x)g(x) dx = 0 Rn
per ogni g ∈ D(Rn ) ,
allora f(x) = 0 quasi ovunque rispetto alla misura di Lebesgue dx su Rn . Possiamo ora introdurre le prime definizioni elementari riguardanti la trasformata di Fourier.
134
3 Spazi di Hilbert e operatori limitati
Definizione 3.67. Le funzioni lineari da L1 (Rn , dx) in L∞ (Rn , dx) definite da: eik·x (F f)(k) := f(x) dx , se f ∈ L1 (Rn , dx) e ogni k ∈ Rn ,(3.61) n/2 Rn (2π) e−ik·x g(k) dk , se g ∈ L1 (Rn , dk) e ogni x ∈ Rn(3.62) (F− g)(x) := n/2 n (2π) R sono dette rispettivamente: trasformata di Fourier e trasformata inversa di Fourier. Osservazioni 3.68. (1) Si osservi che dk indica comunque la misura di Lebesgue in Rn . Abbiamo usato un nuovo nome per la variabile di Rn (k invece di x) nell’esplicitare la trasformata inversa di Fourier solo perch´e tale notazione `e quella tradizionale e ci`o si riveler`a comodo nei calcoli. ` ovvio che, per le propriet` (2) E a elementari dell’integrale,
dx
dxn ik·x ik·x
|(F f)(k)| ≤ ≤ e f(x) |e | |f(x)| (2π)n/2 (2π)n/2 Rn Rn dx ||f||1 = |f(x)| = n/2 (2π) (2π)n/2 Rn e similmente |(F− g)(x)| ≤ ||g||1/(2π n/2 ) per ogni x, k ∈ Rn , per cui ha senso definire la trasformata di Fourier e la trasformata inversa di Fourier come operatori a valori almeno in L∞ (Rn , dx). Nel seguito presenteremo solo le propriet`a pi` u immediate della trasformata di Fourier che si connettono pi` u direttamente con la trasformazione di FourierPlancherel. Tralasceremo importanti risultati come la continuit`a rispetto alla topologia naturale indotta da seminorme nello spazio di Schwartz, per i quali si rimanda a qualsiasi testo di teoria delle funzioni ed analisi funzionale oppure teoria delle distribuzioni [Rud91, ReSi80, Vla81] (vedi anche la sezione 2.4.4). Proposizione 3.69. La trasformazione di Fourier e la trasformazione inversa di Fourier godono delle seguenti propriet` a. (a) Sono continue rispetto alle norme naturali del dominio e codominio, valendo le disuguaglianze: ||Ff||∞ ≤
||f||1 (2π)n/2
e ||F−g||∞ ≤
||g||1 . (2π)n/2
(b) Lo spazio di Schwartz `e invariante sotto F e F− , cio`e: F (S(Rn )) ⊂ S(Rn ) e F− (S(Rn )) ⊂ S(Rn ). (c) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono una l’inversa dell’altra: se f ∈ S(Rn ), allora: eik·x f(x) dx g(k) = n/2 Rn (2π)
3.6 La trasformata di Fourier-Plancherel
se e solo se
f(x) = Rn
135
e−ik·x g(k) dk . (2π)n/2
(d) Le due trasformazioni ristrette allo spazio invariante S(Rn ) sono isometriche rispetto al semi prodotto scalare di L2 (Rn , dxn): se f1 , f2 , g1 , g2 ∈ S(Rn ), allora (F f1 )(k)(Ff2 )(k)dk = f1 (x)f2 (x)dx Rn
e
Rn
Rn
(F− g1 )(x)(F− g2 )(x)dx =
Rn
g1 (k)g2 (k)dk .
(e) Le due trasformazioni individuano trasformazioni limitate da L1 (Rn , dx) a C0 (Rn ) (lo spazio delle funzioni continue che tendono a zero all’infinito (4) in esempi 2.39) e pertanto vale il Lemma di Riemann-Lebesgue: per ogni f ∈ L1 (Rn , dx), (F f) (k) → 0 per |x| → +∞ e vale l’analoga propriet` a per F− . (f ) Le due trasformazioni, definite su L1 (Rn , dx), sono iniettive. Osservazione 3.70. Riguardo al punto (f), si pu` o dimostrare [Rud91] ancora pi` u fortemente che se f ∈ L1 (Rn , dx) `e tale che F f ∈ L1 (Rn , dk), allora vale ` valido lo stesso risultato scambiando il ruolo di F e F− . anche F− (F f) = f. E Prova della proposizione 3.69. (a) `e gi`a stata dimostrata in (2) di osservazioni 3.68. (b) Diamo la prova per F; per F− si pu` o procedere analogamente. Poniamo: eik·x g(k) := f(x) dx . n/2 Rn (2π) Si verifica facilmente che il secondo membro pu`o essere derivato in k tramite un operatore ∂kα facendo passare la derivata sotto il segno di integrale. Infatti risulta immediatamente che:
α ik·x
∂k e f(x) =
i|α|M α (x)eik·xf(x)
≤ |M α (x)f(x)| . La funzione x → |M α (x)f(x)| `e in L1 in quanto f ∈ S(Rn ). Dato che il modulo della derivata dell’integrando `e maggiorato uniformemente da una funzione positiva ed integrabile, noti teoremi sul passaggio del simbolo di derivata sotto quello di integrale (basati sul teorema della convergenza dominata di Lebesgue, vedi l’appendice in fondo al libro) permettono di concludere che: ∂kα g(k) = i|α|
Rn
eik·x M α (x)f(x) dx . (2π)n/2
(3.63)
136
3 Spazi di Hilbert e operatori limitati
Notando che f si annulla pi` u rapidamente di ogni potenza inversa di |x| per |x| → +∞, si trova che: ik·x
e M β (k)g(k) = f(x) dx (−i)|β| ∂xβ (2π)n/2 Rn e quindi, usando l’integrazione per parti, eik·x β ∂ f(x) dx . M β (k)g(k) = i|β| n/2 x Rn (2π)
(3.64)
Quindi, inserendo ∂kα g al posto della funzione g in (3.64) e tenendo conto di (a), si ha:
|M β (k)∂kα g(k)| ≤
∂ β (M α f)
1 , per ogni k ∈ Rn . Essendo finito il secondo membro, in quanto f ∈ S(Rn ), ed essendo α e β arbitrari, concludiamo che g ∈ S(Rn ). (c) Le identit` a (3.63) e (3.64) si scrivono in altro modo come: ∂ α F = i|α| F M α , |β|
M F=i β
(3.65)
F∂ , β
(3.66)
dove F `e in realt` a la restrizione della trasformata di Fourier a S(Rn ). Osservando che: F h = F− h per ogni h ∈ S(Rn ), si ricava facilmente: ∂ α F− = (−1)|α| i|α| F− M α , M β F− = (−1)|β| i|β| F− ∂ β .
(3.67) (3.68)
Dalle (3.65), (3.66), (3.67) e (3.68), troviamo in particolare che: F F− M α = M α F F− , F− F M α = M α F− F ,
(3.69) (3.70)
dove M α `e pensato come operatore moltiplicativo (M α f)(x) := M α (x)f(x), e anche F F − ∂ α = ∂ α F F− ,
(3.71)
F− F ∂ α = ∂ α F− F .
(3.72)
Mostreremo ora che, in virt` u di tali relazioni di commutazione, gli operatori J := F F− e J− := F− F devono essere l’operatore identit` a di S(Rn ). Per prima cosa proviamo che, fissati x0 ∈ Rn e f ∈ S(Rn ), il valore di (Jf)(x0 ) dipende solo da f(x0 ). Se f ∈ S(Rn ) possiamo sempre scrivere: 1 n df(x0 + t(x − x0 )) (xi − x0i )gi (x) , f(x) = f(x0 ) + dt = f(x0 ) + dt 0 i=1
3.6 La trasformata di Fourier-Plancherel
137
dove le funzioni gi (che sono C ∞ (Rn ), come si verifica facilmente) sono definite da: 1 ∂ gi (x) := f(x0 + t(x − x0 ))dt ∂xi 0 e dunque, se f1 , f2 ∈ S(Rn ) e f1 (x0 ) = f2 (x0 ), risulta: f1 (x) = f2 (x) +
n
(xi − x0i )hi (x) ,
(3.73)
i=1
dove, per differenza, la funzione x → ni=1 (xi − x0i )hi (x) e quindi le funzioni hi sono in S(Rn ). Applicando J ad ambo i membri di (3.73) e tenendo conto del fatto che J commuta con i polinomi in x per (3.69), otteniamo: (Jf1 )(x) = (Jf2 )(x) +
n
(xi − x0i )(Jhi )(x) .
i=1
Prendendo x = x0 , si vede che (Jf1 )(x0 ) = (Jf2 )(x0 ) sotto l’ipotesi iniziale di f1 (x0 ) = f2 (x0 ). Quindi, come dicevamo, (Jf)(x0 ) `e una funzione soltanto di f(x0 ). Tale funzione deve anche essere lineare, dato che J `e lineare per costruzione. Ne consegue che sar`a (Jf)(x0 ) = j(x0 )f(x0 ), dove j `e una funzione su Rn a valori in C. Per l’arbitrariet` a di x0 , abbiamo provato che J agisce come la moltiplicazione per una funzione j. Si osservi che tale funzione deve essere C ∞. Per provare ci` o, si scelga f ∈ S(Rn ) che valga costantemente 1 in un intorno I(x0 ) di x0 . Se x ∈ I(x0 ), vale (Jf)(x) = j(x). Dato che il primo membro `e C ∞ (I(x0 )), lo deve essere anche il secondo. Valendo ci`o nell’intorno di ogni punto di Rn , vale anche j ∈ C ∞ (Rn ). La (3.71) implica allora che, per ogni f ∈ S(Rn ) ed ogni x ∈ Rn : j(x)
∂ ∂ f(x) = j(x)f(x) . ∂xi ∂xi
Scegliendo, come prima, f con valore costantemente uguale a 1 in un aperto, si ha dall’identit` a di sopra che in quell’aperto tutte le derivate di j devono annullarsi. Dato che ci` o vale nell’intorno di ogni punto di Rn che `e connesso, la funzione continua j deve essere una funzione costante su tutto Rn . Il valore della costante ovviamente non dipende dall’argomento di J e quindi pu` o essere calcolato valutando J su una funzione arbitraria di S(Rn ). Un utile esercizio 2 `e quello di calcolare J sulla funzione x → e−x e si vede che il valore della costante `e proprio 1. La prova per J− si esegue nello stesso modo. (d) Usando (c) la tesi si prova immediatamente. Facciamo la dimostrazione per F ; quella per F− `e essenzialmente la stessa. Se f1 , f2 ∈ S(Rn ), poniamo, per i = 1, 2: eik·x gi (k) := f (x) dx . n/2 i Rn (2π)
138
3 Spazi di Hilbert e operatori limitati
` immediato verificare che, nelle nostre ipotesi, possiamo usare il teorema di E Fubini-Tonelli, ottenendo: eik·x g1 (k)g2 (k)dk = g1 (k) f (x)dxdk n/2 2 Rn Rn Rn (2π) eik·x = g (k)f2 (x)dx ⊗ dk . n/2 1 Rn ×Rn (2π) Usando nuovamente il teorema di Fubini-Tonelli per l’ultimo integrale opportunamente riscritto, abbiamo: g1 (k)g2 (k)dk Rn
= Rn ×Rn
e−ik·x e−ik·x g (k)f (x)dx ⊗ dk = f (x) g (k)dkdx 1 2 2 n/2 n/2 1 (2π) Rn Rn (2π) = f1 (x)f2 (x)dx , Rn
dove abbiamo usato il risultato in (c). Questa `e la tesi che volevamo provare. (e) Facciamo la dimostrazione per F , p per F− la dimostrazione `e analoga. Si osservi anche che entrambe le trasformazioni sono ben definite su L1 (Rn , dx) dato che l’integrale `e invariante quando alteriamo le funzioni su insiemi di mi||f||1 sura di Lebesgue nulla. La stima ||Ff||∞ ≤ (2π) n/2 assicura che l’applicazione n n n lineare F : S(R ) → S(R ) ⊂ C0 (R ) `e continua quando il dominio `e dotato della norma L1 e il codominio della norma || · ||∞. Dato che S(Rn ) `e denso in L1 nella norma detta e il codominio `e completo rispetto alla seconda norma, la trasformata di Fourier inizialmente definita su S(Rn ) si estende per continuit`a unicamente (e quindi coincide con la trasf. lineare gi` a definita su L1 (Rn , dx)) 1 n ad una trasformazione lineare limitata da L (R , dx) a C0 (Rn ) che conserva la stessa norma per la proposizione 2.57. Dato che, se f ∈ L1 , F f ∈ C0 (Rn ), per ogni > 0 esiste un compatto K ⊂ Rn tale che |(F f)(k)| < se k ∈ K . Scegliendo per ogni > 0 una palla di raggio r centrata nell’origine tanto grande da includere K , concludiamo che, per ogni > 0 esiste un reale r > 0 tale che |(F f)(k)| < se |k| > r . (f) Facciamo la dimostrazione per F , p per F− la dimostrazione `e analoga. Dato che l’operatore F `e lineare, `e sufficiente dimostrare che se F f `e la funzione nulla, allora f `e quasi ovunque nulla. Si supponga pertanto che: eik·x f(x) dx = 0 , per ogni k ∈ Rn . n/2 Rn (2π) Se g ∈ S(Rn ), applicando il teorema di Fubini-Tonelli, abbiamo che:
eik·x eik·x 0= g(k) f(x) dx dk = g(k) dk f(x) dx . n/2 n/2 Rn Rn (2π) Rn Rn (2π)
3.6 La trasformata di Fourier-Plancherel
139
Dato che F `e biettiva su S(Rn ), quanto ottenuto `e equivalente a dire che (notare che ψf ∈ L1 (Rn , dx) per ogni ψ ∈ S(Rn ) dato che ψ `e limitata): ψ(x)f(x) dx = 0 per ogni ψ ∈ S(Rn ). Rn
Dato che D(Rn ) ⊂ S(Rn ), il lemma 3.66 implica che f `e nulla quasi ovunque. Passiamo ad introdurre la trasformata di Fourier-Plancherel. Dato che S(Rn ) `e denso in L2 (Rn ), passando alle classi di equivalenza di funzioni si potr` a dire che S(Rn ) individua un sottospazio denso, che indicheremo ancora con lo stesso simbolo S(Rn ), nello spazio di Hilbert L2 (Rn ). Gli operatori F e F− possono essere pensati come definiti su tale sottospazio denso in L2 (R, dx). Il punto (d) della proposizione 3.69 implica in particolare che tali operatori sono limitati con norma pari a 1, dato che sono operatori isometrici. Come sappiamo dalla proposizione 2.57), F e F− individueranno univocamente due operatori lineari limitati su tutto L2 (Rn , dx). Per esempio, l’operatore che estende F su L2 (Rn , dx) `e definito come, se f ∈ L2 (Rn , dx), Ff := lim F fn , n→+∞
dove {fn }n∈N ⊂ S(Rn ) `e una qualunque successione che converge a f nella topologia di L2 (Rn , dx) (come provato nell’esercizio citato sopra, il limite esiste sempre e non dipende dalla successione scelta). Per la continuit` a del prodot to scalare, l’operatore esteso F continuer` a a conservare il prodotto scalare di L2 (R2 , dx) e pertanto F sar`a iniettivo su L2 (Rn , dx). In realt` a sar` a anche suriettivo per il seguente motivo elementare. Accanto all’operatore F possiamo similmente costruire l’operatore che estende su L2 (Rn , dx) la trasformata inversa di Fourier F−. Su S(Rn , dx) vale F F− = IS(Rn ) . a e continuit` a, tenendo conto del Passando alle estensioni su L2 per linearit` fatto che l’unica estensione lineare dell’identit`a su S(Rn , dx) (costruita con la procedura generale detta sopra) `e l’identit`a su L2 (Rn , dx), otteniamo che deve valere FF− = I , dove I `e l’identit` a su L2 (Rn , dx). Questo fatto implica immediatamente la suriettivit`a di F. Definizione 3.71. L’unico operatore F : L2 (Rn , dx) → L2 (Rn , dx) che estende per linearit` a e continuit` a la trasformata di Fourier ristretta a S(Rn ) `e detto trasformazione di Fourier-Plancherel.
140
3 Spazi di Hilbert e operatori limitati
Teorema 3.72. (Di Plancherel.) La trasformazione di Fourier-Plancherel: F : L2 (Rn , dx) → L2 (Rn , dx) `e un operatore lineare biettivo ed isometrico. Dimostrazione. La dimostrazione `e stata data immediatamente prima della definizione 3.71. Rimane aperta una questione. Se f ∈ L1 (Rn , dx)∩L2(Rn , dx) (ma f ∈ S(Rn )), a priori F f e Ff sono diversi, perch´e per definire F non abbiamo esteso F partendo da L1 (Rn , dx), ma siamo partiti dal suo sottospazio S(Rn ). Questa era l’unica possibilit` a, visto che L1 (Rn , dx) ⊂ L2 (Rn , dx). La seguente proposizione fa luce sulla questione, dando anche un metodo pratico per calcolare la trasformata di Fourier-Plancherel in termini di limiti di quella di Fourier. Osservazione 3.73. Ricordiamo che se K ⊂ Rn `e un insieme di misura finita ed in particolare se K `e un compatto (i compatti hanno misura di Lebesgue finita), allora: (1) L2 (K, dx) ⊂ L1 (K, dx). (2) se {fn }n∈N ⊂ L2 (K, dx) converge nella norma || ||2 a f ∈ L2 (K, dx) allora converge alla stessa funzione anche nella norma || ||1 . (3) L∞ (K, dx) ⊂ Lp (K, dx) per 1 ≤ p < ∞. (4) se {fn }n∈N ⊂ L∞ (K, dx) converge nella norma || ||∞ a f ∈ L∞ (K, dx), allora converge alla stessa funzione anche nella norma || ||p . Queste quattro affermazioni si provano immediatamente come segue, tenendo conto, per le prime due, che la funzione che vale costantemente 1 su un compatto, che quindi ha misura finita, `e integrabile. Per la prima affermazione si osservi che vale: 2|f(x)| ≤ |f(x)|2 + 1 , per cui l’integrale del primo membro `e maggiorato da quello del secondo. Per la seconda affermazione si noti che, dalla disuguaglianza di Cauchy-Schwarz
2 |g(x)| 1 dx
≤
K
|g(x)|2 dx
K
1dx
,
K
sostituendo f(x) − fn (x) a g(x) si ha la prova della seconda affermazione. Riguardo alla terza e quarta affermazione `e sufficiente notare che, per la stessa definizione di integrale di Lebesgue: |g|p dx ≤ ess sup |g|p dx = (||g||∞)p dx K
K
K
per ogni funzione misurabile g definita su K.
K
3.6 La trasformata di Fourier-Plancherel
141
Proposizione 3.74. La trasformazione di Fourier-Plancherel e quella di Fourier godono delle seguenti propriet` a. (a) Se f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx), la sua trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier F f calcolata direttamente con la formula integrale (3.61). (b) Se f ∈ L2 (Rn , dx), la sua trasformata di Fourier-Plancherel pu` o essere calcolata come: Fˆ f = lim gn , n→+∞
dove il limite `e nel senso di L2 (Rn , dk): gn (k) := Kn
eik·x f(x)dx , (2π)n/2
(3.74)
essendo gli insiemi Kn ⊂ Rn tutti compatti e tali che Km+1 ⊃ Km per m = n 1, 2, . . ., con ∪∞ m=1 Km = R . Dimostrazione. (a) Cominciamo a provare la tesi per le funzioni f ∈ L2 (Rn , dx) tali che f sia differente da 0 su un insieme di misura nulla fuori da un compatto K0 . In questo caso f appartiene anche a L1 (Rn , dx). Sia quindi {sn }n∈N ⊂ S(Rn ) una successione di funzioni che tendono a f nella norma di L2 (Rn , dx). Se B e B sono due palle aperte di raggio finito tali che B ⊃ B ⊃ B ⊃ K0 , possiamo costruire una funzione h ∈ D(Rn ) tale da valere ` chiaro che se fn := h · sn , costantemente 1 su B e da annullarsi fuori da B. E la successione {fn } `e costituita da funzioni di D(Rn ), e quindi S(Rn ), con supporti contenuti nel compatto K := B. Quindi tutte le fn sono anche in L1 (Rn , dx) e la successione {fn } tende a f sia nella norma di L2 (Rn , dx) che in quella di L1 (Rn , dx). Per definizione, valendo fn → f nella norma || ||2 , sar`a: ||Ffn − Fˆ f||2 → 0
(3.75)
per n → +∞. D’altra parte, dato che fn → f anche nella norma || ||1 , per (a) di proposizione 3.69 ||Ffn − Ff||∞ → 0 per n → +∞. Dato che, sugli insiemi di misura finita, la convergenza nella norma || ||∞ implica quella nella norma || ||2 , avremo che: (3.76) ||Ffn − Ff||2 → 0 = F f. e quindi, valendo (3.75) e per l’unicit` a del limite, dovr` a essere Ff Supponiamo ora che f ∈ L2 (Rn , dx) ∩ L1 (Rn , dx) senza altre restrizioni. Consideriamo una classe di compatti {Kn } che soddisfino le ipotesi nel punto (b). Definiamo le funzioni fn := χKn · f, dove χE `e la funzione caratteristica dell’insieme E (definita in modo che χE (x) = 0 se x ∈ E e χE (x) = 1 ` chiaro che vale fn → f puntualmente per n → +∞. Inoltre se x ∈ E). E |f(x) − fn (x)|p ≤ |f(x)|p per p = 1, 2, . . .. Allora, per il teorema della convergenza dominata di Lebesgue, fn → f per n → +∞ in particolare rispetto alla
142
3 Spazi di Hilbert e operatori limitati
norma || ||1 e a quella || ||2 . D’altra parte, per quanto dimostrato sopra: F fn = Ffn . Quindi, per (a) di proposizione 3.69, troviamo che ||Ff − F fn ||∞ → 0 ed allo − Ffn ||2 → 0. Questi fatti varranno anche per le stesso tempo vale anche ||Ff funzioni che si ottengono restringendo Ff, F f, F fn ad un qualsiasi compatto K. Tenendo conto che per funzioni nulle fuori da un compatto la convergenza uniforme implica quella in L2 , si ha che se x appartiene ad un compatto qualsiasi, (F f)(x) = (Ff)(x) quasi ovunque. Ma ogni x ∈ Rn appartiene ad un compatto, per cui F f = Ff come elementi di L2 (Rn , dx). (b) La prova `e stata data nella parte finale della dimostrazione del punto (a). Esempi 3.75. (1) Un fatto piuttosto importante che distingue nettamente lo spazio D(Rn ) da S(Rn ) `e che il primo spazio, al contrario del secondo, non `e invariante sotto ` infatti la trasformazione di Fourier (e la trasformata inversa di Fourier). E n n n n chiaro che, essendo D(R ) ⊂ S(R ), vale F (D(R )) ⊂ F (S(R )) ⊂ S(Rn ), tuttavia non si pu` o chiedere di pi` u. Infatti vale il seguente risultato. Proposizione 3.76. Sia f ∈ D(Rn ), se anche Ff ∈ D(Rn ), allora f = 0. Lo stesso fatto vale per la trasformata inversa di Fourier. Dimostrazione. La prova `e semplice; la svolgiamo per F , ma la stessa prova vale anche per F− . Se vale: eip·x g(k) = f(x) dx , n/2 Rn (2π) dove f ha supporto compatto, allora l’integrale di sopra converge anche per k ∈ Cn . Inoltre, facendo uso del teorema della convergenza dominata di Lebesgue, si pu` o far passare la derivata nelle componenti ki di k, e nelle loro parti reale ed immaginaria, sotto il segno di integrale. Dato che k → eik·x `e analitica (cio`e analitica in ogni variabile ki separatamente), soddisfer`a le condizioni di Cauchy-Riemann in ogni variabile ki . Di conseguenza tali condizioni saranno soddisfatte anche per la funzione g in ogni variabile ki . Si conclude che g `e una funzione analitica su tutto Cn . La restrizione di g ad Rn definir` a, tramite la parte reale e quella immaginaria, due funzioni analitiche di variabile reale su tutto Rn . Se g ha supporto compatto, esister`a un aperto non vuoto di Rn ` un fatto ben noto nella teoria delle funzioni in cui Re g e Im g si annullano. E analitiche (reali di variabile reale) che se una funzione analitica definita su un aperto connesso (in questo caso tutto Rn ) si annulla su un aperto non vuoto incluso nel suo dominio, allora si annulla ovunque nel dominio. Dobbiamo quindi concludere che, nelle nostre ipotesi su f, se g ha supporto compatto, essa deve necessariamente essere la funzione nulla. Tale dovr`a anche essere f, in quanto F `e invertibile su S(Rn ).
3.6 La trasformata di Fourier-Plancherel
143
(2) Un fatto connesso con (1) `e il noto teorema di Paley-Wiener (vedi per es. [KiGv83]): Teorema 3.77. (Di Paley-Wiener.) Sia a > 0 e si consideri L2 ([−a, a], dx) come sottospazio di L2 (R, dx). Lo spazio Fˆ (L2 ([−a, a], dx)) contiene tutte e sole le funzioni g = g(k) tali che ciascuna di esse possa essere estesa analiticamente ed univocamente a tutto il piano complesso nella variabile k ∈ C in una funzione analitica che soddisfi: |g(k)| ≤ Ce2πa|Imk| ,
per ogni k ∈ C
per qualche costante C ≥ 0 dipendente da g. Visto che deve essere Fˆ (L2 ([−a, a], dx)) ⊂ L2 (R, dk) per il teorema di Plancherel, il teorema di Paley-Wiener implica che le funzioni analitiche g che sono limitate secondo la disuguaglianza di sopra per qualche costante C ≥ 0, individuano elementi di L2 (R, dk) quando k `e ristretta a R. Per concludere, consideriamo lo spazio L2 ((a, b), dx), dove −∞ ≤ a < b ≤ +∞ e dx denota l’usuale misura di Lebesgue su R. Sussiste la seguente utilissima proposizione usata in (4) di esempi 3.33 per costruire basi Hilbertiane che deriva dalla teoria della trasformata di Fourier-Plancherel. Proposizione 3.78. Sia f : (a, b) → C misurabile tale che: (1) l’insieme {x ∈ (a, b) | f(x) = 0} ha misura nulla, (2) esistono C, δ > 0 per cui |f(x)| < Ce−δ|x| per ogni x ∈ (a, b). In questo caso lo spazio lineare finitamente generato da tutte le funzioni della forma x → xn f(x) := fn (x) per n = 0, 1, 2, . . . `e denso in L2 ((a, b), dx). ` sufficiente provare che S ⊥ = {0} dato che Dimostrazione. Sia S := {fn }n∈N . E ⊥ 2 `e S ⊕ < S > = L ((a, b), dx) per il teorema 3.14. Sia allora h ∈ L2 ((a, b), dx) tale che b
xn f(x)h(x)dx = 0 a
per ogni n = 0, 1, 2, . . .. Possiamo estendere la funzione h a tutta la retta reale definendola nulla fuori da (a, b). La condizione di sopra si riscrive: xn f(x)h(x)dx = 0 , (3.77) R
per ogni n = 0, 1, 2, . . .. Valgono inoltre i seguenti fatti: (i) f · h ∈ L1 (R, dx): infatti entrambe le funzioni sono in L2 (R, dx), per cui il loro prodotto `e in L1 (R, dx), (ii) f · h ∈ L2 (R, dx), perch´e |f(x)|2 < C 2 e−2δ|x| < C 2 < +∞ e |h|2 `e integrabile per ipotesi, (iii) la funzione che manda x ∈ R in eδ |x|f(x)h(x) `e in L1 (R, dx) per ogni δ < δ |x| δ. Infatti, essendo x → |e f(x)| ≤ Ce−(δ−δ )|x| , la funzione x → eδ |x|f(x)
144
3 Spazi di Hilbert e operatori limitati
`e in L2 (R, dx); inoltre h ∈ L2 (R, dx) per ipotesi, per cui il loro prodotto `e in L1 (R, dx). Per (i) possiamo calcolare la trasformata di Fourier: ik·x e √ f(x)h(x) dx . g(k) = 2π R Questa coincider` a con la trasformata di Fourier-Plancherel di f · h per i punti (i) e (ii) insieme, tenuto conto di (a) della proposizione 3.74. Per (iii), se k `e complesso e |Imk| < δ, la funzione g = g(k) di sopra `e ben definita ed analitica nella banda aperta B ⊂ C definita da Rek ∈ R, |Imk| < δ; la prova si costruisce analogamente a quanto fatto nell’esempio (1). Usando il teorema della convergenza dominata di Lebesgue e passando sotto il segno di integrale l’operatore di derivazione, `e infine facile provare che, per ogni n = 0, 1, . . .: dn g in √ | = xn f(x)h(x)dx . k=0 dk n 2π R Tutte queste derivate sono nulle per (3.77), di conseguenza lo sviluppo di Taylor di g nell’origine `e nullo e quindi g si annulla in un disco aperto contenuto nella banda B. Essendo g analitica, si annuller` a identicamente nell’aperto connesso B ed in particolare sull’asse k reale. Quindi, in particolare, avremo che la trasformata di Fourier-Plancherel della funzione f · h `e il vettore nullo di L2 (R, dk). Dato che la trasformata di Fourier-Plancherel `e una trasformazione unitaria dobbiamo concludere che f · h = 0 quasi ovunque su R ed in particolare su (a, b) dove per ipotesi f = 0 quasi ovunque. Ma allora deve essere h = 0 quasi ovunque su (a, b), ovvero ogni h ∈ S ⊥ coincide con l’elemento nullo di L2 ((a, b), dx). Questo conclude la prova.
Esercizi 3.1. Si pu` o dare la definizione di (semi) prodotto scalare anche per spazi vettoriali sul campo reale, semplicemente rimpiazzando la richiesta H2 nella definizione 3.1 con S(u, v) = S(v, u) ed usando solo combinazioni lineari a coefficienti in R in H1. Mostrare che, con la nozione di prodotto scalare reale data sopra, vale ancora la proposizione 3.3, con l’unica differenza che l’identit` a di polarizzazione viene sostituita con la (3.4). 3.2. (Difficile.) Si consideri uno spazio vettoriale con campo reale. Provare che se una (semi) norma p su tale spazio soddisfa l’identit` a del parallelogramma (3.3): p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) , (3.78) allora esiste, ed `e unico, un (semi) prodotto scalare S, definito come indicato nell’esercizio precedente, che induce p tramite la (3.2).
Esercizi
145
Soluzione. Se S `e un (semi) prodotto scalare sullo spazio vettoriale X reale, vale l’identit` a di polarizzazione (3.7): S(x, y) =
1 (S(x + y, x + y) − S(x − y, x − y)) . 4
Da questa identit` a segue immediatamente la prova dell’unicit` a di S, dato che S(z, z) = p(z)2 . Per provare l’esistenza di S per una fissata norma p su X definiamo: 1 S(x, y) := p(x + y)2 − p(x − y)2 . 4 Dimostriamo che S `e un semi prodotto scalare o un prodotto scalare a seconda che p sia una norma o una seminorma. Si osservi che se questo `e vero e se p `e una norma, allora, sostituendo S a p nel secondo membro dell’identit`a di sopra, si ha subito che S(x, x) = 0 implica che x = 0 e quindi S `e un prodotto scalare. Per concludere la dimostrazione dobbiamo provare che, definito S come detto sopra, per x, y, z ∈ X vale: (a) S(αx, y) = αS(x, y) se α ∈ R, (b) S(x + y, z) = S(x, z) + S(y, z), (c) S(x, y) = S(y, x), (d) S(x, x) = p(x)2 . Le propriet`a (c) e (d) seguono immediatamente dalla definizione di S. Dimostriamo le rimanenti due: (a) e (b). Da (3.3) e dalla definizione di S si ha: S(x, z) + S(y, z) = 4−1 p(x + z)2 − p(x − z)2 + p(y + z)2 − p(y − z)2
2
2
x+y x+y x+y −1 p = 2S +z −p −z ,z . =2 2 2 2 Abbiamo ottenuto che:
S(x, z) + S(y, z) = 2S
x+y ,z 2
.
(3.79)
` allora chiaro che (a) implica (b). Non resta che provare (a). Ponendo y = 0 E nell’identit` a (3.79) e tenendo conto del fatto che S(0, z) = 0 per la nostra definizione di S, otteniamo: S(x, z) = 2S(x/2, z) . Iterando la formula abbiamo immediatamente che (a) vale per α = m/2n , dove m, n = 0, 1, 2, . . .. Tali numeri formano un insieme denso in [0, +∞). D’altra parte R α → p(αx + z) e R α → p(αx − z) sono funzioni continue (usando la topologia indotta dalla norma p), ma allora, usando ancora S(x, y) := 1 (p(x + y, x + y) − p(x − y, x − y)), concludiamo che R α → S(αx, y) `e 4
146
3 Spazi di Hilbert e operatori limitati
continua in α e quindi (a) vale per α ∈ [0, +∞). Dalla definizione di S segue ancora che S(−x, y) = −S(x, y) e quindi il risultato si estende a tutti i valori di α ∈ R e la dimostrazione `e conclusa. 3.3. (Difficile.) Mostrare che se, su uno spazio vettoriale sul campo C, una (semi) norma p soddisfa l’identit` a del parallelogramma (3.3): p(x + y)2 + p(x − y)2 = 2(p(x)2 + p(y)2 ) ,
(3.80)
allora esiste, ed `e unico, un (semi) prodotto scalare S che induce p tramite (3.2). Soluzione. Se S `e un (semi) prodotto scalare sullo spazio vettoriale complesso X, vale l’identit` a di polarizzazione (3.4): 4S(x, y) = S(x+y, x+y)−S(x−y, x−y)−iS(x+iy, x+iy)+iS(x−iy, x−iy). Essendo S(z, z) = p(z)2 , come nel caso reale, questa identit`a implica l’unicit` a di S per una data norma p su X. Passiamo alla prova di esistenza. Definiamo, per una data (semi) norma p e per x, y ∈ X: S1 (x, y) := 4−1 (p(x + y)2 − p(x − y)2 ) ,
S(x, y) := S1 (x, y) − iS1 (x, iy) .
Si osservi che S(x, x) = p(x)2 , inoltre, per costruzione, se p `e una norma, segue subito che S(x, x) = 0 implica che x = 0. Rimane solo da provare che S definito come sopra `e un (semi) prodotto scalare hermitiano secondo la definizione 3.1. Questa definizione equivale alla validit` a delle richieste: (a) S(αx, y) = αS(x, y) se α ∈ C, (b) S(x + y, z) = S(x, z) + S(y, z), (c) S(x, y) = S(y, x), (d) S(x, x) = p(x)2 . La propriet` a (d) `e vera per costruzione. Procedendo come nell’esercizio precedente, usando S1 al posto di S, si provano essere vere: la propriet` a (b) per S1 , la propriet` a (a) per S1 con α ∈ R e la propriet` a S1 (x, y) = S1 (y, x). Queste propriet` a, usando la definizione di S in funzione di S1 provano facilmente (a), (b) e (c). 3.4. Dimostrare quanto asserito in (1) in osservazioni 3.4 per uno spazio con (semi) prodotto scalare (X, S). Suggerimento. Se X×X (xn , yn ) → (x, y) ∈ X×X per n → +∞, usando la disuguaglianza di Cauchy-Schwarz. Provare che se S `e il (semi) prodotto scalare e p la (semi) norma associata, allora vale: |S(x, y) − S(xn , yn )| ≤ p(xn )p(yn − y) + p(xn − x)p(y) , e tenere conto che p(xn ) → p(x) e che la proiezione canonica `e continua nella topologia prodotto.
Esercizi
147
3.5. Considerare lo spazio di Banach p (N) con p ≥ 1. Provare che, se p = 2, `e impossibile definire un prodotto scalare hermitiano su tale spazio che induca la solita norma || ||p e che quindi lo renda spazio di Hilbert. Suggerimento. Mostrare che esistono coppie di vettori f, g che violano l’identit` a del parallelogramma. Considerare f = (1, 1, 0, 0, . . .) e g = (1, −1, 0, 0, . . .). 3.6. Considerare lo spazio di Banach (C([0, π/2], || ||∞). Provare che `e impossibile definire un prodotto scalare hermitiano su tale spazio che induca la solita norma || ||∞ e che quindi lo renda spazio di Hilbert. Suggerimento. Mostrare che esistono coppie di vettori f, g che violano l’identit` a del parallelogramma. Considerare f(x) = cos x e g(x) = sin x. 3.7. Nello spazio di Hilbert H, si consideri una successione {xn }n∈N ⊂ H che converge a x ∈ H in senso debole. In altre parole f(xn ) → f(x), se n → +∞, per ogni f ∈ H . Mostrare che in generale xn → x nel senso della topologia di H. Tuttavia, se vale anche la condizione ||xn || → ||x||, se n → +∞, o pi` u debolmente ||xn|| → kn ≤ ||x||, se n → +∞, per ogni n ∈ N, allora xn → x, se n → +∞, nel senso della topologia di H. Suggerimento. Per il teorema di Riesz, {xn }n∈N ⊂ H che converge a x ∈ H in senso debole se e solo se (z|xn ) → (z|x), se n → +∞, per ogni z ∈ H. Se {xn }n∈N `e una base hilbertiana di H, pensato come separabile, allora xn → 0 in senso debole, ma non nella topologia di H. Per la seconda questione, notare che ||x − xn ||2 = ||x||2 + ||xn||2 − 2Re(x|xn ). 3.8. Sia C ⊂ H un sottospazio chiuso nello spazio di Hilbert H. Provare che `e chiuso nella topologia debole. In altre parole, se {xn }n∈N ⊂ C tende debolmente (vedi esercizio precedente) a x ∈ H, allora x ∈ C. Suggerimento. Se PC : H → C `e il proiettore ortogonale su C, mostrare che PC xn → PC x in senso debole. 3.9. Provare la proposizione 3.8: un operatore lineare L : X → Y, con X e Y spazi con prodotto scalare, `e un’isometria nel senso della definizione 3.6 se e solo se soddisfa: ||Lx||Y = ||x||X per ogni x ∈ X, dove le norme sono quelle associate ai prodotti scalari dei corrispondenti spazi di Hilbert. Suggerimento. Usare l’identit` a di polarizzazione. 3.10. Siano H uno spazio di Hilbert e T : D(T ) → H un operatore lineare, dove D(T ) ⊂ H `e un sottospazio denso in H (eventualmente D(T ) = H). Si provi che se (u|T u) = 0 per ogni u ∈ D(T ) allora T = 0, cio`e T `e l’operatore nullo (che manda ogni vettore in 0).
148
3 Spazi di Hilbert e operatori limitati
Soluzione. Vale 0 = (u + v|T (u + v)) = (u|T u) + (v|T v) + (u|T v) + (v|T u) = (u|T v) + (v|T u) . Similmente 0 = i(u+iv|T (u+iv)) = i(u|T u)+i(v|T v)−(u|T v)+(v|T u) = −(u|T v)+(v|T u). Quindi, sommando membro a membro, (v|T u) = 0 per ogni u, v ∈ D(T ). Scegliendo {vn }n∈N ⊂ D(T ) tale che vn → T u per n → +∞, si ha che ||T u||2 = (T u|T u) = limn→+∞ (vn |T u) = 0 per ogni u ∈ D(T ), ossia T u = 0 per ogni u ∈ D(T ) e quindi T = 0. 3.11. Si consideri L2 ([0, 1], m) dove m `e la solita misura di Lebesgue. Sia f ∈ L2 ([0, 1], m). Mostrare che l’operatore Tf : L2 ([0, 1], m) g → f · g, dove · `e l’ordinario prodotto di funzioni punto per punto, `e ben definito, limitato con norma ||Tf || ≤ ||f|| e normale. Infine Tf `e autoaggiunto se e solo se f ammette solo valori reali, escluso al pi` u i valori di f su un insieme di misura nulla in [0, 1]. 3.12. Sia T ∈ B(H) autoaggiunto. Per λ ∈ R, si consideri la serie di operatori U (λ) :=
∞ n=0
(iλ)n
Tn , n!
dove T 0 := I, T 1 := T , T 2 := T T e via di seguito e la convergenza `e quella nella topologia uniforme. Si dimostri che la serie converge ad un operatore unitario. Suggerimento. Lavorare come per dimostrare le propriet`a della funzione esponenziale partendo dalla definizione in termini di serie. 3.13. In riferimento all’esercizio precedente, provare che se λ, μ ∈ R, U (λ)U (μ) = U (λ + μ). 3.14. Mostrare che la serie nell’esercizio 3.12 converge per ogni λ ∈ C ad un operatore limitato e che U (λ) `e sempre normale. 3.15. Mostrare che l’operatore U (λ) dell’esercizio 3.12 `e positivo se λ ∈ iR. Ci sono valori di λ ∈ C per cui U (λ) `e un proiettore (non necessariamente ortogonale)? 3.16. Calcolare esplicitamente U (λ) dell’esercizio 3.12 se T `e definito come Tf dell’esercizio 3.11 con f = f . 3.17. In 2 (N) si consideri l’operatore T : {xn } → {xn+1 /n}. Provare che T `e limitato e calcolare T ∗ .
Esercizi
149
3.18. Si consideri l’operatore di Volterra T : L2 ([0, 1], dx) → L2 ([0, 1], dx): x (T f)(x) = f(t)dt . 0
Si dimostri che `e ben definito, limitato e che il suo aggiunto soddisfa: 1 f(t)dt per ogni f ∈ L2 ([0, 1], dx). (T ∗ f)(x) = x
Suggerimento. Si ricordi che, essendo [0, 1] di misura di Lebesgue finita, L2 ([0, 1], dx) ⊂ L1 ([0, 1], dx) e usare il teorema C.6.
4 Propriet` a elementari degli operatori compatti, di Hilbert-Schmidt e di classe traccia Misura ci` o che `e misurabile, e rendi misurabile ci` o che non `e. Galileo
Dal punto di vista delle applicazioni alla MQ, il fine di questo capitolo `e quello di introdurre alcuni tipi di operatori che useremo quando definiremo la nozione di stato quantistico. Tali operatori sono noti in letteratura come operatori di classe traccia oppure operatori nucleari. Si tratta di operatori limitati su uno spazio di Hilbert che ammettono traccia. Per arrivare a definire gli operatori di classe traccia `e necessario introdurre gli operatori compatti, detti anche completamente continui, che rivestono una notevole importanza in vari rami della matematica e delle applicazioni alla fisica, indipendentemente dalle teorie quantistiche. Nella prima sezione del capitolo presenteremo la nozione generale di operatore compatto su uno spazio normato, discutendone brevemente le propriet` a generali in spazi normati e di Banach. Proveremo anche il classico risultato riguardante la non compattezza della palla unitaria in dimensione infinita. Nella seconda sezione specializzeremo la definizione al caso di spazi di Hilbert, in riferimento, in particolare agli spazi L2 , sui quali gli operatori compatti (come quelli di Hilbert-Schmidt) ammettono una certa rappresentazione integrale. Mostreremo che l’insieme degli operatori compatti individua uno ∗ideale bilatero nella C ∗ algebra degli operatori limitati sullo spazio di Hilbert. In questa sede enunceremo e dimostreremo il celebre teorema di Hilbert sollo sviluppo spettrale degli operatori compatti, che pu`o essere considerato come il precursore di tutti i teoremi di decomposizione spettrale che discuteremo nei prossimi capitoli. La quarta sezione riguarder`a lo ∗-ideale bilatero degli operatori di HilbertSchmidt (H-S) e le loro propriet`a pi` u elementari. In particolare mostreremo che lo spazio degli operatori di H-S `e a sua volta uno spazio di Hilbert. La penultima sezione concerner`a l’introduzione dello ∗-ideale bilatero degli operatori di classe traccia e la dimostrazione delle propriet`a pi` u importanti (e pi` u utili in fisica) di tali operatori. In particolare dimostreremo la propriet` a di ciclicit` a della traccia.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
152
4 Classi di operatori compatti
L’ultima sezione conterr`a una concisa introduzione al teorema dell’alternativa di Fredholm per le equazioni integrali di Fredholm di seconda specie.
4.1 Operatori compatti in spazi normati e di Banach In questa sezione introdurremo gli operatori compatti in spazi normati, dopo avere richiamato alcuni risultati generali degli insiemi compatti in spazi normati, specialmente nel caso infinitodimensionale. Nella sezione successiva ci restringeremo a lavorare negli spazi di Hilbert. 4.1.1 Compatti in spazi normati (infinitodimensionali) Ricordiamo che in uno spazio topologico generale un insieme compatto `e definito come nella definizione 2.28. Una nozione connessa `e quella di compattezza sequenziale. Definizione 4.1. Un sottoinsieme K di uno spazio topologico `e detto sequenzialmente compatto se per ogni successione {xn }n∈N ⊂ K esiste una sotto successione {xnp }p∈N convergente ad un punto di K. Osservazioni 4.2. Elenchiamo di seguito alcune propriet` a generali degli insiemi compatti che dovrebbero essere note dai corsi elementari di topologia [Ser94II]. Useremo tali propriet` a nel seguito. (1) La propriet` a di compattezza `e ereditaria (nel senso della topologia indotta) come precisato nella proposizione 2.30. (2) I sottoinsiemi chiusi dei compatti sono compatti e, negli spazi di Hausdorff (in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), i compatti sono chiusi. (3) Negli spazi topologici metrizzabili (e quindi ancora in particolare gli spazi vettoriali normati, come gli spazi di Hilbert), la propriet` a di compattezza `e equivalente a quella di compattezza sequenziale. Un’altra propriet` a utile che vale in spazi metrici `e la seguente, che dimostreremo. Proposizione 4.3. Sia (X, || ||) spazio normato. Se A ⊂ X `e tale che ogni successione di punti di A ammette una sotto successione convergente (non necessariamente in A), allora A `e relativamente compatto. Dimostrazione. L’unica cosa da mostrare `e che se {yk }k∈N ⊂ A, allora esiste una sotto successione di {yk }k∈N che converge (in A, essendo esso chiuso). (k) Data {yk }k∈N ⊂ A, ci saranno delle successioni, una per ogni k, {xn }n∈N ⊂ (k) A, con xn → yk per n → +∞. Fissando k e prendendo un corrispondente nk sufficientemente grande, possiamo allora costruire termine per termine una
4.1 Operatori compatti in spazi normati e di Banach
153
(k)
nuova successione {zk := xnk }k∈N ⊂ A tale che ||yk − zk || < 1/k. Nelle ipotesi fatte su A, esister`a una sotto successione di {zk }k∈N , {zkp }p∈N , che converge a qualche y ∈ A. Si ha: ||ykp − y|| ≤ ||ykp − zkp || + ||zkp − y|| . Dato che 1/kp → 0 per p → +∞, fissato > 0, esister`a P tale che, se p > P , allora ||zkp − y|| < /2 insieme a 1/kp < /2, per cui ||ykp − y|| < . In altre parole ykp → y per p → +∞. Osservazione 4.4. La proposizione provata vale anche per spazi metrici, con banali modifiche nella dimostrazione. Esempi di compatti in uno spazio normato infinitodimensionale (X, || ||) si ottengono facilmente considerando compatti in sottospazi finitodimensionali. Come sappiamo dalla sezione 2.6, ogni sottospazio finitodimensionale S `e omeomorfo ad uno spazio Cn (o Rn nel caso si lavori con spazi vettoriali reali); in tal caso ogni insieme chiuso e limitato K ⊂ S (per esempio la chiusura di una palla aperta di raggio finito) `e un compatto in S per il teorema di Heine-Borel. Dato che la compattezza `e una propriet` a topologica ereditaria nel senso precisato nella proposizione 2.30, K continua ad essere un compatto anche nella topologia di (X, || ||). Un risultato importante e notevole, che distingue nettamente il caso di uno spazio normato finito-dimensionale da quello infinito-dimensionale e che si applica, pi` u in generale, a spazi metrici, `e il seguente. Proposizione 4.5. Sia (X, || ||) uno spazio normato. Se X ha dimensione infinita, la chiusura della palla aperta unitaria {x ∈ X | ||x|| < 1} non pu` o essere compatta. Lo stesso risultato vale per ogni palla aperta di raggio arbitrario finito e centrata in qualsiasi punto dello spazio. Dimostrazione. Indichiamo con B la palla aperta unitaria centrata nell’origine e supponiamo che B sia compatta. Allora possiamo ricoprire B, e quindi B, con un numero N > 0 di palle aperte Bk , di raggio 1/2 e centrate rispettivamente in xk , k = 1, . . . , N . Consideriamo un sottospazio Xn di X, di dimensione finita n, tale da contenere i vettori xk . Dato che la dimensione di X `e infinita, possiamo scegliere n > N arbitrariamente grande. Definiamo le ulteriori palle, di raggi 1 e 1/2 rispettivamente, P := B ∩ Xn e Pk := Bk ∩ Xn per ogni k = 1, . . . , N . Identifichiamo Xn con R2n (o Rn se il campo di X `e R) tramite la scelta di una base di Xn , {zk }k=1,...,n . Notare che una palla Pk non soddisfa necessariamente l’equazione di una palla in R2n in questa costruzione. Se normalizziamo la misura di Lebesgue m di R2n dividendo per il volume di P (che `e non nullo dato che `e aperto non vuoto per la proposizione 2.112) abbiamo che m(P ) = 1. Mostriamo che allora m(Pk ) = (1/2)n . La misura di Lebesgue `e invariante per traslazioni per cui ci si pu` o ridurre a considerare le
154
4 Classi di operatori compatti
palle centrate nell’origine di raggio r, B(r). Dato che ogni norma `e una funzione omogenea vale B(λr) = {λu | u ∈ B(r)} =: λB(r) per ogni λ > 0. Dato che la misura di Lebesgue su R2n soddisfa m(λE) = λ2n m(E), nelle ipotesi fatte risulta che deve essere m(Pk ) = m((1/2)P ) = (1/2)n m(P ) = (1/2)n . Essendo N N infine B ⊂ ∪N k=1 Bk e dunque P ⊂ ∪k=1 Pk , deve essere m(P ) ≤ k=1 m(Pk ) per subadditivit` a, ossia 1 ≤ N (1/2)2n. Questo `e impossibile se n `e abbastanza grande (N `e fissato). La dimostrazione si esegue con banali modifiche per ogni palla aperta di raggio finito centrata in qualsiasi punto dello spazio normato. Il corollario che segue mostra come, ancora una volta, passando dal caso finito dimensionale al caso infinitodimensionale, i compatti acquistino propriet` a differenti. In Cn o Rn dotati della norma standard, esistono compatti con interno non vuoto: basta considerare la chiusura di un qualsiasi insieme aperto limitato. Il teorema di Heine-Borel assicura allora che tale chiusura (che continua ad essere limitata) `e un compatto ed ha sicuramente interno non vuoto per costruzione. Similmente, lo spazio C che `e completo, si pu`o ottenere come l’unione di una classe numerabile di sottoinsiemi compatti: basta usare la classe dei dischi aperti di centri di coordinate razionali (con segno) e raggi razionali. Nel caso infinitodimensionale le cose cambiano drasticamente. Corollario 4.6. Sia X spazio normato infinito dimensionale. Allora valgono i seguenti fatti. (a) Se K ⊂ X `e compatto, l’interno di K `e vuoto. (b) Se X `e ulteriormente completo (cio`e `e uno spazio di Banach) allora X non pu` o essere ottenuto come l’unione numerabile di suoi sottoinsiemi compatti. Dimostrazione. (a) Supponiamo che l’interno di K sia non vuoto, allora contiene una palla aperta B, dato che le palle aperte formano una base della topologia. Vale B ⊂ K = K (dove si `e tenuto conto del fatto che i compatti sono chiusi, dato che gli spazi normati sono di Hausdorff). I sottoinsiemi chiusi dei compatti sono a loro volta compatti e pertanto B dovrebbe essere compatta, cosa impossibile per la proposizione precedente. (b) la tesi segue immediatamente da (a) e dall’ultima affermazione dell’enunciato del teorema 2.98 di Baire, dove X `e il nostro spazio normato completo. 4.1.2 Operatori compatti in spazi normati Possiamo ora introdurre la nozione di operatore compatto. Ricordiamo che in uno spazio normato (X, || ||) un insieme M `e detto limitato (rispetto alla norma || ||) se esiste una palla aperta, Bδ (x0 ), di raggio finito δ > 0 e centrata in qualche punto x0 ∈ X, tale che M ⊂ Bδ (x0 ). ` chiaro, allora, che M `e limitato se e solo se esiste una palla metrica di raggio E finito δ > 0 e centrata nell’origine di X, che contiene M (basta scegliere il raggio di tale palla pari a δ + ||x0||).
4.1 Operatori compatti in spazi normati e di Banach
155
Definizione 4.7. Siano X, Y spazi normati sullo stesso campo R o C. T ∈ L(X, Y) `e detto compatto o completamente continuo se vale una delle due condizioni equivalenti: (a) per ogni sottoinsieme M ⊂ X limitato, T (M ) `e relativamente compatto in Y; (b) se {xn }n∈N ⊂ X `e limitata, allora c’`e una sotto successione, {xnk }k∈N , tale che {T xnk }k∈N converge in Y. B∞(X, Y) denota il sottoinsieme degli operatori compatti da X a Y e, in particolare, B∞ (X) denota il sottoinsieme degli operatori compatti da X in X. Osservazioni 4.8. ` chiaro che (a) ⇒ (b). L’implicazione inversa, (b) ⇒ (a), `e immediata (1) E conseguenza della proposizione 4.3. (2) Ogni operatore compatto `e sicuramente limitato. Infatti, la palla chiusa di raggio 1 centrata nell’origine di X `e mappata in un insieme (che contiene l’origine) a chiusura compatta K. Essendo compatto, K `e ricopribile da un numero finito, N , di palle aperte di raggio finito r > 0, Br (yi ). Vale allora K ⊂ ∪N e il massimo delle distanze tra i centri i=1 Br (yi ) ⊂ BR+r (0), dove R ` yi delle palle e l’origine. In particolare ||T (x)|| ≤ (R + r) per ||x|| = 1 per cui ||T || ≤ r + R < +∞. Gli insiemi B∞ (X, Y) e B∞ (X) sono in realt` a spazi vettoriali rispetto alla solita definizione di combinazioni lineari di operatori, e dunque sono sottospazi vettoriali di B(X, Y) e B(X) rispettivamente. Non solo, ma godono di un’ulteriore propriet` a chiarita nella seguente proposizione. Proposizione 4.9. Se X e Y sono spazi normati, B∞ (X, Y) soddisfa quanto segue. (a) B∞ (X, Y) `e un sottospazio vettoriale di B(X, Y). (b) Se Z `e un ulteriore spazio normato e A ∈ B(X, Y) allora: (i) se B ∈ B(Z, X), vale AB ∈ B∞ (Z, Y), (ii) se B ∈ B(Y, Z), vale BA ∈ B∞ (X, Z). (c) Se Y `e spazio di Banach e {An }n∈N ⊂ B∞ (X, Y) converge a A ∈ B(X, Y) nella topologia operatoriale uniforme, allora A ∈ B∞ (X, Y). In altre parole B∞(X, Y) `e un sottospazio chiuso dello spazio di Banach (B∞ (X, Y), || ||), dove || || `e la norma operatoriale. Dimostrazione. (a) Si consideri l’operatore αA + βB con α, β ∈ C e A, B ∈ B∞(X, Y). Mostriamo che `e compatto, provando che ogni successone limitata {xn }n∈N ⊂ X ammette una sottosuccessione {xnr }r∈N ⊂ X tale che la associata successione delle immagini {(αA + βB)(xnr )}r∈N ⊂ Y `e convergente. Sia {xn }n∈N ⊂ X una successione limitata, allora esister`a una sottosuccessione {xnk }k∈N per cui la successione dei valori Axnk ⊂ Y converge, dato che A `e compatto. La sottosuccessione {xnk }k∈N sar`a anche limitata per ipotesi, pertanto esister`a una sua sottosuccessione, {xnkm }m∈N , tale che la successione dei valori Bxnkm ∈ Y converge. Per costruzione {xnkm }m∈N `e una sottosuc-
156
4 Classi di operatori compatti
cessione di {xnk }k∈N tale che la successione di valori αAxnkm + βBxnkm ⊂ Y converge. (b) Nel primo caso, se {zk }k∈N ⊂ Z `e limitata da M > 0, i valori Bzk formano un insieme limitato da ||B||M dato che B `e limitato. Dato che A `e compatto, esiste una sottosuccessione {znk }k∈N per cui la sottosuccessione dei valori ABznk converge. Quindi AB `e compatto. Nel secondo caso, dato che A `e compatto, se {xk }k∈N ⊂ X `e limitata, esiste una sottosuccessione {xnk }k∈N per cui i valori Axnk formano una successione convergente. Dato che B `e continuo, converger`a anche la successione dei valori BAxnk . Pertanto BA `e compatto. (c) Sia B(X, Y) A = limi→+∞ Ai con Ai ∈ B∞ (X, Y). Sia {xn }n∈N una successione limitata di vettori di X: ||xn|| ≤ C per ogni n. Vogliamo provare che esiste una sottosuccessione di {Axn } convergente. Usando una notazione che dovrebbe essere ovvia, con una procedura ricorsiva, costruiamo una famiglia di sottosuccessioni: (2) {xn } ⊃ {x(1) (4.1) n } ⊃ {xn } ⊃ · · · (i+1)
(i)
tale che, per ogni i = 1, 2, . . ., {xn } `e sotto successione di {xn } tale che (i+1) (i) {Ai+1 xn } `e convergente. Questo `e sempre possibile, in quanto ogni {xn } `e limitata da C essendo sotto successione di {xn } ed inoltre Ai+1 `e compatto per ipotesi. La sotto successione di {Axn } che proveremo convergere `e quella di (i) elementi Axi . Usando la disuguaglianza triangolare abbiamo facilmente che (i)
(k)
(i)
(i)
(i)
(k)
(k)
(k)
||Axi − Axk || ≤ ||Axi − An xi || + ||Anxi − An xk || + ||Anxk − Axk || . Usando la stima scritta, nelle nostre ipotesi si ha che: (i)
(k)
(i)
(k)
(i)
(k)
||Axi − Axk || ≤ ||A − An ||(||xi || + ||xk ||) + ||An (xi − xk )|| (i)
(k)
≤ 2C||A − An || + ||An xi − An xk || . Fissato > 0, se n `e grande a sufficienza, varr`a 2C||A − An || ≤ /2, dato che (r) An → A per ipotesi. Fissato n e se r ≥ n, {An (xp )}p `e sotto successione (n) ` facile vedere che la successione della successione convergente {An (xp )}p . E (p) {An (xp )}p costruita, per p ≥ n, con i termini “diagonali” di tutte queste sottosuccessioni, ciascuna sotto successione della precedente per (4.1), `e an(n) cora sotto successione della successione convergente {An (xp )}p , per cui `e anche essa convergente (allo stesso limite). Concludiamo che se i, k ≥ n sono (i) (k) grandi a sufficienza, vale anche ||An xi − An xk || ≤ /2. Quindi, se i, k sono (i) (k) grandi a sufficienza ||Axi − Axk || ≤ /2 + /2 = . Ci` o prova la tesi perch`e abbiamo ottenuto che la sottosuccessione `e di Cauchy nello spazio di Banach Y e quindi converge a qualche elemento di tale spazio. Una propriet` a notevole degli operatori compatti `e espressa dalla seguente proposizione, tenendo conto della proposizione 2.82.
4.1 Operatori compatti in spazi normati e di Banach
157
Proposizione 4.10. Siano X e Y spazi normati. Se X xn → x ∈ X in senso debole e T ∈ B∞ (X, Y), allora ||T (xn ) − T (x)||Y → 0 per n → +∞. In altre parole gli operatori compatti trasformano successioni convergenti debolmente in successioni convergenti in norma. Dimostrazione. La dimostrazione `e data nella soluzione dell’esercizio 4.4. L’ultima propriet` a generale degli operatori compatti in spazi normati, che proveremo prima di ridurci a considerare il caso degli operatori compatti negli spazi di Hilbert, `e il seguente importante risultato riguardante gli autovalori di operatori compatti. Teorema 4.11. (Sugli autovalori degli operatori compatti in spazi normati.) Sia T ∈ B∞(X) con X spazio normato. Valgono i fatti seguenti. (a) Per ogni δ > 0, esiste solo un numero finito di autospazi di T con autovalori λ tali che |λ| > δ. (b) Se λ = 0 `e un autovalore di T , l’autospazio corrispondente ha dimensione finita. (c) Gli autovalori di T formano un insieme limitato, al pi` u numerabile, e possono essere ordinati nell’ordine dei valori assoluti decrescenti: |λ1 | ≥ |λ2 | ≥ · · · 0 con, al pi` u, 0 come unico punto di accumulazione. Dimostrazione. Premettiamo un lemma che servir`a nella dimostrazione di (a) e (b).
Lemma 4.12. (Di Banach.) Sia x1 , x2 , . . . una successione (finita o infinita) di vettori linearmente indipendenti nello spazio normato X e Xn :=< {x1 , x2, . . . , xn } >. Esiste una corrispondente successione y1 , y2 , . . . ⊂ X che verifica, per n = 1, 2, . . .: (i) ||yn || = 1, (ii) yn ∈ Xn , (iii) d(yn , Xn−1 ) > 1/2, dove d(yn , Xn−1) `e la distanza del vettore yn da Xn−1 , cio`e: d(yn , Xn−1) =
inf
x∈Xn−1
||x − yn || .
Dimostrazione del lemma 4.12. Si osservi che d(yn , Xn−1) esiste finito, dato che si tratta dell’estremo inferiore di un insieme non vuoto, limitato dal basso da 0, di numeri reali. Scegliendo y1 := x1 /||x1|| si costruisce induttivamente la successione degli yn come segue. Dato che i vettori x1 , x2 , . . . sono linearmente indipendenti, vale xn ∈ Xn−1 e quindi d(xn , Xn−1) = α > 0. Sia allora x ∈
158
4 Classi di operatori compatti
Xn−1 tale che ||xn − x || < 2α. Dato che α = d(xn , Xn−1) = d(xn − x , Xn−1 ), il vettore: xn − x yn := ||xn − x || soddisfa le condizioni (i),(ii), (iii). Torniamo alla dimostrazione di (a) e (b). Nel caso in cui X sia finito dimensionale la tesi `e ovviamente vera dato che gli autovettori di autovalori differenti sono linearmente indipendenti. Consideriamo allora il caso in cui X sia infinitodimensionale e pertanto possono esistere infiniti autovalori ed infiniti autovettori. La prova di (a) e (b) si ha, contemporaneamente, dimostrando che, per ogni δ > 0, pu` o esistere soltanto un numero finito di autovettori linearmente indipendenti corrispondenti agli autovalori λ con |λ| > δ. Proviamo ci`o. Sia λ1 , λ2 , . . . una successione di autovalori di T , eventualmente ripetuti, tale che |λn | > δ. Assumiamo, per assurdo, che esista una successione infinita, x1 , x2, . . ., di corrispondenti autovettori linearmente indipendenti. Si osservi che stiamo dicendo, negando la tesi, che esistono infiniti autovettori linearmente indipendenti con autovalori λ tali che |λ| > δ. Usando l’enunciato del lemma dimostrato sopra, costruiamo la successione y1 , y2 , . . . che soddisfa le propriet` a (i),(ii) e (iii) e dove Xn `e lo spazio generato da x1 , x2 , . . . , xn . Dato che |λn | > δ, la successione { λynn }n=1,2,... `e limitata. Mostriamo ora che dalla successione delle immagini {T λynn }n=1,2,... non `e possibile estrarre una sottosuccessione convergente. Infatti, sar`a, per costruzione: yn :=
n
βk xk ,
k=1
e quindi: T
n−1 βk λk yn = xk + βn xn = yn + zn , λn λn k=1
dove: zn :=
n−1 k=1
βk
λk − 1 xk ∈ Xn−1 . λn
Di conseguenza, comunque siano i > j, vale:
T yi − T yj
= ||yi + zi − (yj + zj )||
λi λj
= ||yi − (yj + zj − zi )|| > 1/2 dato che yj + zj − zi ∈ Xi−1. Il risultato ottenuto `e evidentemente impossibile dato che T `e compatto. Di conseguenza, dobbiamo concludere che la successione infinita di autovettori linearmente indipendenti x1 , x2, . . . non esiste. Questo conclude la dimostrazione di (a) e (b). (c) La dimostrazione segue subito da (a) scegliendo una successione di numeri δ > 0 della forma δn = 1/n con n = 1, 2, 3, . . ..
4.2 Operatori compatti in spazi di Hilbert
159
Osservazioni 4.13. (1) Un’ultima propriet` a, che non dimostreremo, `e quella che stabilisce che l’operatore coniugato nel senso degli spazi di Banach (vedi la definizione 2.55) di un operatore compatto `e compatto. Dimostreremo questa propriet`a solo nel caso dell’aggiunto hermitiano di un operatore compatto, lavorando in spazi di Hilbert. (2) Dal lemma 4.12 segue una dimostrazione alternativa del fatto che la chiusura della palla unitaria in uno spazio normato infinitodimensionale non pu` o essere compatta (vedi l’esercizio 4.2).
4.2 Operatori compatti in spazi di Hilbert D’ora in avanti ci restringeremo a considerare operatori compatti in spazi di Hilbert, anche se alcune delle propriet`a che enunceremo valgono anche in un ambiente meno sofisticato, come spazi normati o spazi di Banach. Nel primo teorema che proveremo sugli operatori compatti in spazi di Hilbert, l’ipotesi di completezza dello spazio viene in realt` a usata solo nell’ultima propriet` a. Abbiamo bisogno di una proposizione preliminare prima di enunciare e provare il teorema. Proposizione 4.14. Sia H spazio di Hilbert. A ∈ B(H) `e compatto se e solo se |A| (vedi la definizione 3.59) `e compatto. Dimostrazione. Supponiamo A compatto. Sia {xk }k∈N una successione limitata in H e sia {Axkn }n∈N una sotto successione di {Axk }k∈N convergente in virt` u della compattezza di A. Essendo tale sotto successione successione di Cauchy, per (3.53), la sotto successione, {|A|xkn }n∈N , di {|A|xk }k∈N `e successione di Cauchy e quindi converge. Pertanto |A| `e compatto. Scambiando il ruolo di A e |A| ed usando la stessa dimostrazione, si prova che se |A| `e compatto, `e tale anche A. Teorema 4.15. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) B∞ (H) `e un sottospazio vettoriale di B(H). (b) B∞ (H) `e uno ∗-ideale bilatero di B(H), ossia, oltre ad essere un sottospazio, B∞ (H) gode della propriet` a che se T ∈ B∞ (H), allora T K, KT ∈ B∞ (H) per ogni K ∈ B(H) ed inoltre T ∗ ∈ B∞ (H). (c) B∞ (H) `e chiuso rispetto alla topologia uniforme. ` stato provato, nel caso pi` Dimostrazione. (a) E u generale di spazi normati, nella parte (a) proposizione 4.9. (b) Il fatto che, su spazi normati, il prodotto, a destra e a sinistra, di un operatore compatto con un operatore limitato produce ancora un operatore compatto, `e stato provato in (b) di proposizione 4.9. Per dimostrare la chiusura rispetto all’operazione di coniugazione hermitiana, notiamo che |T | `e compatto
160
4 Classi di operatori compatti
se e solo se T `e compatto per proposizione 4.14. Decomponendo polarmente T = U |T | secondo il teorema 3.61, segue che T ∗ = |T |U ∗, dove si `e tenuto conto del fatto che |T | ≥ 0, per cui |T | `e autoaggiunto. La limitatezza di U ∗ insieme alla compattezza di |T | implicano che T ∗ = |T |U ∗ `e compatto per quanto provato all’inizio di questa parte di dimostrazione. (c) Segue immediatamente da (c) della proposizione 4.9. Esempi 4.16. (1) Se X, Y sono spazi normati e T ∈ B(X, Y) `e tale che Ran(T ) ha dimensione finita, allora T deve essere compatto. Proviamolo. Se V ⊂ X `e limitato, cio`e V ⊂ Br (0) per qualche r > 0 finito, allora ||T (V )|| ≤ r||T || < +∞, per cui T (V ) `e limitato. T (V ) `e chiuso e limitato in uno spazio normato di dimensione finita che `e sempre omeomorfo ad un Cn (per proposizione 2.112). Per il teorema di Heine-Borel T (V ) `e allora compatto rispetto alla topologia indotta sul rango di T . Quindi T `e compatto dato che la compattezza rispetto alla topologia indotta equivale a quella rispetto alla topologia dello spazio ambiente. Come ulteriore sottocaso, se H `e spazio di Hilbert si consideri un operatore Tx ∈ L(H) della forma Tx : u → (x|u)y , ` chiaro che dove x, y ∈ H sono fissati vettori (eventualmente coincidenti). E tale operatore `e compatto, avendo rango di dimensione finita. (2) Se {xn }n∈N e {yn }n∈N sono sottoinsiemi ortogonali di H e se, interpretando la serie nella topologia uniforme, risulta che T = n∈N (xn | )yn `e un operatore limitato, allora T `e compatto per (a) e (c) del teorema 4.15. (3) In 2 (N) consideriamo l’operatore A : {xn } → {xn+1 /n}. Tale operatore `e compatto in quanto `e limite nella topologia uniforme degli operatori, per n = 1, 2 . . . , Am : {xn } → {x2 /1, x3/2, . . . , xm+1 /m, 0, 0, . . .} . Si verifica infatti facilmente che (lo si provi per esercizio) ||A − An || ≤ 1/(n + 1) . (4) Si consideri lo spazio X con misura μ sulla σ-algebra Σ in X e sia μ σfinita, in modo da definire la misura prodotto μ ⊗ μ; nel seguito useremo le notazioni semplificate L2 (μ) := L2 (X, μ) e L2 (μ ⊗ μ) := L2 (X × X, μ ⊗ μ). Consideriamo K ∈ L2 (X × X, μ ⊗ μ) e dimostriamo che: 2 K(x, y)f(y)dμ(y) TK : L (μ) f → X
2
definisce un operatore TK ∈ B(L (X, μ)) che `e compatto quando μ `e separabile (vedi (3) in esempi 3.33). Per prima cosa notiamo che, indipendentemente
4.2 Operatori compatti in spazi di Hilbert
161
dall’ipotesi di separabilit` a, se f ∈ L2 (μ): K(·, y)f(y)dμ(y) ∈ L2 (μ) X
e
K(·, y)f(y)dμ(y)
X
L2 (X,μ)
≤ ||K||L2(X×X,μ⊗μ)||f||L2(X,μ) ,
che equivale a dire: ||TK || ≤ ||K||L2(X×X,μ⊗μ) .
(4.2)
La prova di questo fatto `e interamente basata sul teorema di Fubini-Tonelli: Se K ∈ L2 (μ ⊗ μ) allora, per il teorema di Fubini-Tonelli: (1) |K(x, ·)|2 ∈ L1 (μ), μ-quasi ovunque, (2) X |K(x, y)|2 dμ(y) ∈ L1 (μ) . Da (1) segue che K(x, ·) ∈ L2 (μ) quasi ovunque e quindi K(x, ·)f ∈ L1 (μ) quasi ovunque e per la disuguaglianza di Cauchy-Schwarz: (3) X |K(x,y)||f(y)|dμ(y) ≤ ||K(x, ·)||L2||f||L2 . Posto F (x) := X K(x, y)f(y)dμ(y), F `e misurabile e vale, per la (3): (4) |F (x)|2 ≤ ||f||2L2 X |K(x, y)|2 dμ(y). Per (2) si ha quindi che |F |2 ∈ L2 (μ) ed `e quindi vero che vale K(·, y)f(y)dμ(y) ∈ L2 (μ) . X
Da (4) e dal teorema di Fubini-Tonelli segue infine anche
K(·, y)f(y)dμ(y) ≤ ||K||L2(μ⊗μ) ||f||L2(μ) ,
X
L2 (μ)
da cui (4.2). Per mostrare che TK `e compatto, facciamo l’ipotesi ulteriore che μ sia separabile in modo che sia separabile L2 (X, μ) (vedi la proposizione 3.34). Per esempio X pu` o essere un qualsiasi intervallo (o un boreliano) di R e μ la misura di Lebesgue su R. Se {un }n∈N `e una base hilbertiana di L2 (X, μ), allora {un · um }n,m∈N `e una base Hilbertiana di L2 (X × X, μ ⊗ μ) (· `e l’ordinario prodotto di funzioni punto per punto) e allora, nella topologia di L2 (X × X, μ ⊗ μ), K= knm un · um , n,m
dove i numeri knm ∈ C dipendono da K. Quindi, posto knmun · um Kp := n,m≤p
si ha che Kp → K per p → +∞ nella norma di L2 (X × X, μ ⊗ μ). Tenuto conto di (4.2) applicata agli operatori TKp −K = TKp − TK , dove TKp `e indotto dal
162
4 Classi di operatori compatti
nucleo integrale Kp , segue che, per p → +∞,
||TK − TKp || =
knm un · um
n,m>p
→0, L2 (X×X,μ⊗μ)
per cui TK `e compatto in quanto gli operatori TKp sono compatti essendo somme finite di operatori con rango di dimensione finita come quelli discussi nell’esempio (1) sopra. Osserviamo per finire che, anche senza assumere l’ipotesi che μ sia separabile, ma richiedendo che K ∈ L2 (X × X, μ ⊗ μ) e che μ sia σ-finita, si prova facilmente che: ∗ TK = TK , (4.3) dove K(x, y) := K(x, y) per ogni x, y ∈ X e la barra denota la coniugazione complessa. La dimostrazione segue facilmente dalla proposizione 3.36 e dal teorema di Fubini-Tonelli. Gli operatori compatti in spazi di Hilbert godono di notevoli propriet` a; in particolare per quanto riguarda gli autovettori, autovalori ed autospazi, gli operatori compatti e autoaggiunti hanno caratteristiche che generalizzano al caso infinito-dimensionale le propriet` a delle matrici hermitiane finito-dimensionali. I prossimi due teoremi illustrano tali propriet` a. Teorema 4.17. (Di Hilbert.) Siano H spazio di Hilbert e T ∈ B∞ (H) con T = T ∗ . Allora vale quanto segue. (a) Ogni autospazio di T con autovalore λ = 0 ha dimensione finita. (b) Indicando con σp (T ) l’insieme degli autovalori di T , esso ha le seguenti caratteristiche: (1) `e non vuoto, (2) `e reale, (3) `e al pi` u numerabile, (4) ha al pi` u un solo punto di accumulazione dato da 0, (5) vale l’identit` a: sup{|λ| | λ ∈ σp (T )} = ||T || . Pi` u precisamente, l’estremo superiore suddetto `e anche massimo ed `e raggiunto in Λ ∈ σp (T ) tale che Λ = ||T || se
sup||x||=1 (x|T x) = ||T || ,
(4.4)
inf ||x||=1 (x|T x) = −||T || .
(4.5)
oppure Λ = −||T || se
(6) T coincide con l’operatore nullo se e solo 0 `e l’unico autovalore.
4.2 Operatori compatti in spazi di Hilbert
163
Prova di parte del teorema 4.17. (a) Sia Hλ l’autospazio di T con autovalore λ = 0. Se B ⊂ Hλ `e la palla aperta di raggio 1 centrata nell’origine, allora si pu` o scrivere B = T (λ−1 B) e λ−1 B `e limitato a sua volta per costruzione. Dato che T `e compatto, B `e compatto. Quindi, nello spazio di Hilbert Hλ , la chiusura della palla aperta unitaria `e un insieme compatto, pertanto dimHλ < +∞ per la proposizione 4.5. (b) Proveremo tutti i punti eccetto (3) e (4), che saranno provati nella dimostrazione del teorema successivo. σp (T ), se `e non vuoto `e fatto di elementi reali per (c) (ii) di proposizione 3.49, essendo T autoaggiunto. Per (a) in proposizione 3.49 −||T || ≤ (x|T x) ≤ ||T || per ogni x di norma unitaria, di conseguenza ci possono essere solo le seguenti due possibilit`a: sup||x||=1 (x|T x) = ||T || oppure inf ||x||=1 (x|T x) = −||T ||. Supponiamo vero il primo fatto ed eseguiamo la dimostrazione in questo caso. L’altro caso si tratta con la stessa dimostrazione scambiando T con −T . Assumeremo che ||T || > 0, altrimenti la prova della tesi `e ovvia. Per ogni autovalore λ possiamo scegliere un autovettore x con ||x|| = 1 e quindi ||T || ≥ |(x|T x)| = |λ|(x|x) = |λ|, di conseguenza sup |σp(T )| ≤ ||T ||. Per provare (5), basta quindi esibire un autovettore con autovalore Λ = ||T ||. Si noti che ci` o prova anche che σp (T ) = ∅. Per ipotesi esister` a una successione di punti xn con ||xn|| = 1 tali che (xn |T xn ) → ||T || =: Λ > 0. Vale (dove usiamo anche il fatto che ||T xn|| ≤ ||T ||||xn|| = ||T ||) ||T xn − Λxn ||2 = ||T xn ||2 − 2Λ(xn |T xn ) + Λ2 ≤ ||T ||2 + Λ2 − 2Λ(xn |T xn ) . Essendo ||T || = Λ, nel limite per n → +∞ della precedente disuguaglianza, si ha che T xn − Λxn → 0 . (4.6) Per concludere ci basterebbe provare che anche {xn }n∈N converge a qualche punto, oppure che ci` o accade per una sua sotto successione. Dato che ||xn|| = 1, la successione {xn }n∈N `e limitata; essendo T compatto, possiamo estrarre da {T xn }n∈N una sotto successione convergente: {T xnk }k∈N. Da (4.6), si ha che: xn k =
1 [T xnk − (T xnk − Λxnk )] Λ
converge a qualche x ∈ H se k → +∞, in quanto combinazione lineare di successioni convergenti. Dato che T `e continuo e xnk → x, (4.6) implica che T x = Λx . Notiamo che x = 0 perch´e ||x|| = limk→+∞ ||xnk || = 1. Abbiamo provato che x `e un autovettore con autovalore Λ. (6) `e immediata conseguenza di (5). Passiamo al famoso teorema di Hilbert riguardante lo sviluppo degli operatori compatti autoaggiunti su una base hilbertiana di autovettori.
164
4 Classi di operatori compatti
Teorema 4.18. (Di Hilbert.) Siano (H, ( | )) spazio di Hilbert e T ∈ B∞ (T ) con T = T ∗ . (a) Se Pλ `e il proiettore ortogonale sull’autospazio con autovalore λ ∈ σp (T ) (insieme degli autovalori di T ), vale: T = λPλ . (4.7) λ∈σp (T )
Se σp (T ) `e infinito, la serie in (4.7) `e intesa nel senso della topologia uniforme e gli autovalori in σp (T ): λ0 , λ1 , . . . (con λi = λj se i = j) sono ordinati in modo tale che |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . .. (b) Se Bλ denota una base hilbertiana dell’autospazio di T associato a λ ∈ σp(T ), allora ∪λ∈σp (T ) Bλ `e una base hilbertiana per H; in altre parole, H ammette una base hilbertiana fatta di autovettori di T . Osservazione 4.19. Si osservi che ci possono essere al pi` u due autovalori non nulli con lo stesso valore assoluto (essendo gli autovalori reali). L’unica possibile ambiguit` a nell’ordinamento dei termini della serie di sopra, valendo: |λ0 | ≥ |λ1 | ≥ |λ2 | ≥ . . . `e nella scelta dell’ordinamento di ogni coppia λ, λ se |λ| = |λ |. Come vedremo dalla dimostrazione del teorema, la somma della serie non dipende da qualunque scelta venga fatta per tale ordinamento. Prova del teorema 4.18 e della parte rimanente del teorema 4.17. (a) Sia λ un autovalore con autospazio Hλ . Sia Pλ il proiettore ortogonale su Hλ e Qλ := I − Pλ il proiettore ortogonale su H⊥ λ . Vale T Pλ = Pλ T = λPλ .
(4.8)
Questa identit` a si dimostra notando che se x ∈ H, Pλ x ∈ Hλ e allora T Pλ x = λPλ x, da cui T Pλ = λPλ . Prendendo l’aggiunto ad ambo membri e tenendo conto del fatto che λ ∈ R, T = T ∗ , Pλ = Pλ∗, si ha subito che Pλ T = λPλ = T Pλ . Come ulteriore conseguenza troviamo che vale anche, direttamente dalla definizione di Qλ e da quanto appena provato, Qλ T = T Qλ .
(4.9)
Notiamo ancora che, essendo I = Pλ +Qλ abbiamo che T = Pλ T +Qλ T , ossia T = λPλ + Qλ T .
(4.10)
Si osservi che Qλ T soddisfa: (i) `e autoaggiunto essendo (Qλ T )∗ = T ∗ Q∗λ = T Qλ = Qλ T , (ii) `e compatto per (b) del teorema 4.15, (iii) soddisfa per costruzione Pλ (Qλ T ) = (Qλ T )Pλ = 0 valendo Pλ Qλ = Qλ Pλ = 0.
4.2 Operatori compatti in spazi di Hilbert
165
Nel seguito useremo ripetutamente queste identit`a anche senza citarle esplicitamente e d’ora in poi scriveremo Pn , Qn , Hn per, rispettivamente, Pλn Qλn , Hλn . Cominciamo a scegliere un autovalore λ = λ0 con valore assoluto pi` u alto: ci sono al pi` u due di tali autovalori che differiscono per un segno; in tal caso scegliamo uno dei due. Avremo che, se T1 := Q1 T , allora vale T = λ0 P0 + T1 dove T1 soddisfa le propriet` a (i), (ii) e (iii) suddette. Se T1 = 0, la dimostrazione `e finita; se non lo `e sappiamo comunque che T1 `e autoaggiunto compatto, per cui possiamo reiterare la procedura appena illustrata usando T1 in luogo di T e trovando, se T2 := Q1 T1 , T = λ0 P0 + λ1 P1 + T2 . λ1 `e un autovalore di T1 , non nullo e con massimo valore assoluto (se un autovalore di valore assoluto massimo fosse nullo, sarebbe T1 = 0 per (6) in (b) del teorema 4.17), e P1 `e il proiettore ortogonale sull’autospazio di T1 associato a λ1 . Si osservi ancora che ogni autovalore λ1 di T1 `e anche autovalore di T essendo, se T1 u1 = λ1 u1 , T u1 = (λ0 P0 + T1 )u1 = λ0 P0 T1 = λ0 · 0 · T
1 1 u1 + T1 u1 = λ0 P0 Q0 T u1 + T1 u1 λ1 λ1
1 u1 + λ1 u1 = λ1 u1 . λ1
λ1 = λ0 perch´e u1 ∈ RanT1 = Ran(Q0 T ) ⊂ H⊥ 0 . Si osservi infine che ogni autovettore u di T con autovalore λ1 deve essere anche autovettore di T1 con autovalore λ1 . Infatti usando T1 = Q0 T = (I − P0 )T si ha, se T u = λ1 u: T1 u = λ1 u − λ1 P0 u = λ1 u + 0 = λ1 u , dove abbiamo usato P0 u = 0, che segue dal fatto che autospazi con autovalori distinti per operatori autoaggiunti (T ) sono ortogonali. In definitiva, l’auto(T ) spazio H1 1 con autovalore λ1 di T1 coincide con l’autospazio H1 di T con autovalore λ1 . Quindi P1 `e il proiettore ortogonale in H su tale autospazio per T oltre che per T1 . Dato che |λ0 | ha valore massimo possibile, vale comunque: |λ1 | ≤ |λ0 |. Questo fatto ha una conseguenza importante. Dato che ||T || = |λ0 | e ||T1 || = λ1 per il teorema precedente, avremo che: ||T1 || ≤ ||T || .
166
4 Classi di operatori compatti
Se risulta T2 = 0 la dimostrazione `e finita, altrimenti procederemo nello stesso modo ottenendo che n T− λk Pk = Tn , (4.11) k=0
dove:
|λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . .
e
||Tk || = |λk | .
(4.12)
Se nessuno degli operatori Tk `e l’operatore nullo, la procedura continua indefinitamente. Mostriamo che, in tal caso, la serie decrescente dei numeri positivi |λk | deve tendere a 0 (non ci pu` o essere un punto di accumulazione precedente a 0). Supponiamo che |λ0 | ≥ |λ1 | ≥ · · · ≥ |λk | ≥ . . . ≥ > 0 Scegliamo un vettore xn ∈ Hn per ogni n ed in modo tale che ||xn|| = 1. Dunque la successione degli xn `e limitata, per cui la successione dei T xn o una sua sotto successione deve convergere, essendo T compatto. Ma questo `e impossibile perch´e, sviluppando il quadrato della norma di ||λn xn − λm xm || tenendo conto che xn e xm sono perpendicolari in quanto autovettori con autovalori distinti per un operatore autoaggiunto ((ii) in (b) di proposizione 3.49), si ha ||T xn − T xm ||2 = ||λn xn − λm xm ||2 = |λn |2 + |λm |2 ≥ 2 , per ogni n e m, per cui n´e la successione dei T xn n´e una sua sotto successione pu` o convergere non potendo essere di Cauchy. Questo `e assurdo e quindi la successione dei λn (se effettivamente sono infiniti) deve convergere a 0. Come conseguenza di (4.11) e (4.12), quanto appena provato implica che vale anche, nella topologia uniforme, +∞ T = λk Pk . (4.13) k=0
Si osservi che, per costruzione, il risultato non dipende dall’ordinamento che abbiamo adottato all’interno delle eventuali coppie di autovalori distinti con lo stesso valore assoluto. Mostriamo ora che l’identit`a (4.13) coincide con la (4.7) in quanto la successione trovata di autovalori {λk } esaurisce l’insieme degli autovalori di T eccetto al pi` u l’autovalore nullo che non fornisce comunque contributo a (4.13) e (4.7). Sia λ = λn per ogni n un autovalore di T e Pλ sia il proiettore ortogonale associato. Valendo Pn Pλ = 0 per ogni n (perch´e autospazi di autovalori distinti di operatori autoaggiunti sono ortogonali per (ii) in (b) di proposizione 3.49), (4.13) implica: T Pλ =
+∞
λk Pk Pλ = 0 ,
k=0
da cui, se u ∈ Hλ , Questo significa che λ = 0.
T u = T Pλ u = 0 .
4.2 Operatori compatti in spazi di Hilbert
167
La prova di (a) `e conclusa ed abbiamo contestualmente provato anche le parti rimanenti del teorema 4.17. (b) Si osservi che le basi hilbertiane Bλ esistono sempre per il teorema 3.28, essendo gli autospazi di T sottospazi chiusi (lo si dimostri per esercizio) dello spazio di Hilbert H e quindi spazi di Hilbert a loro volta. Sia B := ∪λ∈σp (T ) Bλ . Mostriamo che che se u ∈ B ⊥ allora u = 0 e ci`o conclude la dimostrazione in quanto l’insieme B `e ortonormale per costruzione per cui la definizione 3.23 `e soddisfatta. Se u ∈ B ⊥ , allora u ⊥ Bλ per ogni λ ∈ σp (T ), per cui Pλ u = 0 per ogni λ ∈ σp (T ). Usando la decomposizione di T data in (4.7), abbiamo che T u = 0; pertanto u appartiene all’autospazio di T con autovalore nullo H0 . Ma essendo anche u ortogonale ad ogni autospazio di T per costruzione, dovr` a essere contemporaneamente u ∈ H0 e u ∈ H⊥ 0 , ossia u = 0 che conclude la prova. Il teorema di Hilbert, insieme al teorema 3.61 di decomposizione polare, consentono di estendere la formula (4.7) dello sviluppo di un operatore compatto autoaggiunto ad un’analoga formula valida nel caso non autoaggiunto. Diamo prima una definizione che sar` a utile nel seguito. Definizione 4.20. Siano H spazio di Hilbert e A ∈ B∞ (H). Gli autovalori λ non nulli di |A| vengono detti valori singolari di A e il loro insieme si indica con sing(A). La dimensione (finita) mλ dell’autospazio corrispondente a λ ∈ sing(A) viene detta molteplicit` a di λ Teorema 4.21. Siano (H, ( | )) spazio di Hilbert e A ∈ B∞ (H) con A = 0, in modo che l’insieme dei valori singolari di A, sing(A), sia non vuoto. Ordinando sing(A) in modo decrescente: λ0 > λ1 > λ2 > . . ., ed usando tale ordinamento nelle somme scritte sotto, vale: A=
mλ
λ (uλ,i | ) vλ,i ,
(4.14)
λ (vλ,i | ) uλ,i ,
(4.15)
λ∈sing(A) i=1
A∗ =
mλ
λ∈sing(A) i=1
dove le somme, se infinite, sono intese nel senso della convergenza della topologia uniforme e, per ogni λ ∈ sing(A), l’insieme degli elementi uλ,1 , . . . , uλ,mλ `e una base ortonormale nell’autospazio di |A| associato all’autovalore λ. Inoltre, per λ ∈ sing(A) e i = 1, 2, . . . , mλ i vettori: 1 Auλ,i , (4.16) λ definiscono un insieme ortonormale. Per gli stessi valori di λ e i risulta infine: vλ,i :=
vλ,i = U uλ,i , dove U `e l’operatore che appare nella decomposizione polare A = U |A|.
(4.17)
168
4 Classi di operatori compatti
Dimostrazione. Notiamo che |A| `e autoaggiunto, positivo e compatto. I suoi autovalori saranno quindi reali, positivi e soddisfano quanto specificato in (a) e (b) del teorema 4.17. Studieremo il caso in cui l’insieme degli autovalori `e infinito (e quindi numerabile), lasciando il sottocaso banale al lettore. Il teorema 4.18 permette di sviluppare |A| come: |A| = λPλ , λ∈σp (|A|)
` chiaro che ci dove la convergenza `e intesa rispetto alla topologia uniforme. E si pu` o ridurre a considerare solo gli autovalori non nulli dato che quello nullo non fornisce contributo alla serie : |A| = λPλ . λ∈sing(A)
Se U `e limitato, si prova subito che se B(H) Tn → T ∈ B(H) nella topologia uniforme, vale anche U Tn → U T , sempre nel senso della topologia uniforme degli operatori. Dato che l’operatore U della decomposizione polare di A, A = U |A|, `e limitato, avremo subito che, nella convergenza della topologia uniforme: A = U |A| = λU Pλ . (4.18) λ∈sing(A)
Il teorema 4.17 nel punto (a) precisa che il sottospazio chiuso su cui proietta ogni Pλ (con λ > 0) ha dimensione finita mλ . Possiamo sempre trovare una base ortonormale di tale autospazio: {uλ,i }i=1,...,mλ . Si osservi che (uλ,i |uλ,j ) = δλλ δij per costruzione, siccome autovettori con autovalori distinti sono ortogonali (essendo |A| normale perch´e positivo) per (ii) in (b) di proposizione 3.49. Dato che uλ,i = |A|(uλ,i /λ), segue che uλ,i ∈ Ran(|A|). Quindi U agisce sugli uλ,i in modo isometrico, per cui i vettori a secondo membro di (4.17) sono ancora ortonormali. La (4.17) equivale alla (4.16) per la decomposizione polare di A: Auλ,i = U |A|uλ,i = U λuλ,i = λvλ,i . ` un facile esercizio provare che il proiettore ortogonale Pλ (λ > 0) si pu` E o scrivere come: mλ Pλ = (uλ,i | ) uλ,i . i=1
Di conseguenza: U Pλ =
mλ i=1
(uλ,i | ) U uλ,i =
mλ
(uλ,i | ) vλ,i .
i=1
Sostituendo in (4.18) si trova (4.14). La (4.15) si ottiene dalla (4.14) tenendo conto dei seguenti fatti.
4.3 Operatori di Hilbert-Schmidt
169
(i) L’operazione di coniugazione hermitiana A → A∗ `e antilineare, per cui trasforma combinazioni lineari di operatori in combinazioni lineari dei loro aggiunti e con i corrispondenti coefficienti sostituiti dai complessi coniugati dei coefficienti della combinazione lineare iniziale. (ii) L’operazione di coniugazione hermitiana `e continua nella topologia uniforme di B(H) in quanto ||A∗|| = ||A|| per (a) di proposizione 3.38. In conseguenza di ci`o, da (4.14) troviamo (si tenga conto del fatto che λ ∈ R): A∗ =
mλ
λ [(uλ,i | ) vλ,i ]∗ ,
λ∈sing(A) i=1
` un facile esercizio verificare dove la serie converge nella topologia uniforme. E che [(uλ,i | ) vλ,i ]∗ = (vλ,i | ) uλ,i , da cui segue immediatamente la (4.15).
Il teorema provato consente di introdurre la nozione di operatore di HilbertSchmidt e di operatore di classe traccia, che vedremo nelle prossime sezioni.
4.3 Operatori di Hilbert-Schmidt Una classe particolare di operatori compatti sono quelli di Hilbert-Schmidt. Questi trovano applicazioni in vasti rami della fisica matematica, oltre che nella meccanica quantistica. Questa sezione e dedicata ad introdurre tali operatori ed a discuterne le propriet`a generali. Nota importante. In questa sezione e talvolta nel seguito, la norma || ||2 , se riferita ad operatori, indica la norma di Hilbert-Schmidt che definiremo tra poco e non la solita norma L2 . La notazione non dovrebbe generare ambiguit` a, in quanto il significato dovrebbe essere ovvio dal contesto una volta che il lettore sia stato messo in guardia. Definizione 4.22. Sia (H, (|)) spazio di Hilbert e sia || || la norma indotta dal prodotto scalare. A ∈ B(H) `e detto operatore di Hilbert-Schmidt se esiste una base hilbertiana U per cui u∈U ||Au||2 < +∞ nel senso della definizione 3.20. La classe degli operatori di Hilbert-Schmidt su H sar` a indicata con B2 (H) e, se A ∈ B2 (H), allora: ! ||A||2 := ||Au||2 , (4.19) u∈U
dove U `e la base hilbertiana suddetta.
170
4 Classi di operatori compatti
Per prima cosa mostriamo che la particolare base scelta nella definizione `e in realt` a irrilevante e che anche ||A||2 non dipende dalla scelta di tale base. Proposizione 4.23. Siano (H, ( | )) spazio di Hilbert, || || la norma indotta dal prodotto scalare, U e V due basi hilbertiane (eventualmente coincidenti) e A ∈ B(H). (a) {||Au||2}u∈U ammette somma finita se e solo se {||Av||2 }v∈V ammette somma finita. In tal caso vale: ||Au||2 = ||Av||2 . (4.20) u∈U
v∈V
(b) {||Au||2}u∈U ammette somma finita se e solo se {||A∗v||2 }v∈V ammette somma finita. In tal caso vale: ||Au||2 = ||A∗v||2 . (4.21) u∈U
v∈V
Dimostrazione. Consideriamo che, per (d) del teorema 3.27, ||Au||2 = |(v|Au)|2 < +∞ , v∈V
per cui, fissato u, solo una quantit` a al pi` u numerabile di coefficienti |(v|Au)| `e non nulla per (b) di proposizione 3.22. Ci` o determina un insieme al pi` u numerabile V (u) ⊂ V tale che ||Au||2 = |(v|Au)|2 < +∞ . (4.22) u∈U
u∈U v∈V (u)
Questo significa in particolare, riutilizzando (b) di proposizione 3.22, che solo un insieme al pi` u numerabile di elementi u ∈ U fornisce somme v∈V (u) |(v|Au)|2 non nulle. In definitiva i coefficienti (v|Au) sono non nulli solo per un insieme Z al pi` u numerabile di coppie (u, v) ∈ U ×V . Definiamo gli insiemi al pi` u numerabili: U0 := {u ∈ U | esiste v ∈ V con (v|Au) = 0} , V0 := {v ∈ V | esiste u ∈ U con (v|Au) = 0} . In tal modo Z ⊂ U0 × V0 . Possiamo mettere su U0 e V0 le misure μ e ν che, rispettivamente, contano gli elementi di U0 e V0 e le serie sopra considerate si trascrivono in termini di integrali rispetto alle misure dette ((c) proposizione 3.22). In particolare (4.22) si riscrive: ||Au||2 = |(v|Au)|2 = dμ(u) dν(v)|(v|Au)|2 < +∞ . u∈U
u∈U v∈V (u)
U0
V0
(4.23)
4.3 Operatori di Hilbert-Schmidt
171
Le misure μ e ν sono σ-finite perch´e U0 e V0 sono al pi` u numerabili, per cui ha senso definire la misura prodotto μ ⊗ ν e applicare il teorema di FubiniTonelli. Tale teorema assicura che, per l’ultima parte di (4.23), la funzione (v, u) → |(v|Au)|2 `e integrabile rispetto alla misura prodotto e che possiamo interscambiare gli integrali: ||Au||2 = |(v|Au)|2 dμ(u) ⊗ dν(v) U0 ×V0
u∈U
=
dμ(u)|(v|Au)|2 < +∞ .
dν(v) V0
U0
Notiamo che (v|Au) = (A∗ v|u), per cui solo una quantit` a al pi` u numerabile di elementi (A∗ v|u) (con (u, v) ∈ U × V ) sar`a non nulla e avremo in particolare: ∗ 2 |(A v|u)| = dν(v) dμ(u)|(A∗v|u)|2 = ||Au||2 < +∞ . v∈V u∈U
V0
U0
u∈U
Ma il primo membro `e proprio v∈V ||A∗v||2 . Abbiamo provato parte della proposizione (b): se {||Au||2}u∈U ammette somma finita allora {||A∗v||2 }v∈V ammette somma finita e le due somme coincidono. Usando la stessa dimostrazione, scambiando i nomi delle basi e dei loro elementi e partendo dall’operatore A∗ , ricordando che vale (A∗ )∗ = A per operatori limitati, si prova nello stesso modo che vale la parte rimanente di (b): se {||A∗v||2 }v∈V ammette somma finita, allora {||Au||2}u∈U ammette somma finita, ed in tal caso vale (4.21). La dimostrazione di (a) si prova immediatamente da (b) tenendo conto dell’arbitrariet` a delle basi usate. Possiamo enunciare e provare alcune delle numerose ed interessanti propriet`a matematiche degli operatori di Hilbert-Schmidt. La propriet` a pi` u interessante dal punto di vista matematico `e la (b) del teorema scritto sotto: gli operatori di Hilbert-Schmidt formano uno spazio di Hilbert con un prodotto scalare che induce una norma che coincide, per ogni operatore A di Hilbert-Schimdt, proprio con il numero che avevamo indicato con ||A||2. Un altro fatto importante `e che gli operatori di Hilbert-Schmidt sono compatti e formano un ideale bilatero chiuso rispetto alla coniugazione hermitiana all’interno dello spazio degli operatori limitati. Teorema 4.24. Sia H spazio di Hilbert. Gli operatori di Hilbert-Schmidt godono delle seguenti propriet` a. (a) B2 (H) `e un sottospazio di B(H) e pi` u fortemente uno ∗-ideale bilatero di B(H); inoltre: (i) ||A||2 = ||A∗||2 per ogni A ∈ B2 (H); (ii) ||AB||2 ≤ ||B|| ||A||2 e ||BA||2 ≤ ||B|| ||A||2 per ogni A ∈ B2 (H) e B ∈ B(H);
172
4 Classi di operatori compatti
(iii) ||A|| ≤ ||A||2 per ogni A ∈ B2 (H). (b) Se A, B ∈ B2 (H) e se N `e una base hilbertiana in H, si definisca: (A|B)2 :=
(Ax|Bx) .
(4.24)
x∈N
L’applicazione: ( | )2 : B2 (H) × B2 (H) → C `e ben definita (la somma di sopra si riduce sempre ad una serie assolutamente convergente e non dipende dalla base hilbertiana) e determina un prodotto scalare su B2 (H) che per ogni A ∈ B2 (H) soddisfa: (A|A)2 = ||A||22 .
(4.25)
(c) (B2 (H), ( | )2 ) `e spazio di Hilbert. (d) B2 (H) ⊂ B∞(H). Pi` u precisamente, A ∈ B2 (H) se e solo se A `e compatto e l’insieme dei numeri positivi {mλ λ2 }λ∈sing(A) (essendo mλ la molteplicit` a di λ) ha somma finita. In tal caso risulta: ! ||A||2 =
mλ λ2 .
(4.26)
λ∈sing(A)
Dimostrazione. (a) Ovviamente B2 (H) `e chiuso rispetto alla moltiplicazione per scalare. Mostriamo che lo `e rispetto a quello di somma di operatori. Se A, B ∈ B2 (H) e N `e una qualsiasi base hilbertiana: # " ||(A + B)u||2 ≤ (||Au|| + ||Bu||)2 ≤ 2 ||Au||2 + ||Bu||2 . u∈N
u∈N
u∈N
u∈N
Quindi B2 (H) `e sottospazio di B(H). Il fatto che sia chiuso rispetto alla coniugazione hermitiana `e una immediata conseguenza di (b) della proposizione 4.23, che implica anche (i). Mostriamo che vale (ii) e, contestualmente, che B2 (H) `e chiuso rispetto alla composizione destra e sinistra con operatori limitati. Se A ∈ B2 (H) e B ∈ B(H) allora: u∈N
||BAu||2 ≤
u∈N
||B||2||Au||2 = ||B||2
||Au||2 .
u∈N
Questo prova insieme che B2 (H) `e chiuso rispetto alla composizione sinistra con operatori limitati e che vale la seconda disuguaglianza in (ii). La chiusura rispetto alla moltiplicazione a destra `e immediata conseguenza di quella a sinistra e della chiusura rispetto alla coniugazione hermitiana: B ∗ A∗ ∈ B2 (H) se A ∈ B2 (H) e B ∈ B(H), e quindi (B ∗ A∗ )∗ ∈ B2 (H), ossia AB ∈ B2 (H). Da (i) abbiamo anche che se A ∈ B2 (H) e B ∈ B(H), allora
4.3 Operatori di Hilbert-Schmidt
173
||AB||2 = ||(AB)∗ ||2 = ||B ∗ A∗ ||2 ≤ ||B ∗ || ||A∗||2 = ||B|| ||A||2 che completa la dimostrazione di (ii). Per provare (iii) notiamo che: 2 1/2
||A|| = sup ||Ax|| = sup (||Ax|| ) ||x||=1
= sup
||x||=1
= sup ||x||=1
||x||=1
1/2 |(u|Ax)|
2
u∈N
1/2 |(A∗ u|x)|2
,
u∈N
dove abbiamo usato (d) del teorema 3.27 rispetto alla base hilbertiana N . Utilizzando la disuguaglianza di Cauchy-Schwarz nell’ultimo termine della catena di uguaglianze di sopra, otteniamo: ||A|| ≤ sup
||x||=1
1/2 ||A∗u||2||x||2
=
u∈N
1/2 ||A∗ u||2
= ||A∗ ||2 = ||A||2 .
u∈N
(b) Se A, B ∈ B2 (H) e N `e una base hilbertiana, allora la quantit` a di termini Au e Bu non nulli, per u ∈ N , `e al pi` u numerabile per la definizione 4.22 e (b) di proposizione 3.22. Valendo: |(Au|Bu)| ≤ ||Au|| ||Bu|| ≤
1 (||Au||2 + ||Bu||2) , 2
concludiamo che la quantit` a di termini non nulli (Au|Bu) per u ∈ N `e anch’essa al pi` u numerabile e che la serie dei termini non nulli (Au|Bu) `e assolutamente convergente, per cui non conta l’ordinamento scelto nel calcolare (4.24). Mostreremo tra poco che la scelta della base hilbertiana `e irrilevante. Prima notiamo che (4.25) `e vera banalmente e che ( | )2 soddisfa gli assiomi di un semiprodotto scalare, come `e immediato verificare. L’assioma di positivit`a H3 `e immediata conseguenza di (iii), pertanto ( | )2 `e un prodotto scalare che induce la norma || ||2. Quindi vale l’identit` a di polarizzazione, che sussiste per ogni prodotto scalare: 4(A|B)2 = ||A + B||22 + ||A − B||22 − i||A + iB||22 + i||A − iB||22 . Dato che, per la proposizione 4.23, il secondo membro non dipende dalla base hilbertiana usata, non dipender` a dalla scelta della base nemmeno il primo membro. (c) Bisogna solo provare che lo spazio `e completo. Sia N una base hilbertiana di H. Sia {An }n∈N una successione di Cauchy di operatori di Hilbert-Schmidt rispetto alla norma || ||2 . Da (iii) di (a) la successione `e di Cauchy anche nella topologia uniforme, per cui, essendo B(H) completo per il teorema 2.54, esister`a A ∈ B(H) con ||A − An || → 0 per n → +∞. La propriet` a di Cauchy dice che preso > 0, esiste N tale che, ||An − Am ||22 ≤ 2 se n, m > N .
174
4 Classi di operatori compatti
Tenendo conto della definizione di || ||2, varr` a anche che, per lo stesso , per ogni sottoinsieme finito I ⊂ N : ||(An − Am )u||2 ≤ ||An − Am ||22 ≤ 2 u∈I
quando n, m > N . Passando al limite per m → +∞, si trova che vale ancora: ||(An − A)u||2 ≤ 2 , u∈I
a per ogni sottoinsieme finito I ⊂ N se n > N . In definitiva, per l’arbitrariet` di I, abbiamo che: ||A − An ||2 ≤ se n > N . (4.27) Da questo fatto segue in particolare che A − An ∈ B2 (H) e quindi: A = An + (A − An ) ∈ B2 (H) . Inoltre, per l’arbitrariet` a di > 0 in (4.27), vale anche che An tende a A rispetto alla norma || ||2 . Quindi ogni successione di Cauchy nella norma || ||2 converge in B2 (H), che di conseguenza `e completo. (d) Sia A ∈ B2 (H): mostriamo che `e compatto e che soddisfa (4.26). Sia N una base hilbertiana. Vale u∈N ||Au||2 < +∞, dove solo una quantit` a al pi` u numerabile di addendi `e non nulla ed infine sappiamo che la somma si pu` o scrivere come una serie o una somma finita considerando solo i vettori un per cui ||Aun||2 > 0. Di conseguenza varr` a che, per ogni > 0, esiste N tale che: +∞
||Aun ||2 ≤ 2 .
n=N
La stessa propriet`a si pu` o quindi trascrivere in termini di tutti gli elementi di N : per ogni > 0 esiste un sottoinsieme finito I ⊂ N tale che: ||Au||2 ≤ 2 . u∈N\I
Sia quindi AI l’operatore definito imponendo: AI u := Au se u ∈ I e AI u := 0 se u ∈ N \ I . Il rango di AI `e generato dai vettori Au con u ∈ I , essendo tali vettori in numero finito, AI `e limitato e compatto ((1) in esempi 4.16). Per costruzione esiste ||A − AI ||2 e vale: ||A − AI ||22 = ||(A − AI )u||2 = ||Au||2 , u∈B
u∈N\I
pertanto, per (iii) di (a) abbiamo che ⎛ ||A − AI || ≤ ||A − AI ||2 = ⎝
u∈N\I
⎞1/2 ||Au||2⎠
≤.
4.3 Operatori di Hilbert-Schmidt
175
Quindi A `e un punto di accumulazione dello spazio degli operatori compatti rispetto alla topologia uniforme. Tenendo conto del fatto che l’ideale degli operatori compatti `e chiuso nella topologia uniforme ((c) di teorema 4.15), il risultato ottenuto prova che A `e compatto. Dimostriamo√adesso che vale (4.26): consideriamo l’operatore positivo compatto |A| = A∗ A e sia {uλ,i}λ∈sing(A),i={1,2,...,mλ } una base hilbertiana di Ker(|A|)⊥ costruita come nel teorema 4.21. Possiamo completarla a base dello spazio di Hilbert aggiungendo una base hilbertiana per Ker(|A|), che coincide con Ker(A) per l’osservazione 3.60. (Se {ui } `e base hilbertiana per il sottospazio chiuso Ker(|A|) e {vj } `e una base hilbertiana per il sottospazio chiuso Ker(|A|)⊥ , allora l’insieme ortonormale N := {ui } ∪ {vj } `e base hilbertiana per H, perch´e, come `e facile provare dalla decomposizione ortogonale H = Ker(|A|) ⊕ Ker(|A|)⊥ , se x ∈ H `e ortogonale a N , allora x = 0.) Usando la base hilbertiana detta per esprimere ||A||2, abbiamo: ||A||22 =
mλ
(Auλ,i |Auλ,i ) =
λ∈sing(A) i=1
mλ
(A∗ Auλ,i |uλ,i )
λ∈sing(A) i=1
=
mλ
mλ λ2 ,
(4.28)
λ∈sing(A) i=1
dove si `e tenuto conto del fatto che la parte di base√riguardante Ker(A), per costruzione, non fornisce contributo, |A|uλ,i = A∗ Auλ,i = λuλ,i e (uλ,i |uλ,j ) = δλλ δij . Se, viceversa, A `e compatto e {mλ λ2 }λ∈sing(A) ha somma finita, allora da (4.28) segue che ||A||2 < +∞, per cui A ∈ B2 (H). Esempi 4.25. (1) Torniamo all’esempio (4) in esempi 4.16. Consideriamo gli operatori: TK : L2 (X, μ) → L2 (X, μ) indotti dai nuclei integrali K ∈ L2 (X × X, μ ⊗ μ) (con μ misura σ-finita separabile), (TK f)(x) := K(x, y)f(y)dμ(y) per ogni f ∈ L2 (X, μ) . X
Abbiamo provato che tali operatori sono compatti. Mostriamo ora che sono anche di Hilbert-Schmidt. Usando le stesse definizioni dell’esempio in questione, se f ∈ L2 (X, μ) avevamo visto che (vedi punto (3) nell’esempio (4)), per ogni x ∈ X, F (x) = |K(x, y)| |f(y)|dμ(y) < +∞ . X
2
Dato che F ∈ L (X, μ), per ogni g ∈ L2 (X, μ) la funzione x → g(x)F (x) `e una funzione integrabile (in modo da poter definire il prodotto scalare di g
176
4 Classi di operatori compatti
e F ). Il teorema di Fubini-Tonelli assicura quindi che la funzione (x, y) → g(x)K(x, y)f(y) `e in L2 (X × X, μ ⊗ μ) e che g(x)K(x, y)f(y) dμ(x) ⊗ dμ(y) = dμ(x) g(x) K(x, y)f(y)dμ(y) X×X
X
X
= (g|Tk f) .
(4.29)
Consideriamo allora una base hilbertiana di L2 (X×X, μ⊗μ) del tipo {ui ·uj }i,j , dove {uk }k `e una base hilbertiana per L2 (X, μ) (e quindi lo `e anche {uk }k , come si prova immediatamente). Dato che K ∈ L2 (X × X, μ ⊗ μ), varr` a lo sviluppo: K= αij ui · uj , (4.30) i,j
per cui: ||K||2L2 =
|αij |2 < +∞ .
(4.31)
i,j
D’altra parte, da (4.29) e (4.30), si ha: (ui |TK uj ) = ui (x)uj (y)K(x, y) dμ(x) ⊗ dμ(y) = (ui · uj |K) = αij , X×X
per cui (4.31) si pu` o riscrivere: ||K||2L2 =
|(ui |TK uj )|2 < +∞ .
i,j
Per definizione di operatore di Hilbert-Schmidt, TK `e quindi un operatore di Hilbert-Schmidt e vale anche: ||TK ||2 = ||K||L2
(4.32)
` abbastanza facile provare che se H = L2 (X, μ) con μ σ-finita e separabile, (2) E allora B2 (H) consiste di tutti e soli gli operatori TK con K ∈ L2 (X×X, μ⊗μ) e che quindi l’applicazione che identifica K con TK `e un isomorfismo di spazi di Hilbert L2 (X × X, μ ⊗ μ) allo spazio di Hilbert B2 (H). Consideriamo a tal fine T ∈ B2 (H) ed esibiamo K ∈ L2 (X ×X, μ⊗μ) per cui T = TK . Presa una qualsiasi base Hilbertiana {un }n∈N di L2 (X, μ) deve essere n∈N ||T un ||2 < +∞. Conseguentemente, sviluppando T un sulla stessa base {un }n∈N , si ottiene che: +∞ >
n∈N
||T un ||2 =
|(um |T un )|2 .
m∈N n∈N
Interpretando le somme come integrali il teorema su {un }n∈N, ed applicando 2 di Fubini-Tonelli, concludiamo che: |(u |T u )| < +∞ e quindi m n (n,m)∈N2
4.3 Operatori di Hilbert-Schmidt
177
l’operatore integrale di Hilbert-Schmidt TK con nucleo integrale K ∈ L2 (X × X, μ ⊗ μ) dato da: K := (um |T un )um · un (n,m)∈N2
`e ben definito. D’altra parte, usando i risultati dell’esempio precedente, per costruzione vale: (um |TK un ) = dμ(x)um (x) dμ(y)K(x, y)un (y) = (um |T un ) X
X
e quindi: TK un = T un per ogni n ∈ N. Per continuit` a segue immediatamente che TK = T . (3) Consideriamo l’equazione di Volterra nella funzione incognita f ∈ L2 ([0, 1], dx): x f(y)dy + g(x) , (4.33) f(x) = ρ 0 2
con g ∈ L ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato. Sopra dx indica la misura di Lebesgue e l’integrale esiste dato che, per ogni fissato x ∈ [0, 1], pu` o essere interpretato come il prodotto scalare tra f e la funzione [0, 1] y → θ(x − y), e quindi riscritto come:
x
1
f(y)dy = 0
0
θ(x − y)f(y)dy ,
dove θ(u) = 1 se u ≥ 0 oppure θ(u) = 0 se u < 0. Dato che evidentemente (x, y) → θ(x − y) `e anche una funzione in L2 ([0, 1]2, dx ⊗ dy), l’equazione pu` o essere riscritta in termini di un operatore di Hilbert-Schmidt T come: con g ∈ L2 ([0, 1], dx) assegnata, ρ ∈ C \ {0} assegnato, (4.34) dove abbiamo introdotto l’operatore di Volterra: x (T g)(x) := g(y)dy g ∈ L2 ([0, 1], dx) . (4.35) f = ρT f + g ,
0
Pi` u in generale gli operatori di Volterra, e quindi le equazioni associate, sono definiti come: x (TV f)(x) := V (x, y)g(y)dy , 0
2
per qualche V : [0, 1] → R con qualche grado di regolarit` a. Noi studiamo qui il caso pi` u semplice dato dalla (4.35). Se l’operatore (I − ρT ) fosse invertibile, la soluzione dell’equazione (4.34) sarebbe data da: f = (I − ρT )−1 g .
(4.36)
178
4 Classi di operatori compatti
Formalmente, usando lo stesso sviluppo della serie geometrica, abbiamo che l’operatore inverso (destro e sinistro) di I − ρT `e dato dalla somma della serie: (I − ρT )−1 = I +
+∞
ρn+1 T n+1
(4.37)
n=0
interpretando la convergenza della serie nella topologia uniforme. Una condizione sufficiente per la convergenza `e ||ρT || < 1 e la dimostrazione `e la stessa che per la serie geometrica. Noi vogliamo per`o cercare di fare una stima pi` u fine. Usiamo la norma dello spazio B2 (L2 ([0, 1], dx)), tenendo conto di (iii) in (a) del teorema 4.24 ed infine notando che se, per An ∈ B(L2 ([0, 1], dx)), vale +∞ ||An|| ≤ an ≥ 0 dove la serie n=0 an converge, allora converge anche la serie +∞ 2 n=0 An nella topologia di B(L ([0, 1], dx)). La dimostrazione di quest’ultimo fatto `e la stessa che si ha in analisi elementare, per esempio per dimostrare il criterio di Weierstrass della serie dominata. Il calcolo diretto tramite (4.35), mostra che, se n ≥ 1: x (x − y)n (T n+1 g)(x) = g(y)dy , n! 0 per cui T n ∈ B2 (L2 ([0, 1], dx)) e anche: !
n−1
(x − y)n−1 2 n n 2
dx ⊗ dy ≤ 2 |θ(x − y)| ||T || ≤ ||T ||2 = . (n − 1)! (n − 1)! [0,1]2 n n
Dato che la serie di termine generico ρ n!2 converge, concludiamo che, per ogni valore di ρ = 0, l’operatore (I − ρT )−1 esiste in B(L2 ([0, 1], dx)) ed `e dato dalla somma a secondo membro di (4.37). E dunque (4.36) `e la soluzione dell’equazione di Volterra iniziale. Si pu` o infine dare la forma esplicita dell’operatore (I − ρT )−1 .
+∞ (I − ρT )−1 g (x) = g(x) + ρn+1 T n+1 g (x) n=0
= g(x) + ρ
+∞ x n=1
0
(ρ(x − y))n g(y)dy . n!
In teorema della convergenza dominata prova che si pu`o scambiare la serie con l’integrale trovando, per la soluzione dell’equazione di Volterra: x eρ(x−y) g(y)dy . f(x) = (I − ρT )−1 g (x) = g(x) + ρ 0
Tuttavia, nel fare queste operazioni, abbiamo usato una nozione di convergenza puntuale, differente da quella operatoriale uniforme. Il fatto che l’espressione di sopra sia davvero la forma esplicita dell’operatore inverso di
4.4 Operatori di classe traccia (o nucleari)
179
I − ρT si pu` o verificare per computo diretto, usando l’espressione esplicita (4.35) ed integrando per parti lavorando con g ∈ C([0, 1]). Il risultato si estende su tutto L2 ([0, 1], dx), tenendo conto che l’operatore con nucleo integrale θ(x − y)eρ(x−y) `e limitato (essendo di Hilbert-Schmidt) e C([0, 1]) `e denso in L2 ([0, 1], dx). L’unicit` a dell’inverso conclude la dimostrazione. (4) Sia L2 (X, μ) con μ separabile. Un operatore integrale TK : L2 (X, μ) → L2 (X, μ) individuato dal nucleo integrale: K(x, y) =
N
pk (x)qk (y) ,
k=1
dove pk , qk ∈ L2 (X, μ), k = 1, 2, 3, . . ., N sono funzioni arbitrarie e N ∈ N `e arbitrario, `e detto operatore degenere. Gli operatori degeneri formano uno ∗-ideale bilatero BD (L2 (X, μ)) di B(L2 (X, μ)) che `e sottospazio di B∞ (L2 (X, μ)) e B2 (L2 (X, μ)). Si pu` o provare abbastanza facilmente che BD (L2 (X, μ)) `e denso in B2 (L2 (X, μ)) nella topologia naturale di quest’ultimo. Il contenuto delle osservazioni (1) e (2) pu`o essere racchiuso in un teorema. L’ultima affermazione `e di immediata dimostrazione ed lasciata per esercizio. Teorema 4.26. Se μ `e una misura positiva σ-additiva e separabile su X, lo spazio B2 (L2 (X, μ)) `e costituito da tutti e soli gli operatori TK della forma: (TK f)(x) := K(x, y)f(y)dy , per ogni f ∈ L2 (X, μ), X
2
dove K ∈ L (X × X, μ ⊗ μ). Inoltre risulta: ||TK ||2 = ||K||L2(X×X,μ⊗μ) . L’applicazione L2 (X × X, μ ⊗ μ) K → TK ∈ B2 (L2 (X, μ)) `e un isomorfismo di spazi di Hilbert.
4.4 Operatori di classe traccia (o nucleari) Passiamo ad introdurre gli operatori di classe traccia, detti anche operatori nucleari. Seguiremo essenzialmente l’approccio in [Mar82] (un altro approccio si trova in [Pru81]). Proposizione 4.27. Siano H spazio di Hilbert e A ∈ B(H). I seguenti tre fatti sono equivalenti. (a) Esiste una base hilbertiana N di H per cui {(u||A|u)}u∈N ha somma finita: (u||A|u) < +∞ . u∈N
180
4 Classi di operatori compatti
(a)’ |A| `e operatore di Hilbert-Schmidt. (b) A `e compatto ed inoltre l’insieme indicizzato {mλ λ}λ∈sing(A), dove mλ `e la molteplicit` a di λ, ha somma finita. Dimostrazione. Si osservi che (a)’ `e una semplice trascrizione di (a), tenendo conto del fatto che |A| |A| = |A|. Per cui (a) e (a)’ sono equivalenti. Mostriamo che (a) implica (b). A `e compatto perch´e |A| = ( |A|)2 `e compatto essendo |A| compatto, in quanto ogni operatore di Hilbert-Schmidt `e compatto ((d) teorema 4.24), il prodotto di operatori compatti `e compatto ((b) teorema 4.15), ed infine |A| `e compatto se e solo se lo `e A (proposizione 4.14). Costruiamo una base hilbertiana di H usando autovettori di |A|: uλ,i con i = 1, . . . , mλ (mλ = +∞ al pi` u solo per λ = 0) e |A|uλ,i = λuλ,i . Rispetto a tale base:
2
uλ,i ( |A|)2 uλ,i |A|uλ,i |A|uλ,i =
|A|
= 2
λ,i
λ,i
=
(uλ,i ||A|uλ,i) =
λ,i
mλ λ
λ
2
per cui {mλ λ}λ∈sing(A), ha somma finita essendo
|A|
< +∞ per ipotesi. 2 ` ora ovvio che (b) implica (a)’ procedendo all’indietro nelle argomentazioni E
2
e calcolando
|A|
in una base di autovettori di |A|. 2
Definizione 4.28. Sia H spazio di Hilbert. A ∈ B(H) `e detto operatore di classe traccia o, equivalentemente, operatore nucleare, se soddisfa una delle tre condizioni (a), (a)’ o (b) in proposizione 4.27. L’insieme degli operatori di classe traccia su H sar` a indicato con B1 (H) e, se A ∈ B1 (H), allora
2
||A||1 :=
|A|
= mλ λ , (4.38) 2
λ∈sing(A)
dove abbiamo usato le stesse notazioni usate in proposizione 4.27. Osservazioni 4.29. (1) Il nome “classe traccia” deriva evidentemente almeno dal seguente fatto. Per un operatore A di classe traccia, il numero reale ||A||1 generalizza al caso infinito-dimensionale la nozione di traccia della matrice corrispondente ad |A| (e non A). In realt` a le analogie non finiscono qui, come vedremo tra poco. (2) Valgono le inclusioni: B1 (H) ⊂ B2 (H) ⊂ B∞ (H) ⊂ B(H) . L’unica inclusione non ancora dimostrata `e la prima. Per provarla notiamo che, se A ∈ B1 (H), allora, per definizione, |A| ∈ B2 (H), quindi |A| = |A| |A|
4.4 Operatori di classe traccia (o nucleari)
181
`e di Hilbert-Schmidt per (a) del teorema 4.24; in virt` u della decomposizione polare A = U |A|, essendo U ∈ B(H), si ha A ∈ B2 (H) per (a) del teorema 4.24. (3) Ciascuno degli insiemi scritti `e sottospazio vettoriale dello spazio degli operatori limitati ed in pi` u ∗-ideale bilatero (per gli operatori di classe traccia lo proveremo tra poco); infine ciascuno di questi sottospazi `e anche spazio di Hilbert o di Banach rispetto ad una naturale struttura: gli operatori compatti formano un sottospazio chiuso rispetto alla topologia uniforme in B(H) e quindi uno spazio di Banach rispetto alla norma operatoriale, gli operatori di Hilbert-Schmidt definiscono uno spazio di Hilbert rispetto al prodotto scalare di Hilbert-Schmidt e gli operatori di classe traccia definiscono uno spazio di Banach rispetto alla norma || ||1, come diremo pi` u avanti. Prima di passare ad estendere il concetto di traccia al caso infinito-dimensionale, vediamo le propriet` a pi` u importanti degli operatori nucleari o di classe traccia. Teorema 4.30. Sia H spazio di Hilbert. Gli operatori nucleari in H godono delle seguenti propriet` a. (a) Se A ∈ B1 (H) allora esistono due operatori B, C ∈ B2 (H) tali che A = BC. Viceversa, se B, C ∈ B2 (H) allora BC ∈ B1 (H) ed in tal caso: ||BC||1 ≤ ||B||2 ||C||2 .
(4.39)
u fortemente `e uno ∗-ideale bilatero, (b) B1 (H) `e un sottospazio di B(H) e pi` inoltre: (i) ||AB||1 ≤ ||B|| ||A||1 e ||BA||1 ≤ ||B|| ||A||1 per ogni A ∈ B1 (H) e B ∈ B(H), (ii) ||A||1 = ||A∗ ||1 per ogni A ∈ B1 (H). (c) || ||1 definisce una norma su B1 (H). ` possibile provare che B1 (H) `e uno spazio di Banach Osservazione 4.31. E rispetto alla norma || ||1 [Sch60, BiSo87]. Prova del teorema 4.30 eccetto (ii) in (b) che verr` a dimostrata in proposizione 4.34. (a) Se A `e di classe traccia, usando la decomposizione polare di A = U |A| (teorema 3.61), B e C possono sempre essere definiti come B := U |A| e C := |A|. Per definizione di operatore di classe traccia, |A| `e operatore di Hilbert-Schmidt, dunque C `e Hilbert-Schmidt. Lo `e anche B, in quanto U ∈ B(H) e gli operatori di Hilbert-Schmidt formano un ideale in B(H), come provato nel teorema 4.24. Siano ora B e C di Hilbert-Schmidt, mostriamo che A := BC `e di classe traccia. Notiamo che A `e compatto per (d) di teorema 4.24 e (b) di teorema 4.15; quindi dobbiamo solo provare che λ∈sing(A) mλ λ < +∞. Se BC = 0, la tesi `e ovvia. Assumiamo BC = 0 e sviluppiamo l’operatore compatto BC come nel teorema 4.21: A = BC =
mλ
λ∈sing(A) i=1
λ(uλ,i | )vλ,i .
182
4 Classi di operatori compatti
Per non caricare troppo le notazioni, poniamo: Γ := {(λ, i)|λ ∈ sing(A), i = 1, 2, . . ., mλ } e λj indichi il primo elemento della coppia j = (λ, i). Allora `e chiaro che:
λj =
j∈Γ
mλ λ .
λ∈singA
Dal teorema di decomposizione polare A = U |A| con U ∗U = I sul rango di |A| e tendo conto che vj = U uj per cui U ∗ vj = uj , segue che: (vj |BCuj ) = (vj |Auj ) = (vj |U |A|uj ) = λj (vj |U uj ) = λj (U ∗ vj |uj ) = λj (uj |uj ) = λj . Se S ⊂ Γ `e finito: j∈S
≤
λj =
(vj |BCuj ) =
j∈S
(B ∗ vj |Cuj )
j∈S
||B ∗vj || ||Cuj || ≤
!
j∈S
||B ∗ vj ||2
!
j∈S
||Cuj ||2 .
j∈S
Dato che gli insiemi ortonormali di elementi uj = uλ,i e vj = vλ,i possono essere separatamente completati a base hilbertiana di H, l’ultimo termine della catena di disuguaglianze di sopra `e maggiorato da: ||B ∗ ||2 ||C||2 = ||B||2 ||C||2 . Prendendo l’estremo superiore su tutti gli S finiti, concludiamo che: mλ λ ≤ ||B||2 ||C||2 ||BC||1 = λ∈sing(A)
ed in particolare A = BC ∈ B1 (H). (b) e (c). La chiusura di B1 (H) rispetto al prodotto per scalare si prova immediatamente dalla stessa definizione di operatore nucleare. Mostriamo che B1 (H) `e chiuso rispetto alla somma. Siano A, B ∈ B1 (H). Se A + B = 0, allora A + B `e nucleare banalmente. Assumiamo pertanto A + B = 0, che `e comunque compatto. Decomponendo polarmente abbiamo: A = U |A|, B = V |B|, A + B = W |A + B|. Usando la solita decomposizione sui valori singolari come nella prova di (a) avremo: A+B =
mβ
β∈sing(A+B) i=1
β(uβ,i | )vβ,i .
4.4 Operatori di classe traccia (o nucleari)
183
Se Γ := {(β, i)|β ∈ sing(A + B), i = 1, 2, . . . , mβ }, S ⊂ Γ `e finito e βj `e il primo elemento della coppia j ∈ Γ , si ha: βj = (vj |(A + B)uj ) = (vj |Auj ) + (vj |Buj ) . j∈S
j∈S
j∈S
j∈S
La somma delle due somme ottenuta alla fine pu` o essere riscritta in altro modo, ottenendo: βj = ( |A|U ∗ vj | |A|uj ) + ( |B|V ∗ vj | |B|uj ) . j∈S
j∈S
j∈S
Procedendo come per l’analoga dimostrazione in (a), otteniamo: βj ≤ || |A|U ∗ ||2 || |A|||2 + || |B|V ∗ ||2 || |B|||2 ≤ || |A|||22 + || |B|||22 j∈S
(nell’ultimo passaggio abbiamo tenuto conto del fatto per A che, per esempio, ∗ ∗ vale la disuguaglianza ((a) (ii) del teorema 4.24) || |A|U || ≤ || |A||| ||U ||, 2 2 ∗ dato che |A| `e di Hilbert-Schmidt; inoltre ||U || ≤ 1, come `e immediato provare, visto che `e un operatore isometrico su Ker(|A|)⊥ e si annulla su Ker(|A|)). Notiamo infine che: || |A|||22 + || |B|||22 = ||A||1 + ||B||1 . Abbiamo in definitiva provato che A + B ∈ B1 (H) e che in B1 (H) vale la disuguaglianza triangolare: ||A + B||1 ≤ ||A||1 + ||B||1 . Quindi || ||1 `e una seminorma. In realt`a `e una norma, in quanto ||A||1 = 0 implica che gli autovalori di |A| siano tutti nulli e quindi, essendo |A| compatto, |A| = 0 per (6) in (a) di teorema 4.17. Per la decomposizione polare di A = U |A|, segue infine che A = 0. Fino ad ora abbiamo provato che B1 (H) `e sottospazio vettoriale di B(H) e che || ||1 `e una norma. Mostriamo ora che B1 (H) `e chiuso rispetto alla composizione, a destra e a sinistra, con operatori Siano A ∈ B1 (H), B ∈ B(H) e A = U |A|. Allora limitati. BA = (BU |A|) |A|, dove i due fattori sono operatori di Hilbert-Schmidt e quindi, per (a), BA ∈ B1 (H). Usando (ii) di (a) in teorema 4.24, (4.38) e (a) del presente teorema, si ha: √ √ ||BA||1 ≤ ||BU |A|||2 || |A|||2 ≤ ||BU || || A||2 || A||2 √ ≤ ||B|| || A||22 = ||B|| ||A||1 . Inoltre AB = (U |A|) |A|B ∈ B1 (H) perch´e entrambi i fattori sono di Hilbert-Schmidt e vale (a). In modo analogo al caso trattato sopra, si trova
184
4 Classi di operatori compatti
che ||AB||1 ≤ ||B|| ||A||1. La prova di (ii) in (b) sar` a data nella prova della proposizione 4.34. Per concludere introduciamo il concetto di traccia di un operatore nucleare e mostriamo come la traccia abbia le stesse propriet`a formali della traccia di matrici. Proposizione 4.32. Se (H, ( | )) `e uno spazio di Hilbert, A ∈ B1 (H) e N `e una base hilbertiana di H: (u|Au) (4.40) trA := u∈N
`e ben definita, dato che la somma infinita a secondo membro `e (al pi` u) una serie assolutamente convergente. Inoltre: (a) trA non dipende dalla base hilbertiana scelta. (b) per ogni coppia ordinata (B, C) di operatori di Hilbert-Schmidt tali che A = BC vale: trA = (B ∗ |C)2 . (4.41) (c) |A| ∈ B1 (H) e vale:
||A||1 = tr|A| .
(4.42)
Dimostrazione. (a) e (b). Ogni operatore di classe traccia pu`o decomporsi nel prodotto di due operatori di Hilbert-Schmidt, come provato in (a) di teorema 4.30. Cominciamo con il notare che se A = BC con B, C operatori di HilbertSchmidt, allora: (B ∗ |C)2 = (B ∗ u|Cu) = (u|BCu) = (u|Au) = trA . u∈N
u∈N
u∈N
Questo prova che, oltre a valere (4.41), trA `e ben definito, essendo un prodotto scalare di Hilbert-Schmidt, e che nella somma infinita in (4.40) solo una quantit` a al pi` u numerabile di addendi `e non nulla e la somma infinita si riduce ad una somma finita oppure ad una serie assolutamente convergente dato che, per la definizione di prodotto scalare di Hilbert Schmidt, u∈N |(B ∗ u|Cu)| < +∞. (Quanto scritto sopra mostra anche che ∗ (B ∗ |C)2 = (B |C )2 se BC = B C , essendo B, B , C, C operatori di HilbertSchmidt.) Il risultato ottenuto prova infine l’invarianza di trA al variare della base hilbertiana, visto che ( | )2 non dipende dalla scelta della base hilbertiana. (c) Prima di tutto, per l’unicit` a della radice quadrata positiva, vale | (|A|) | = |A|. Infatti | (|A|) | `e l’unico operatore limitato positivo il cui quadrato `e |A|∗|A| = |A|2 e |A| `e limitato, positivo con quadrato pari a |A|2 . Quindi, essendo A di classe traccia: +∞ > (u||A|u) = (u|| (|A|) |u) , u∈N
u∈N
4.4 Operatori di classe traccia (o nucleari)
185
per cui, dalla definizione 4.28, |A| stesso `e di classe traccia. Infine, scegliendo una base hilbertiana fatta di autovettori di |A|, {uλ,i }, si ha: tr|A| =
mλ
(uλ,i | |A|uλ,i ) =
λ∈sing(A) i=1
mλ
λ∈sing(A) i=1
λ=
mλ λ = ||A||1 .
λ∈sing(A)
Questo conclude la dimostrazione.
Definizione 4.33. Siano H spazio di Hilbert e A ∈ B1 (H). Il numero trA ∈ C `e detto traccia dell’operatore A di A. La seguente proposizione enuncia altre utili propriet`a degli operatori nucleari in spazi di Hilbert: in particolare, esattamente come nel caso finitodimensionale, la ciclicit`a della traccia. Si osservi che non `e richiesto che tutti gli operatori nella traccia siano di classe traccia (e ci`o `e importante per le applicazioni in fisica). Proposizione 4.34. Sia H spazio di Hilbert. La traccia gode delle seguenti propriet` a. (a) Se A, B ∈ B1 (H) e α, β ∈ C, allora: trA∗ = trA , tr(αA + βB) = α trA + β trB .
(4.43) (4.44)
(b) Se A `e di classe traccia e B ∈ B(H), oppure A e B sono entrambi di Hilbert-Schmidt, allora trAB = trBA . (4.45) (c) Se A1 , A2 , . . . An sono in B(H) con almeno un operatore di classe traccia oppure almeno due operatori di Hilbert-Schmidt, allora vale la propriet` a di ciclicit` a della traccia: tr (A1 A2 · · · An ) = tr (Aσ(1) Aσ(2) · · · Aσ(n) ) ,
(4.46)
dove (σ(1), σ(2), . . . , σ(n)) `e una permutazione ciclica di (1, 2, . . ., n). Prova della proposizione 4.34 e di (ii) in (b) del teorema 4.30. (a) La prova `e immediata dalla stessa definizione di traccia. (b) Per dimostrare la tesi cominciamo con il provare che essa vale se A e B sono entrambi di Hilbert-Schmidt. Per (b) di teorema 4.24, (4.45) `e equivalente a dire che (A∗ |B)2 = (B ∗ |A)2 . (4.47) La prova di (4.47) `e immediata usando l’identit` a di polarizzazione, valida per tutti i prodotti scalari e le norme da essi generate: 4(X|Y ) = ||X + Y ||2 + ||X − Y ||2 − i||X + iY ||2 + i||X − iY ||2 ,
186
4 Classi di operatori compatti
e ricordando che, nel caso della norma di Hilbert-Schmidt, ||Z||2 = ||Z ∗ ||2 ((i) in (a) di teorema 4.24). Supponiamo ora che A sia di classe traccia e B ∈ B(H). Allora A = CD, con C e D di Hilbert-Schmidt per (a) del teorema 4.30. Inoltre DB e BC sono di Hilbert-Schmidt, in quanto B2 (H) `e un ideale bilatero di B(H). Quindi, usando la propriet` a di interscambio provata valida nel caso di due operatori di Hilbert-Schmidt, si ha: trAB = tr((CD)B) = tr(C(DB)) = tr((DB)C) = tr(D(BC)) = tr((BC)D) = tr(B(CD)) = trBA . ` chiaro che, essendo B1 (H) un ideale bilatero di B(H), `e sufficiente che un (c) E solo operatore tra A1 , . . . , An sia di classe traccia perch´e lo sia il loro prodotto. In particolare, usando (a) del teorema 4.30 unitamente al fatto che anche B2 (H) `e un ideale di B(H), si vede subito che se due operatori tra A1 , . . . , An ` chiaro sono di Hilbert-Schmidt, allora il prodotto totale `e di classe traccia. E che la (4.46) `e equivalente a: tr (A1 A2 · · · An ) = tr (A2 A3 · · · An A1 ) ;
(4.48)
infatti, continuando a permutare un passo alla volta, si ottengono tutte le permutazioni cicliche. Proviamo la (4.48). Consideriamo dapprima il caso in cui due operatori, Ai e Aj con i < j, siano di Hilbert-Schmidt. Se i = 1, la tesi segue subito da (b) con la coppia di operatori di Hilbert-Schmidt A = A1 e B = A2 · · · An . Se i > 1, allora i quattro operatori (i) A1 · · · Ai , (ii) Ai+1 · · · An , (iii) Ai+1 · · · An A1 , (iv) A2 · · · Ai sono necessariamente di HilbertSchmidt perch´e contengono ciascuno Ai oppure Aj (mai entrambi), quindi vale: tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) , che `e quanto volevamo provare. Dimostriamo ora la propriet` a di ciclicit` a nell’ipotesi che Ai sia di classe traccia. Se i = 1 la tesi segue immediatamente da (b) con A = A1 e B = A2 · · · An . Supponiamo allora che i > 1. Allora A1 · · · Ai e A2 · · · Ai sono di classe traccia perch´e ciascuno dei due contiene Ai , quindi, ricordando (b) della presente proposizione, si ha: tr(A1 · · · An ) = tr(A1 · · · Ai Ai+1 · · · An ) = tr(Ai+1 · · · An A1 A2 · · · Ai ) = tr(A2 · · · Ai Ai+1 · · · An A1 ) . La propriet` a di ciclicit` a della traccia consente di provare (ii) in (b) del teorema 4.30. In base a (4.42) si tratta di provare che tr|A| = tr|A∗ |. Dal corollario
4.4 Operatori di classe traccia (o nucleari)
187
del teorema di decomposizione polare (teorema 3.61) sappiamo che |A∗ | = U |A|U ∗, dove U |A| = A `e la decomposizione polare di A. Vale allora ||A∗||1 = tr|A∗ | = tr(U |A|U ∗) = tr(U ∗ U |A|) = tr|A| = ||A||1 , dove abbiamo usato il fatto che U ∗ U |A| = |A|, dato che U `e isometria su Ran(|A|) (teorema 3.61). Osservazioni 4.35. (1) Un’utile propriet` a degli operatori di classe traccia `e il seguente risultato che potremo provare, nel capitolo 9, dopo avere provato il teorema spettrale per operatori autoaggiunti: Proposizione 4.36. Se H `e uno spazio di Hilbert, T ∈ B(H) `e di classe traccia se e solo se u∈N |(u|T u)| < +∞ per ogni base hilbertiana N ⊂ H. Dimostrazione. Vedi la soluzione dell’esercizio 9.3.
(2) Evidentemente, se A ∈ B1 (H) e A = A∗ , calcolando la traccia di A usando una base hilbertiana di autovettori di A stesso (che esiste per il teorema 4.18), concludiamo che tr(A) = λ∈σp (A) mλ λ, dove σp (A) denota, al solito, l’insieme degli autovalori di A e mλ la dimensione dell’autospazio con autovalore λ. Quindi, come nel caso finitodimensionale, la traccia coincide con la somma degli autovalori, per operatori di classe traccia autoaggiunti. Tale risultato continua a valere anche se A non `e autoaggiunto. Teorema 4.37. (Di Lidiskii.) Se T ∈ B1 (H) con H spazio di Hilbert com plesso, allora tr(T ) = λ∈σ(T ) mλ λ, dove σp (T ) denota l’insieme degli autovalori di T , mλ indica la dimensione dell’autospazio con autovalore λ e la serie converge assolutamente. Si osservi che tale risultato non `e per nulla ovvio. Per la dimostrazione si pu`o consultare [BiSo87]. Esempio 4.38. * Il seguente esempio richiede nozioni di geometria Riemanniana. Un esempio importante di operatori di classe traccia in fisica si ottiene studiando [Mor99] l’operatore di Laplace su variet` a Riemanniane (M, g). Tale operatore, in coordinate locali x1 , . . . , xn sulla variet` a M , di dimensione n, `e individuato dall’operatore differenziale: Δ=
n 1 ∂ ij √ ∂ g (x) g , √ g ∂xi ∂xj i=1
in cui g indica il determinante della matrice di coefficienti gij , i.j = 1, . . . , n, che descrive il tensore metrico nelle coordinate dette e gij sono i coefficienti della matrice inversa di quella dei coefficienti gij . Se V : M → (K, +∞), per qualche K > 0, `e una qualsiasi funzione infinitamente differenziabile,
188
4 Classi di operatori compatti
consideriamo l’operatore A = −Δ + V , definito sullo spazio D(M ) delle funzioni complesse infinitamente differenziabili definite su M . Possiamo pensare D(M ) come sottospazio (denso) di L2 (M, μg ), essendo μg la misura di Borel naturalmente associata alla metrica che, in coordinate locali, si riduce a √ gdx1 · · · dxn . L’operatore A `e positivo, non `e limitato, e risulta che ammette un unico inverso (anch’esso positivo): A−1 : L2 (M, μg ) → D(M ). Pensando A−1 come operatore a valori in L2 (M, μg ), risulta che A−1 ∈ B(L2 (M, μg )). La cosa interessante `e che vale anche A−1 ∈ B∞ (L2 (M, μg )). Possiamo dire di pi` u. Esiste un teorema dovuto a Weyl che prova che gli autovalori λj ∈ σp (A) di A (dove j etichetta l’autovettore φj e non l’autovalore corrispondente λj , in modo che φi = φk se k = i ma 0 < K ≤ λ0 ≤ λ1 , ≤ λ2 , ≤ · · ·) soddisfano la stima: kn n/2 lim j −1 λj = , (4.49) j→+∞ vol(M ) in cui vol(M ) `e il volume della variet`a (che `e finito essendo compatta) e kn una costante universale, che dipende solo dalla dimensione della variet` a. Inoltre gli autovettori {φj }j∈N formano una base hilbertiana di L2 (M, μg ). Ne consegue che per l’insieme degli autovalori di A−k , σp (A−k ), vale σp (A−k ) = {λ−k j }j∈N . −k −k Calcolando le norme || ||1 e || ||2 di A = |A| , usando la base hilbertiana di autovettori {φj }j∈N di A, si ha: ||A−k ||1 =
+∞ j=0
λ−k j
e
||A−k ||22 =
+∞
λ−2k . j
j=0
Usando la stima (4.49) segue che A−k ∈ B1 (L2 (M, μg )) se k > n/2 e anche che A−k ∈ B2 (L2 (M, μg )) se k > n/4.
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali Le equazioni integrali sono un ramo importantissimo dell’analisi funzionale, specialmente per le applicazioni in fisica (per esempio nella teoria dello scattering quantistico [Pru81] e nello studio dei problemi inversi) ed altre scienze. Ci occuperemo nel seguito di discutere alcuni risultati generali per lo pi` u dovuti a Fredholm ed assumendo quasi sempre il punto di vista astratto, in cui gli operatori integrali sono visti come casi particolari di operatori compatti su spazi di Hilbert (anche se molti risultati si possono facilmente estendere al caso pi` u generale di operatori compatti su spazi di Banach). Consideriamo, per fissare le idee, uno spazio con misura (X, Σ, μ), dove μ : Σ → [0, +∞] `e una misura positiva (σ-additiva) che sia σ-finita e separabile, e consideriamo una funzione K ∈ L2 (X × X, μ ⊗ μ) sulla quale non facciamo altre ipotesi. Quindi TK ∈ B2 (H) `e il solito operatore integrale (vedi (3), (4) in
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
esempi 4.16 e (1),(2) in esempi 4.25) su H = L2 (X, μ) definito da: K(x, y)ψ(y)dμ(y) . (TK ψ)(x) :=
189
(4.50)
X
Vogliamo studiare, in termini molto generali l’equazione integrale: TK ϕ − λϕ = f ,
(4.51)
dove f ∈ H `e assegnata e ϕ ∈ H `e l’incognita e λ ∈ C `e costante. Per cominciare, consideriamo la situazione in cui λ = 0. Si ottiene in questo modo la cosiddetta equazione di Fredholm di prima specie nello spazio di Hilbert H. Dal punto di vista astratto si tratta di risolvere l’equazione, nell’incognita ϕ ∈ H: Aϕ = f , per un operatore compatto A : H → H (nel caso concreto A `e l’operatore TK , che `e anche di Hilbert-Schmidt) e per un assegnato elemento f ∈ H. Come importante risultato generale, valido anche sostituendo lo spazio di Hilbert H con un qualsiasi spazio di Banach B infinito dimensionale, ed assumendo A compatto, possiamo dire che l’equazione detta non ha soluzione per qualche scelta del termine noto f ∈ H, comunque fissiamo A ∈ B∞ (H). Ci`o segue immediatamente dalla seguente proposizione. Proposizione 4.39. Se A ∈ B∞ (B) con B spazio di Banach di dimensione infinita, allora Ran(A) = B. Dimostrazione. Possiamo sempre scrivere B = ∪n∈N Bn , dove Bn `e la palla aperta di raggio n centrata nell’origine, e dunque: Ran(A) = ∪n∈NA(Bn ) . Se fosse Ran(A) = B, potremmo scrivere che: B = ∪n∈N A(Bn ) ⊂ ∪n∈NA(Bn ) ⊂ B e quindi: B = ∪n∈N A(Bn ) , dove ogni A(Bn ) `e compatto perch`e A `e compatto e Bn limitata. Quindi B sarebbe un’unione numerabile di compatti e ci` o `e impossibile per il corollario 4.6. Un altro problema con le equazioni di Fredholm di prima specie segue dalla seguente proposizione di facile dimostrazione. Proposizione 4.40. Ogni operatore inverso sinistro di ogni operatore compatto iniettivo A ∈ B∞ (X), dove X `e uno spazio normato, non pu` o mai essere limitato se X `e infinito dimensionale.
190
4 Classi di operatori compatti
` data nella soluzione dell’esercizio 4.1. Dimostrazione. E
In base a tale risultato, se due equazioni Aϕ = f1 e Aϕ = f2 ammettono entrambe soluzione, tali soluzioni possono differire di molto, anche se f1 e f2 sono vicine in norma. In altre parole le equazioni di Fredholm di prima specie sono problemi malposti nel senso di Goursat. Questo non significa, ovviamente, che le equazioni di Fredholm di prima specie non siano matematicamente interessanti o che non siano utili nelle scienze applicate. Significa invece che il loro studio `e difficile e richiede argomenti avanzati e specialistici che sono lontani dalla presentazione elementare che stiamo facendo. Passiamo a considerare il caso λ = 0 in (4.51). L’equazione che si ottiene in tal modo si dice equazione di Fredholm di seconda specie. Per il momento assumeremo che l’operatore TK ammetta un nucleo hermitiano. In altre parole consideriamo l’equazione: TK ϕ − λϕ = f ,
(4.52)
dove Tk ha la forma (4.50) con λ = 0 assegnato in C e K(x, y) = K(y, x), in ∗ modo tale che, in base alla (4.3), TK = TK . In questo caso si pu` o enunciare un teorema generale. Teorema 4.41. (Sull’equazione di Fredholm di seconda specie a nucleo hermitiano.) Sullo spazio di Hilbert H = L2 (X, μ), dove la misura positiva σ-additiva μ `e σ-finita e separabile, si consideri l’equazione (4.52) nell’incognita ϕ ∈ H e dove f ∈ H `e assegnato, λ ∈ C \ {0} `e assegnato e TK ha la forma: (TK ψ)(x) =
K(x, y)dμ(y) , X
con K ∈ L2 (X × X, μ ⊗ μ) con K(x, y) = K(y, x). Valgono i seguenti fatti. (a) Se il numero λ non `e un autovalore di TK , allora l’equazione (4.52) ha sempre una ed una sola soluzione comunque si scelga f ∈ H. (b) Se λ `e autovalore di TK , allora l’equazione (4.52) ha sempre soluzioni se e solo f `e ortogonale all’autospazio con autovalore λ. In tal caso l’equazione (4.52) ammette infinite soluzioni. Dimostrazione. Moltiplicando ambo membro dell’equazione (4.52) per λ−1 ci possiamo ridurre a studiare il caso con λ = 1 (dopo aver ridefinito λ−1 K come K e λ−1 f come il nuovo f). Pertanto dimostriamo il teorema in questo caso. Sappiamo che TK `e compatto ed autoaggiunto per (3) negli esempi 4.16, faremo quindi riferimento ai teoremi 4.17 e 4.18. Sia {ψn }n∈N una base hilbertiana di autovettori di TK . Allora possiamo decomporre, in un unico modo, ogni elemento ϕ ∈ H come: ϕ=
+∞ n=1
an ψn + ϕ ,
(4.53)
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
191
dove ϕ ∈ Ker(TK ) e gli an ∈ C sono univocamente individuati da ϕ. In particolare: +∞ f= bn ψn + f . n=1
Cerchiamo la soluzione dell’equazione (4.52): ϕ = TK ϕ − f nella forma (4.53). Quindi dobbiamo determinare i numeri an e l’elemento ϕ noti TK e f. Sostituendo la (4.53) e l’analoga per f nell’equazione (4.52), si trova immediatamente che deve essere: an ψn + ϕ = an λn ψn − bn ψn − f , n
n
n
dove i λn sono gli autovalori non nulli di TK corrispondenti agli autovettori ψn (in generale pu` o accadere che λn = λn dato che abbiamo numerato gli autovettori e non gli autovalori). In altre parole: an (1 − λn + bn )ψn = −f − ϕn . n
Si osservi che i due membri sono ortogonali per costruzione e lo sono anche, a due a due, i vettori ψn . Pertanto l’identit` a scritta sopra `e possibile se e solo se: ϕ = −f , an (1 − λn ) = −bn con n = 1, 2, . . .. In tutti i casi ϕ `e sempre determinato, coincidendo con f . L’esistenza di soluzioni per l’equazione (4.52) equivale quindi alla validit` a delle condizioni: ϕ = −f , an = λnbn−1 per i λn = 1 b0 = 0 per i λm = 1. Se λn = 1 per ogni n, i coefficienti an sono univocamente individuati dai bn . Se λm = 1 per qualche m e bm = 0, l’ultima condizione non `e soddisfatta e quindi l’equazione (4.52) non ammette soluzioni. Se invece bm = 0, per ogni m per cui λm = 1 (cio`e f `e normale all’autospazio di TK con autovalore 1), i coefficienti am possono essere scelti arbitrariamente, mentre sono determinati i rimanenti coefficienti an . In tal caso ci sono infinite soluzioni dell’equazione (4.52). Per concludere, passiamo al caso generale, lasciando cadere l’ipotesi di nucleo hermitiano. Per rimanere su un piano ancora pi´ u generale, studieremo l’equazione di Fredholm di seconda specie astratta nello spazio di Hilbert H: Aϕ − λϕ = f ,
(4.54)
dove f ∈ H, λ ∈ C \ {0} e A ∈ B∞ (H) sono assegnati per un generico spazio di Hilbert H e ϕ ∈ H `e l’incognita del problema. Dunque non facciamo altre
192
4 Classi di operatori compatti
ipotesi su A, se non che sia un operatore compatto. In particolare lasciamo cadere l’ipotesi su A che sia di Hilbert-Schmidt. Proviamo il seguente teorema generale, dovuto a Fredholm, che ammette una formulazione valida nel caso in cui A ∈ B∞ (B), dove B `e un arbitrario spazio di Banach. Teorema 4.42. (Di Fredholm.) In riferimento allo spazio di Hilbert H, si consideri l’equazione di Fredholm di seconda specie astratta: Aϕ − λϕ = f ,
(4.55)
nell’incognita ϕ ∈ H con f ∈ H, λ ∈ C \ {0} e A ∈ B∞ (H) assegnati. Si considerino anche l’equazione omogenea, l’equazione coniugata e l’equazione omogenea coniugata, nell’ordine: Aϕ0 −λϕ0 = 0 , ∗
A ψ −λψ = g , A∗ ψ0 −λψ0 = 0 ,
(4.56) (4.57) (4.58)
con g ∈ H assegnata e ϕ0 , ψ, ψ0 ∈ H incognite. Valgono i risultati seguenti. (a) L’equazione Aϕ − λϕ = f ha soluzioni se e solo se f `e ortogonale a ciascuna soluzione ψ0 dell’equazione omogenea coniugata A∗ ψ0 − λψ0 = 0. (b) L’equazione Aϕ−λϕ = f ha, per ogni f ∈ H, una ed una sola soluzione oppure l’equazione omogenea Aϕ0 − λϕ0 = 0 ha una soluzione non nulla. (c) Le equazioni omogenee Aϕ0 − λϕ0 = 0 e A∗ ψ0 − λψ0 = 0 hanno il medesimo numero, che `e sempre finito, di soluzioni linearmente indipendenti. Osservazioni 4.43. (1) La celebre alternativa di Fredholm corrisponde all’enunciato (b) nel teorema di sopra. (2) Il teorema vale in particolare quando A `e autoaggiunto ed in tal caso si ritrova il teorema 4.41 come sottocaso. Prova del Teorema 4.42. Anche in questo caso, dividendo l’equazione iniziale per λ = 0, ci si riduce a studiare il caso λ = 1 (dopo aver ridefinito λ−1 A −1 come il nuovo A e λ−1 f come il nuovo f e e λ g come il nuovo g). Nel seguito dunque assumeremo λ = 1. Definiamo T := A−I. Si osservi che tale operatore `e limitato, ma non `e compatto perch`e I non `e compatto. La dimostrazione del teorema si esegue provando tre lemmi. Cominciamo a notare che, bench´e Ker(T ) sia sempre un sottospazio chiuso di H se T `e continuo, come nel caso in esame, ci`o non `e detto valere per il sottospazio Ran(T ). Invece questo fatto `e vero. Il primo lemma prova infatti che, se T := A − I con A ∈ B∞ (H) allora anche Ran(T ) `e chiuso. Lemma 4.44. Nelle ipotesi fatte su T , Ran(T ) `e chiuso.
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
193
Dimostrazione. Siano yn ∈ Ran(T ), per n ∈ N, e valga yn → y per n → +∞. Dobbiamo provare che y ∈ Ran(T ). Per ipotesi deve essere: yn = T xn = Axn − xn
(4.59)
per qualche successione di elementi {xn }n∈N ∈ H. Possiamo, senza perdere generalit` a, sempre supporre che xn ∈ Ker(T )⊥ , eventualmente togliendo da xn la sua proiezione su Ker(T ). Se riusciamo a provare che la successione degli xn `e limitata abbiamo concluso la dimostrazione del lemma. Infatti, essendo A compatto, in tal caso esister`a una sottosuccessione di elementi xnk con Axnk → y ∈ H se k → ∞. Sostituendo in (4.59) si conclude che xnk → x per qualche x ∈ H se k → +∞. Per la continuit` a di A, deve anche essere T x = Ax − x = y e quindi y ∈ Ran(T ). Dunque, per concludere la dimostrazione, proviamo per assurdo che la successione iniziale {xn }n∈N ⊂ Ker(T )⊥ `e limitata. Se non fosse limitata, esisterebbe una sottosuccessione di elementi xnm con 0 < ||xnm || → +∞ per m → +∞. Dato che la successione degli yn deve essere limitata essendo convergente, dividendo per ||xnm || in (4.59), si otterrebbe: xn m xn m ynm xn m =A − = →0. (4.60) T ||xnm || ||xnm || ||xnm || ||xnm || x
Dato che A `e compatto e la successione degli ||xnnm || `e limitata, potremm mo estrarre una seconda sottosuccessione di elementi xnmk /||xnmk || per cui, contemporaneamente: xnmk xnmk → x ∈ H e T → T x se k → +∞. ||xnmk || ||xnmk || Dalla (4.60) si conclude che T x = 0 e dunque x ∈ Ker(T ). Dato che, per xnm ipotesi, ||xn k || ∈ Ker(T )⊥ ed essendo Ker(T )⊥ chiuso, deve anche valemk
re x ∈ Ker(T )⊥ . Ne consegue che x ∈ Ker(T ) ∩ Ker(T )⊥ = {0}, che `e impossibile visto che: ||x|| = lim
k→+∞
||xnmk || ||xnmk ||
=1.
L’assurdo trovato conclude la dimostrazione.
Il secondo lemma `e il seguente. Lemma 4.45. Nelle ipotesi fatte su T valgono le decomposizioni ortogonali: H = Ker(T ) ⊕ Ran(T ∗ ) = Ker(T ∗ ) ⊕ Ran(T ) .
(4.61)
Dimostrazione. Dato che T, T ∗ ∈ B(H), da (e) e (d) di teorema 3.14 e (d) di proposizione 3.38, abbiamo immediatamente che deve essere: Ker(T ) = (Ran(T ∗ )⊥ )⊥ = Ran(T ∗ ) e Ker(T ∗ ) = (Ran(T )⊥ )⊥ = Ran(T ) ed anche: H = Ker(T ) ⊕ Ran(T ∗ ) = Ker(T ∗ ) ⊕ Ran(T ) .
194
4 Classi di operatori compatti
Il risultato del lemma precedente conclude la dimostrazione, tenendo conto che il lemma vale anche rimpiazzando T con T ∗ , dato che (A − I)∗ = A∗ − I dove A∗ `e compatto se A `e tale. Dal lemma 4.45 segue immediatamente che l’enunciato (a) del teorema 4.42 `e vero (per λ = 1 che `e il caso che volevamo provare). Infatti, da esso segue che: f ⊥ Ker(T ∗ ) se e solo se f ∈ Ran(T ), cio`e esiste ϕ ∈ H tale che T ϕ = f. Per andare avanti con la dimostrazione di (b) del teorema principale, definiamo i sottospazi (che sono chiusi per il lemma 4.44) Hk := Ran(T k ) per k = 1, 2, . . . in modo tale che: H ⊃ H1 ⊃ H2 ⊃ H3 ⊃ · · · . Si osservi che per costruzione T (Hk ) = Hk+1 . Con queste definizioni abbiamo un terzo lemma. Lemma 4.46. Con le definizioni date per i sottospazi Hk , k = 1, 2, . . ., esiste j ∈ N tale che: Hk+1 = Hk se k ≥ j. Dimostrazione. Assumiamo per assurdo che j suddetto non esista. In tal caso Hk = Hh se k = h. In questo caso si pu` o costruire una successione di vettori ortonormali xk che soddisfano xk ∈ Hk e xk ⊥ H k+1 se k = 1, 2, . . .. Se l > k abbiamo allora che: Axl − Axk = −xk + (xl + T xl − T xk ) ` allora e quindi ||Axl − Axk ||2 ≥ 1 dato che xl + T xl − T xk ∈ Hk+1 . E impossibile estrarre una sottosuccessione convergente dalla successione Axk , contraddicendo l’ipotesi che A sia compatto e provando il lemma. Possiamo ora provare due lemmi che, insieme, costituiscono la dimostrazione dell’enunciato (b) del teorema 4.42 (sempre nel caso λ = 1). Lemma 4.47. Nelle ipotesi fatte su T , se Ker(T ) = {0}, allora Ran(T ) = H. Dimostrazione. Assumiamo che Ker(T ) = {0}, in modo tale che T sia iniettivo, ma supponiamo anche, per assurdo, che Ran(T ) = H. In tal caso gli spazi Hk per k = 1, 2, 3, . . . risulterebbero essere tutti distinti, cosa impossibile per il lemma 4.46. Lemma 4.48. Nelle ipotesi fatte su T , se Ran(T ) = H , allora Ker(T ) = {0}. Dimostrazione. Se Ran(T ) = H, a causa del lemma 4.45, deve essere che Ker(T ∗ ) = {0}. Ma allora per il lemma precedente (usando T ∗ al posto di T ) Ran(T ∗) = H. Usando ancora il lemma 4.45, si ha che Ker(T ) = {0}. ` chiaro che i lemmi 4.47 e 4.48 costituiscono insieme l’enunciato (b) del E teorema 4.42 che risulta essere pertanto provato. Concludiamo provando che anche (c) del teorema 4.42 `e vero (per λ = 1).
4.5 Introduzione alla teoria di Fredholm delle equazioni integrali
195
Supponiamo che dimKer(T ) = +∞ contrariamente a quanto asserito in (c). In tal caso esister`a un insieme ortonormale infinito {xn }n∈N ⊂ Ker(T ). Per costruzione Axn = xn e quindi ||Axk − Axh ||2 = 2. Ma questo `e impossibile perch´e implicherebbe che dall’insieme limitato {xn }n∈N non si possa estrarre una sottosuccessione per cui {Axnk }k∈N converga e questo deve essere vero in quanto A `e compatto. Concludiamo che dimKer(T ) = m < +∞. Similmente dimKer(T ∗ ) = n < +∞. Supponiamo, per assurdo, che diversamente da quanto asserito in (c), m = n. In particolare possiamo supporre che: m < n. Siano poi {ϕj }j=1,...,n e {ψj }j=1,...,m basi ortonormali per Ker(T ) e Ker(T ∗ ) rispettivamente. Definiamo S ∈ B(H) come: Sx := T x +
m
(ϕj |x)ψj .
j=1
Dato che S = A − I con A compatto (ottenuto dall’operatore compatto A aggiungendo un operatore compatto perch´e con rango di dimensione finita), tutti i risultati trovati sopra per T = A − I sono ancora validi per S. Mostriamo se Sx = 0 allora x = 0. Tale equazione si scrive esplicitamente: Tx +
m
(ϕj |x)ψj = 0 .
(4.62)
j=1
Dato che, in virt` u del lemma 4.45, tutti i vettori ψj sono ortogonali a tutti i vettori della forma T x, dalla (4.62) segue che T x = 0 e (ϕj |x) = 0 se 1 ≤ g ≤ m, dato che, da un lato il vettore x deve essere una combinazione lineare dei vettori ϕj , e dall’altro lato x deve essere ortogonale a tali vettori. Conseguentemente x = 0. Concludiamo che Sx = 0 implica che x = 0. Ma allora, in seguito all’enunciato (b), deve esistere y ∈ H tale che: Ty +
m
(ϕj |y)ψj = ψm+1 .
j=1
Prendendo il prodotto scalare dei due membri con ψm+1 otteniamo una contraddizione: 1 nel membro di sinistra e 0 in quello di destra, dato che T y ∈ Ran(T ) e Ran(T ) ⊥ Ker(T ∗ ). La contraddizione trovata mostra che non pu` o essere m < n, ma m ≥ n. Scambiando il ruolo di T e T ∗ , si ottiene che deve anche essere n ≥ m. Concludiamo che m = n. La prova dell’enunciato (c) `e terminata. Esempi 4.49. Un caso interessante di equazione di Fredholm di seconda specie `e dato dall’equazione di Volterra di seconda specie: x ϕ(x) = K(x, t)ϕ(t)dt + f(x) , (4.63) a 2
dove ϕ ∈ L ([a, b], dx) `e la funzione incognita, f ∈ L2 ([a, b], dx) `e assegnata ed il nucleo integrale soddisfa |K(x, t)| < M < +∞ per ogni x, t ∈ [a, b] con
196
4 Classi di operatori compatti
t ≤ x. (Un eventuale fattore moltiplicativo ρ ∈ C\{0} `e stato inglobato in K.) In questo caso si ricade nella teoria del teorema di Fredholm riscrivendo l’integrale come un integrale su tutto [a, b] e assumendo che K(x, t) = 0 se t ≥ x. Per questo tipo di equazione sussiste per`o un risultato pi` u preciso, basato sulla teoria delle mappe di contrazione (vedi la sezione 2.7). Risulta infatti che una potenza abbastanza elevata di TK : L2 ([a, b], dx) → L2 ([a, b], dx) `e una mappa di contrazione, dove TK `e l’operatore integrale in (4.63): x (TK ϕ)(x) = K(x, t)ϕ(t)dt . a
Di conseguenza l’equazione omogenea TK ϕ = 0 ha una ed una sola soluzione – che deve coincidere con ϕ = 0 – a causa del teorema 2.117. La dimostrazione n del fatto che TK sia una mappa di contrazione se n `e abbastanza alto si esegue similmente a quanto visto in (1) negli esempi 2.118, ma usando lo spazio di Banach (L2 ([a, b], dx), || ||2) al posto dello spazio di Banach (C([a, b]), || ||∞) (vedi esercizio 4.18). Tenuto conto di ci`o, da (a) e (b) del teorema di Fredholm, segue subito che l’equazione 4.63 ha esattamente una soluzione per ogni scelta del termine noto f ∈ L2 ([a, b], dx).
Esercizi 4.1. Dimostrare che se X `e uno spazio normato e T : X → X `e compatto ed iniettivo, allora ogni operatore lineare S : Ran(T ) → X, che sia inverso sinistro di T , non pu` o essere limitato quando X non ha dimensione finita. Soluzione. Se S fosse limitato, usando la proposizione 2.57, potremmo estenderlo ad un operatore limitato S˜ : Y → X, dove Y := Ran(T ), ottenendo ˜ = I. Esattamente come nella dimostrazione di (b) nella proposizione 4.9, ST ˜ `e compatto se T ∈ B(X, Y) `e compatto e S˜ ∈ B(Y, X). Ne si prova che ST conseguirebbe che l’operatore I : X → X `e compatto, cosa impossibile perch´e ci`o implicherebbe che la palla unitaria in X abbia chiusura compatta, e questo sappiamo essere falso, se la dimensione di X non `e finita, dalla proposizione 4.5. 4.2. Provare, facendo uso del Lemma di Banach 4.12 che, in uno spazio normato infinito dimensionale, la chiusura della palla unitaria non `e compatta. Traccia della soluzione. Siano x1 , x2 , . . . una successione infinita di vettori linearmente indipendenti con ||xn|| = 1 (e quindi tutti nella chiusura della palla unitaria), con il lemma di Banach si costruisce una successione di vettori y1 , y2 , . . . con ||yn || = 1 e con ||yn−1 − yn || > 1/2. Tale successione non pu`o contenere alcuna sottosuccessione convergente. 4.3. Provare che se A∗ = A ∈ B∞ (H), con H spazio di Hilbert, allora σp (|A|) = {|λ| |λ ∈ σp (A)} .
Esercizi
197
Concludere che se A∗ = A ∈ B∞ (H), allora sing(A) = {|λ| |λ ∈ σp (A) \ {0}} . Soluzione. Sviluppando gli operatori compatti autoaggiunti A ed |A| secondo il teorema 4.18 si ha, con ovvie notazioni, A= λPλ e |A| = μPμ . λ∈σp (A)
μ∈σp (|A|)
Calcolando il quadrato degli operatori A e |A|, usando la continuit` a di tali operatori (che permette lavorare come se le tutte le serie fossero somme finite), l’idempotenza e l’ortogonalit`a dei proiettori relativi ad autovettori distinti ed infine tenendo conto che |A|2 = A∗ A = A2 , si ha che deve valere λ2 Pλ = μ2 Pμ . (4.64) λ∈σp (A)
μ∈σp (|A|)
Si tenga ora conto che Pλ Pλ0 = 0 se λ = λ0 e Pλ Pλ0 = Pλ0 altrimenti e che l’analoga propriet` a vale per i proiettori della decomposizione di |A|. Applicando Pλ0 a destra di ambo membri di (4.64), prendendo l’aggiunto del risultato e applicando Pμ 0 a destra dei membri dell’identit`a finale, si ricava infine che, per ogni λ0 ∈ σ(A) e μ0 ∈ σp (|A|): deve valere λ20 Pλ0 Pμ 0 = μ20 Pλ0 Pμ 0 ossia (λ20 − μ20 )Pλ0 Pμ 0 = 0 .
(4.65)
Il fatto che A ammetta una base Hilbertiana di autovettori (teorema 4.18) si pu` o scrivere come ben noto: I = sPλ0 . λ0∈σ(A)
a Fissiamo μ0 ∈ σp (|A|). Se fosse Pλ0 Pμ 0 = 0 per ogni λ0 ∈ σ(A) dall’identit` di sopra avremmo Pμ 0 = 0 che `e impossibile per definizione di autospazio. Di conseguenza, dovendo valere (4.65), ci deve essere λ0 ∈ σ(A) tale che λ2 = μ20 , ovvero μ0 = |λ0 |. Se λ0 ∈ σp (A), usando un’analoga procedura scambiando il ruolo di A e |A|, si prova che deve esistere μ0 ∈ σp (|A|) tale che λ2 = μ20 , ovvero μ0 = |λ0 |. La prima affermazione `e provata. La seconda affermazione `e ora evidente dalla definizione di valore singolare. 4.4. Si dimostri che se T ∈ B∞ (H) e se H xn → x ∈ H in senso debole, cio `e: (g|xn ) → (g|x) se n → +∞, per ogni fissato g ∈ H, allora ||T (xn)−T (x)|| → 0 per n → +∞. In altre parole gli operatori compatti trasformano successioni convergenti debolmente in successioni convergenti in norma. Si estenda il risultato al caso di T ∈ B(X, Y) con X e Y spazi normati.
198
4 Classi di operatori compatti
Soluzione. Sia xn → x in senso debole. Se si tiene conto del teorema di Riesz, si ha subito che l’insieme {xn }n∈N `e debolmente limitato nel senso del corollario 2.74 del teorema di Banach-Steinhaus. In base a tale risultato, vale ||xn|| ≤ K per ogni n ∈ N, per qualche K > 0. Definiamo allora yn := T xn , y := T x e notiamo che, per ogni h ∈ H, (h|yn ) − (h|y) = (T ∗ h|xn ) − (T ∗ h|x) → 0 se n → +∞, e quindi anche la successione degli yn converge debolmente a y. Supponiamo, per assurdo, che ||yn − y|| → 0 se n → +∞. Allora devono esistere un > 0 e una sottosuccessione {ynk }k∈N con ||y − ynk || ≥ per ogni k ∈ N. Dato che {xnk }k∈N `e limitata da K come osservato sopra, e T compatto, deve esistere una sottosuccessione {ynkr }r∈N che converge a qualche y = y. Questa sottosuccessione {ynkr }r∈N deve quindi convergere anche debolmente a y . Ma questo `e impossibile dato che {yn }n∈N converge debolmente a y = y . Allora deve essere: yn → y nel senso della norma di H. Il ragionamento si pu` o ripetere nel caso generale in cui T ∈ B(X, Y) con X e Y spazi normati, interpretando X xn → x ∈ X in senso debole come: g(xn ) → g(x) se n → +∞, per ogni fissatog ∈ X , dato che il corollario 2.74 del teorema di Banach-Steinhaus vale in questo caso. Nella dimostrazione si deve osservare che se h ∈ Y allora h ◦ T ∈ X perch´e composizione di funzioni lineari continue. 4.5. In riferimento agli esempi 4.25, provare che dati TK , TK ∈ B2 (L2 (X, μ)) (dove la misura `e assunta essere separabile) che sono dunque individuati dai nuclei integrali K e K , allora l’operatore di Hilbert-Schmidt aTK + bTK , con a, b ∈ C ha nucleo integrale aK + bK . 4.6. Provare che dato TK ∈ B2 (L2 (X, μ)) individuato dal nucleo integra∗ le K allora l’operatore di Hilbert-Schmidt TK ha nucleo integrale K ∗ con ∗ K (x, y) = K(y, x). 4.7. Nelle stesse ipotesi dell’esercizio 4.5 mostrare che il nucleo integrale di TK TK `e K(x, y)K (y, z) dμ(y) . K (x, z) := X 2
4.8. Se L (X, μ) `e separabile, si consideri l’applicazione L2 (X × X, μ ⊗ μ) K → TK ∈ B2 (L2 (X, μ)). Si dimostri che si tratta di un isomorfismo di spazi di Hilbert. Si discuta se si pu` o o meno pensare tale applicazione come un’isometria tra spazi normati, assumendo B(L2 (X, μ)) come codominio. Pi` u debolmente si discuta la continuit` a dell’omomorfismo. 4.9. In riferimento a (4) in esempi 4.25, dimostrare che, se g ∈ C0 ([0, 1]), allora: x (I − ρT )−1 g (x) = g(x) + ρ eρ(x−y) g(y)dy . 0
Esercizi
199
Suggerimento. Applicare l’operatore I − ρT , tenendo conto dell’espres∂ ρ(x−y) sione integrale di T e osservando che ρeρ(x−y) = ∂x e . 4.10. Si consideri l’insieme BD (L2 (X, μ)) degli operatori degeneri su L2 (X, μ) (vedi (4) in esempi 4.25), con μ separabile. Provare che le seguenti affermazioni sono equivalenti. (a) T ∈ BD (L2 (X, μ)). (b) Ran(T ) ha dimensione finita. (c) T ∈ B2 (L2 (X, μ)) (e pertanto T `e un operatore integrale) con nucleo N integrale che pu`o sempre essere scritto come K(x, y) = k=1 pk (x)qk (y) dove le funzioni: p1 , . . . , pN ∈ L2 (X, μ) e q1 , . . . , qN ∈ L2 (X, μ) sono, separatamente, linearmente indipendenti. 4.11. Si consideri l’insieme BD (L2 (X, μ)) degli operatori degeneri (vedi (4) in esempi 4.25) su L2 (X, μ), con μ separabile. Mostrare BD (L2 (X, μ)) `e uno ∗-ideale bilatero di B(L2 (X, μ)) sottospazio di B2 (L2 (X, μ)). In altre parole si deve provare che BD (L2 (X, μ) ⊂ B2 (L2 (X, μ)), che `e un sottospazio chiuso rispetto alla coniugazione hermitiana e che AD, DA ∈ BD (L2 (X, μ) se A ∈ B(L2 (X, μ)) e D ∈ BD (L2 (X, μ)). 4.12. Si consideri BD (L2 (X, μ)) (vedi (4) in esempi 4.25) con L2 (X, μ), con μ separabile. La chiusura topologica di BD (L2 (X, μ)) in B2 (L2 (X, μ)) rispetto alla topologia naturale di B(L2 (X, μ)) coincide con B2 (L2 (X, μ))? Suggerimento. Si consideri l’operatore, dove la convergenza della serie `e quella rispetto alla norma operatoriale uniforme: T :=
+∞ n=0
1 √ TKn , n
e dove Kn (x, y) = φn (x)φn (y), essendo {φn }n∈N una base hilbertiana di L2 (X, μ). Provare che T ∈ B(L2 (X, μ)) `e ben definito, ma T ∈ B2 (L2 (X, μ)), dato che ||T φn||2 = 1/n. 4.13. Considerare un operatore integrale TK su L2 ([0, L]N , dx), con nucleo integrale K(x, y) dove K ∈ C 1 ([0, L]N ). Assumendo che TK ∈ B1 (L2 ([0, L]N , dx)), mostrare che tr(TK ) = K(x, x)dx . [0,L]N
Suggerimento. Usare come base di Hilbert per sviluppare la traccia la base hilbertiana degli esponenziali 1 LN/2
2π
ei L
N
k=1
n i xi
,
n 1 , n 2 , . . . , nN ∈ Z .
200
4 Classi di operatori compatti
Ricordare che, se f : [0, L]N → C `e di classe C 1 allora la serie di Fourier converge puntualmente (escluso al pi` u l’insieme di misura nulla rappresentato dal bordo di [0, L]N ): N N 1 2π 2π f(x) = ei L k=1 ni xi e−i L k=1 niyi f(y)dy . L [0,L]N n1,...,nN ∈Z
Usare infine il teorema di Fubini-Tonelli opportunamente. 4.14. Considerare un operatore integrale TK su L2 ([0, 2π], dx), con nucleo integrale: 1 1 in(x−y) K(x, y) = e . 2π n2 n∈Z\{0}
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia. 4.15. Si consideri TK nell’esercizio 4.14 e l’operatore differenziale: A := −
d2 , dx2
definito sulle funzione infinitamente differenziabili su [0, 2π] che soddisfano condizioni di periodicit` a (includendo tutte le derivate). Quanto vale: TK A? 2π 1 Suggerimento. Vale TK A = I − P0 dove P0 : f → ( 2π 0 f(x)dx)1, essendo 1 la funzione che vale costantemente 1 su [0, 2π], definisce il proiettore ortogonale sul sottospazio delle funzioni costanti in L2 ([0, 2π], dx). 4.16. Considerare un operatore integrale Ts su L2 ([0, 2π], dx), con nucleo integrale: 1 in(x−y) 1 Ks (x, y) = e . 2π n2s n∈Z\{0}
Dimostrare che si tratta di un operatore compatto, di Hilbert-Schmidt e di classe traccia se s > 1/2. Dimostrare che: tr(Ts ) = ζR (s) , dove il secondo membro `e la funzione zeta di Riemann. 4.17. Si provi che se B ∈ B(H), con H spazio di Hilbert, e se esiste una base hilbertiana N per la quale: u∈N ||Bu|| < +∞, allora B ∈ B1 (H). Suggerimento. Osservare che |||B|ψ|| ||ψ|| |||B|ψ||.
=
||Bψ|| e |(ψ||B|ψ)|
≤
Esercizi
201
4.18. Si consideri l’operatore integrale TK : L2 ([a, b], dx) → L2 ([a, b], dx) x (TK ϕ)(x) = K(x, t)ϕ(t)dt . a
dove K `e una funzione misurabile tale che esiste M ∈ R con |K(x, t)| ≤ M se x, t ∈ [a, b] con t ≤ x. Dimostrare che: M n (b − a)n n ||TK || ≤ (n + 1)! n `e una mappa di contrazione. e quindi esiste un intero positivo n per cui TK
Soluzione. Si osservi, nei calcoli che seguono, che ϕ ∈ L2 ([a, b], dx) implica ϕ ∈ L1 ([a, b], dx) per la disuguaglianza di Cauchy-Schwarz, dato che la funzione che vale costantemente 1 `e in L2 ([a, b], dx). Per costruzione, se θ(z) = 0 per z ≥ 0 e θ(z) = 0 altrimenti, possiamo scrivere,
b
n |(TK ϕ)(x)| =
b
b
dx2 · · ·
dx1 a
a
dxn θ(x − x1 )θ(x1 − x2 ) · · · θ(xn−1 − xn ) a
×K(x, x1 )K(x1 − x2 ) · · · K(xn−1 , xn)ϕ(xn ) . Conseguentemente: n ϕ)(x)| |(TK
≤M
n [a,b]n
dx1 · · · dxn |θ(x − x1 ) · · · θ(xn−1 − xn )| |ϕ(xn )| .
Applicando la disuguaglianza di Cauchy-Schwarz su L2 ([a, b]n, dx1 · · · dxn ), tenendo conto che θ(z)2 = θ(z) = |θ(z)|, si trova subito che: n |(TK ϕ)(x)| ≤
! M
n [a,b]n
dx1 · · · dxn θ(x − x1 ) · · · θ(xn−1 − xn ) [b − a](n−1)/2||ϕ||2 ,
cio`e: n |(TK ϕ)(x)| ≤ M n
(x − a)n/2 √ [b − a](n−1)/2||ϕ||2 . n!
Conseguentemente: M n (b − a)n n ||TK ϕ||2 ≤ ||ϕ||2 . (n + 1)! e quindi:
M n (b − a)n n || ≤ . ||TK (n + 1)!
202
4 Classi di operatori compatti
Dato che:
M n (b − a)n →0 n→+∞ (n + 1)! lim
se n → +∞,
per n grande a sufficienza, possiamo scrivere che, per qualche numero positivo λ < 1: n n ||TK ϕ − TK ϕ ||2 ≤ λ||ϕ − ϕ ||2 , n `e un operatore di contrazione. pertanto TK
5 Operatori non limitati con domini densi in spazi di Hilbert von Neumann aveva appena finito di tenere la sua lezione quando uno studente si alz` o in piedi dicendo, con un tono vagamente colpevole, che non era riuscito a capire l’argomento conclusivo. Von Neumann rispose: “Giovanotto, in matematica lei non deve capire le cose, le deve usare”. David Wells
In questo capitolo estenderemo la teoria degli operatori sviluppata nei precedenti capitoli per includere il caso di operatori non limitati e non definiti su tutto lo spazio. Nella prima sezione daremo, in particolare, la nozione di dominio naturale di un operatore costruito componendo in vario modo operatori con dominio non massimale. Introdurremo la nozione di operatore chiuso e di operatore chiudibile. Quindi, presenteremo la nozione generale di operatore aggiunto, per operatori non limitati e densamente definiti, estendendo la nozione gi` a fornita nel caso di operatori limitati definiti su tutto lo spazio di Hilbert. La sezione successiva si occuper`a di discutere le generalizzazioni, al caso di operatore non limitato, della nozione di operatore autoaggiunto. Introdurremo a tal fine le nozioni di operatore hermitiano, simmetrico, essenzialmente autoaggiunto ed autoaggiunto, discutendone le propriet` a generali pi` u importanti. In particolare presenteremo la nozione di core di un operatore e quella di indici di difetto. La terza sezione sar`a completamente dedicata a due esempi di operatori autoaggiunti della massima importanza in Meccanica Quantistica: gli operatori posizione ed impulso negli spazi di Hilbert L2 (Rn , dx). Studieremo le propriet` a matematiche di tali operatori, presentandone varie possibili definizioni equivalenti. L’ultima sezione sar`a dedicata a criteri pi` u avanzati per stabilire se un operatore simmetrico ammette estensioni autoaggiunte. In particolare presenteremo il criterio di von Neumann e quello di Nelson. Alcuni strumenti tecnici per affrontare questo tipo di analisi, discussi nello stessa sezione, sono la trasformata di Cayley e la nozione di vettore analitico introdotta da Nelson e rivelatasi di estrema importanza nelle applicazioni della teoria degli operatori alla MQ.
Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
204
5 Operatori non limitati con domini densi in spazi di Hilbert
5.1 Operatori non limitati con dominio non massimale Introduciamo la teoria degli operatori non limitati e con dominio non massimale. Il dominio degli operatori in questione sar` a in ogni caso un sottospazio vettoriale dello spazio ambiente e considereremo spesso il caso in cui tale sottospazio sia denso. Malgrado gli operatori che considereremo non saranno limitati, tutte le definizioni generali che daremo si ridurranno a quelle, gi` a viste nei capitoli precedenti, restringendosi a lavorare con operatori limitati. 5.1.1 Operatori non limitati con dominio non massimale in spazi normati Le prime nozioni che presentiamo sono generali e non necessitano ancora della struttura di spazio di Hilbert. Una nozione di grafico di un operatore, in realt` a, `e gi`a stata data nella definizione 2.103, per operatori con dominio massimale. La definizione che segue la estende leggermente. Definizione 5.1. Sia X spazio vettoriale. Un’applicazione lineare: T : D(T ) → X , con D(T ) ⊂ X sottospazio di X, `e detta operatore in X e D(T ) `e detto dominio di T . Il grafico, G(T ), dell’operatore T `e il sottospazio di X ⊕ X: G(T ) := {(x, T x) | x ∈ D(T )} . Se α ∈ C e A e B sono operatori in X con dominio D(A) e D(B) rispettivamente, si definiscono gli operatori in H: (a) AB, tale che ABf := A(Bf) sul suo dominio naturale: D(AB) := {f ∈ D(B) | Bf ∈ D(A)} ; (b) A + B tale che (A + B)f := Af + Bf sul suo dominio naturale: D(A + B) := D(A) ∩ D(B) ; (c) αA, tale che αAf := α(Af) sul suo dominio naturale: D(αA) = D(A) se α = 0, oppure D(0A) := H. ` evidente che la definizione di grafico data sopra si riduce a quella gi` E a vista nel caso di operatori T ∈ L(X), che non sono altro che operatori in X con D(T ) = X. La nozione di estensione di un operatore e quella di operatore chiuso giocano un ruolo importante nel seguito. Cominciamo con la prima nozione che `e ovvia. Definizione 5.2. Se A `e un operatore nello spazio vettoriale X, un operatore B in X si dice essere un’estensione di A, e si scrive A ⊂ B, se G(A) ⊂ G(B).
5.1 Operatori non limitati con dominio non massimale
205
5.1.2 Operatori chiusi e chiudibili Passiamo alla nozione di operatore chiuso, estendendo la definizione 2.103 al caso in cui il dominio dell’operatore non coincida con tutto lo spazio, ad aggiungendo alcune nuove nozioni. Ricordiamo che, se X `e spazio normato, la topologia prodotto, sul prodotto cartesiano X × X, `e quella i cui aperti, oltre a ∅, sono le unioni di prodotti di due aperte Bδ (x)×Bδ1 (x1 ), di centri x, x1 ∈ X e raggi δ, δ1 > 0 arbitrari (vedi la sezione 2.4.6). Definizione 5.3. Sia A operatore nello spazio normato X. (a) A `e detto chiuso se il suo grafico `e chiuso nella topologia prodotto di X × X. In altre parole A `e chiuso se, per una successione {xn }n∈N ⊂ D(A) si ha: (i) xn → x ∈ X per n → +∞ e (ii) T xn → y ∈ X per n → +∞, allora vale x ∈ D(A) e y = T x. (b) A `e detto chiudibile se la chiusura G(A) del suo grafico `e ancora il grafico di un operatore (che risulta essere necessariamente chiuso). Tale operatore si indica con A e si dice chiusura di A. La seguente proposizione caratterizza gli operatori chiudibili. Proposizione 5.4. Sia A operatore nello spazio normato X. I seguenti fatti sono equivalenti: (i) A `e chiudibile, (ii) G(A) non contiene elementi del tipo (0, z) con z = 0, (iii) A ammette estensioni chiuse. Dimostrazione. (i) ⇔ (ii). A non `e chiudibile se e solo se ci sono due successioni in D(A), {xn }n∈N e {xn }n∈N , tali che xn → x ← xn , ma Axn → y = y ← Axn . Per linearit` a questo `e equivalente a dire che c’`e una successione di elementi xn = xn − xn → 0 tale che T xn → y − y = z = 0. Ci` o equivale a dire che G(A) contiene (0, z) = (0, 0). (i) ⇔ (iii). Se A `e chiudibile, A `e un’estensione chiusa di A. Se, viceversa, esiste un’estensione chiusa B di A, non pu` o accadere che esistano in G(A) elementi del tipo (0, z) = (0, 0), altrimenti, essendo A ⊂ B e B chiuso, avremmo che G(B) = G(B) ⊃ G(A) (0, z) e quindi B non sarebbe operatore lineare essendo B(0) = 0. Un’utile propriet` a generale degli operatori chiudibili, che vale in spazi di Banach (e quindi anche in spazi di Hilbert) `e la seguente. Proposizione 5.5. Siano X e Y spazi di Banach e T ∈ B(X, Y). Se l’operatore T soddisfa Ran(T ) ⊂ D(A), con A : D(A) → Y operatore in Y chiudibile (in generale non limitato e con D(A) sottospazio proprio di Y), allora AT ∈ B(X, Y). Dimostrazione. Dato che la chiusura di A estende A, AT = AT `e ben definito. Per concludere la dimostrazione `e sufficiente dimostrare che AT : X → Y `e
206
5 Operatori non limitati con domini densi in spazi di Hilbert
chiuso e quindi applicare il teorema 2.104 del grafico chiuso. Per provare che AT `e chiuso, si assuma che, se n → +∞, X xn → x ∈ X e (AT )(xn ) → y ∈ Y. Allora vale anche: T xn → z ∈ Y, dato che T `e continuo. Dato che A `e chiuso e A(T xn ) → y, deve essere z ∈ D(A) e Az = y. Cio`e (AT )(x) = y. Allora AT `e chiuso per definizione. 5.1.3 Il caso degli spazi di Hilbert: struttura di H ⊕ H e operatore τ Consideriamo il caso in cui X = H sia uno spazio di Hilbert con prodotto ` conveniente definire una struttura di spazio di Hilbert sulla scalare ( | ). E somma diretta H ⊕ H ((3) in notazione 2.102), ottenendo la somma diretta hilbertiana di H con se stesso. Dal punto di vista topologico, H ⊕ H pu` o dotarsi della topologia prodotto di H × H, che `e quella usata per definire la nozione di chiusura di un operatore e di operatore chiuso. Mostriamo che esiste una struttura naturale di spazio di Hilbert su H⊕H che induce proprio la topologia prodotto tramite la norma associata al prodotto scalare. Definiamo il prodotto scalare su H ⊕ H come: ((x, x)|(y, y ))H⊕H := (x|y) + (x |y )
se (x, x), (y, y ) ∈ H ⊕ H.
(5.1)
Con questa definizione, i due sottospazi H della somma diretta H ⊕ H risultano anche essere ortogonali e quindi la somma `e ortogonale oltre che diretta. Mostriamo che H ⊕ H `e, con tale prodotto scalare, uno spazio di Hilbert. Dato che la norma || ||H⊕H indotta da questo prodotto scalare soddisfa: ||(z, z )||2H⊕H = ||z||2 + ||z ||2
per ogni (z, z ) ∈ H ⊕ H,
(5.2)
{(xn , xn )}n∈N
ogni successione ⊂ H⊕H, che sia di Cauchy rispetto alla norma || ||H⊕H, individua le due successioni di Cauchy in H: {xn }n∈N e {xn }n∈N. Tali ` quindi successioni di Cauchy convergono rispettivamente a x e x in H. E immediato provare che (xn , xn ) → (x, x) per n → +∞ nella norma || ||H⊕H, direttamente da (5.2). Pertanto (H⊕H, || ||H⊕H) `e completo. Infine, il prodotto scalare su H⊕H induce la topologia prodotto su H⊕H come preannunciato. A tal fine, ricordando l’analoga discussione svolta nella sezione 2.4.6, `e sufficiente (H⊕H) notare, se (x, y) ∈ H⊕H e se Bδ ((x, y)) `e la palla aperta in H⊕H centrata in (x, y) di raggio δ > 0 e B (z) l’analoga palla aperta in H centrata in z di raggio > 0, allora valgono le inclusioni: (H⊕H)
Bδ/2 (x) × Bδ/2 (y) ⊂ Bδ
((x, y)) ⊂ Bδ (x) × Bδ (y) .
Osservazione 5.6. In virt` u del risultato ottenuto, su uno spazio di Hilbert, la nozione di operatore chiuso e di chiusura (definizione 5.3) pu` o essere equivalentemente riferita alla topologia indotta dal prodotto scalare su H ⊕ H. Un utile strumento per dimostrare rapidamente alcuni risultati, `e l’operatore limitato: τ : H ⊕ H (x, y) → (−y, x) ∈ H ⊕ H . (5.3)
5.1 Operatori non limitati con dominio non massimale
Se
∗
207
`e riferito alla struttura di spazio di Hilbert di H ⊗ H, si ha subito: τ ∗ = τ −1 = −τ ,
(5.4)
pertanto, in particolare, τ `e unitario su H ⊗ H. Se ⊥ `e riferito a H ⊕ H, si verifica e per computo diretto che τ e ⊥ commutano: se F ⊂ H ⊕ H, si ha: τ (F ⊥ ) = (τ (F ))⊥ .
(5.5)
5.1.4 Propriet` a generali dell’operatore aggiunto hermitiano Passiamo ora a definire l’aggiunto di un operatore T nello spazio di Hilbert H con dominio D(T ) denso in H, quando T non sia, in generale, limitato. Ora non possiamo usare il teorema di Riesz e dobbiamo procedere in modo alternativo. Per prima cosa definiamo il dominio D(T ∗ ) dell’operatore aggiunto, sapendo gi` a dove vogliamo arrivare: vogliamo che (T ∗ x|y) = (x|T y) se x ∈ D(T ∗ ) e y ∈ D(T ). D(T ∗ ) := {x ∈ H | esiste zT ,x ∈ H con (x|T y) = (zT ,x |y) per ogni y ∈ D(T )} , (5.6) e poi assumeremo, per x ∈ D(T ∗ ), che T ∗ x := zT ,x. Mostriamo che la definizione (5.6) `e ben posta e determina (a) un sottospazio D(T ∗ ) ⊂ H e (b) un operatore T ∗ : D(T ∗ ) x → zT ,x . (a) D(T ∗ ) = ∅, perch´e 0 ∈ D(T ∗ ) definendo zT ,0 := 0. Inoltre, usando la (anti)linearit`a del prodotto scalare e di T , si verifica subito che, se x, x ∈ D(T ∗ ) e α, β ∈ C, allora αx + βx ∈ D(T ∗ ), dato che (αx + βx |T y) = (zT ,αx+βx |y) se si pone zT ,αx+βx := αzT ,x + βzT ,x . Quindi D(T ∗ ) `e un sottospazio. (b) La legge D(T ∗ ) x → zT ,x =: T ∗ x definisce una funzione, che risulta essere lineare per costruzione per quanto visto sopra, solo nel caso in cui ogni x ∈ D(T ∗ ) individua un unico zT ,x . Mostriamo che questo `e vero quando D(T ∗ ) `e denso, come da noi assunto. Se (zT ,x |y) = (x|T y) = (zT ,x |y) per ogni y ∈ D(T ), allora deve anche essere: 0 = (x|T y) − (x|T y) = (zT ,x − zT ,x|y). Dato che D(T ) = H, esiste {yn }n∈N ⊂ D(T ) con yn → zT ,x − zT ,x . Per la continuit` a del prodotto scalare, (zT ,x − zT ,x |y) = 0 implica che ||zT ,x − zT ,x ||2 = 0 e quindi zT ,x = zT ,x . Definizione 5.7. Se T `e un operatore nello spazio di Hilbert H con D(T ) = H, l’operatore aggiunto di T , T ∗ , `e l’operatore in H definito sul sottospazio: D(T ∗ ) := {x ∈ H | esiste zT ,x ∈ H con (x|T y) = (zT ,x |y) per ogni y ∈ D(T )} e tale che: T ∗ : x → zT ,x. Osservazioni 5.8. ` chiaro che, come volevamo all’inizio, per costruzione vale: (1) E (T ∗ x|y) = (x|T y) ,
per ogni coppia (x, y) ∈ D(T ∗ ) × D(T ).
208
5 Operatori non limitati con domini densi in spazi di Hilbert
(2) Se T ∈ B(H), applicando la definizione 5.7 per T ∗ si vede immediatamente che vale D(T ∗ ) = H a causa del teorema 3.17 di Riesz. Concludiamo che: per gli operatori di B(H) la definizione di aggiunto data in definizione 5.7 coincide con quella data in definizione 3.37. (3) Se T `e un operatore densamente definito sullo spazio di Hilbert H, non `e detto che D(T ∗ ) sia denso in H, per cui, in generale, non esiste (T ∗ )∗ . (4) Se A e B sono operatori densamente definiti nello spazio di Hilbert H: A⊂B
⇒
A∗ ⊃ B ∗ .
(5.7)
La prova `e immediata dalla definizione 5.7 di aggiunto.
Teorema 5.9. Sia A operatore in H, spazio di Hilbert, e D(A) = H. Vale quanto segue. (a) A∗ `e un operatore chiuso e vale: G(A∗ ) = τ (G(A))⊥ .
(5.8)
(b) A `e chiudibile se e solo se D(A∗ ) `e denso. In tal caso: A ⊂ A = (A∗ )∗ . (c) Ker(A∗ ) = [Ran(A)]⊥ e Ker(A) ⊂ [Ran(A∗ )]⊥, dove possiamo sostituire ⊂ con = se D(A∗ ) `e denso in H. (d) Se A `e chiuso allora vale la decomposizione ortogonale di H ⊗ H: H ⊕ H = τ (G(A)) ⊕ G(A∗ ) .
(5.9)
Dimostrazione. (a) Esplicitando l’insieme τ (G(A))⊥ troviamo subito che: τ (G(A))⊥ = {(x, y) ∈ H ⊕ H | − (x|Az) + (y|z) = 0 per ogni z ∈ D(A)} . In altre parole τ (G(A))⊥ `e il grafico di A∗ (purch´e tale operatore sia definito!) e vale (5.8). τ (G(A))⊥ `e chiuso per costruzione, essendo l’ortogonale di un insieme ((a) di teorema 3.14), quindi A∗ `e chiuso. (b) Consideriamo la chiusura del grafico di A. Vale D(A) = (D(A)⊥ )⊥ per il teorema 3.14. Tenendo conto che τ τ = −I, che S ⊥ = −S ⊥ per ogni insieme S, e che valgono (5.5) e (5.8), troviamo che: G(A) = −τ ( τ (G(A))⊥ )⊥ = −τ (G(A∗ ))⊥ = τ (G(A∗ ))⊥ .
(5.10)
Per la proposizione 5.4, G(A) `e il grafico di un operatore (la chiusura di A) se e solo se G(A) non contiene elementi del tipo (0, z) con z = 0. In altre parole G(A) non `e il grafico di un operatore se e solo se esiste z = 0 con (0, z) ∈ τ (G(A∗ ))⊥ . Questa condizione si esplicita in: esiste z = 0 tale che
0 = ((0, z)|(−A∗ x, x)) ,
per ogni x ∈ D(A∗ ) .
5.2 Classi di operatori hermitiani
209
In altre parole G(A) non `e il grafico di un operatore se e solo se D(A∗ )⊥ = {0}, che `e equivalente a dire che D(A∗ ) non `e denso in H. In definitiva: G(A) `e il grafico di un operatore se e solo se D(A∗ ) `e denso in H. Se D(A∗ ) `e denso in H, allora (A∗ )∗ `e definito e, usando (5.10) e (5.8): G(A) = τ (G(A∗ ))⊥ = G((A∗ )∗ ) . Infine, per la definizione di chiusura dell’operatore A, G(A) = G(A). Sostituendo sopra: G(A) = G((A∗ )∗ ) , e quindi A = (A∗ )∗ . (c) Le identit` a seguono immediatamente da: (A∗ x|y) = (x|Ay) ,
per ogni coppia (x, y) ∈ D(A∗ ) × D(A)
e dalla densit`a di D(A) (e da quella di D(A∗ )). (d) Dato che A `e chiuso, G(A) `e chiuso e quindi τ (G(A)) `e chiuso perch´e l’operatore τ : H ⊕ H → H ⊕ H `e unitario. Dalla (5.8) e da (b) e (d) del teorema 3.14 abbiamo immediatamente che (5.9) deve essere vera. Questo conclude la dimostrazione. Osservazione 5.10. Tenuto conto del fatto che, se D(A) `e denso e λ ∈ C, allora vale (A − λI)∗ = A∗ − λI, la prima relazione del punto (c) implica immediatamente che valga anche la seguente identit`a: Ker(A∗ − λI) = [Ran(A − λI)]⊥ , mentre la seconda relazione del punto (c) fornisce: Ker(A − λI) ⊂ [Ran(A∗ − λI)]⊥ . Nel resto del libro useremo diverse volte le relazioni trovate.
5.2 Operatori hermitiani, simmetrici, autoaggiunti ed essenzialmente autoaggiunti Siamo ora in grado di enunciare la definizione generale di operatore autoaggiunto insieme a quella di altre nozioni collegate. Definizione 5.11. Siano (H, ( | )) spazio di Hilbert e A : D(A) → H operatore in H. (a) A `e detto hermitiano se (Ax|y) = (x|Ay) per ogni coppia x, y ∈ D(A). (b) A `e detto simmetrico se: (i) A `e hermitiano e (ii) D(A) `e denso.
210
5 Operatori non limitati con domini densi in spazi di Hilbert
In altre parole, A `e simmetrico se: (i)’ D(A) = H e (ii)’ A ⊂ A∗ . (c) A `e detto autoaggiunto se: (i) D(A) `e denso e (ii) A = A∗ . (d) A `e detto essenzialmente autoaggiunto se: (i) D(A) `e denso, (ii) D(A∗ ) `e denso e (iii) A∗ = (A∗ )∗ (cio`e l’aggiunto di A `e autoaggiunto). Equivalentemente (per (b) del teorema 5.9), A `e essenzialmente autoaggiunto se: (i)’ D(A) `e denso, (ii)’ A `e chiudibile e (iii)’ vale A∗ = A. (e) A `e detto normale se A∗ A = AA∗ , dove i due membri sono definiti sui loro domini naturali. Osservazioni 5.12. (1) A commento di (c) nella definizione 5.11, si osservi che, per (a) di teorema 5.9, ogni operatore autoaggiunto `e quindi automaticamente chiuso. (2) Val la pena di notare che: (i) le definizioni di operatore hermitiano, simmetrico, autoaggiunto ed essenzialmente autoaggiunto coincidono quando il dominio dell’operatore `e tutto lo spazio di Hilbert, (ii) vale il seguente importante teorema. Teorema 5.13. (Di Hellinger-Toeplitz.) Un operatore hermitiano con dominio dato da tutto lo spazio di Hilbert `e necessariamente limitato (ed autoaggiunto nel senso della definizione 3.46). Dimostrazione. La limitatezza vale per (d) della proposizione 3.49. L’operatore `e quindi autoaggiunto anche nel senso della definizione 3.9. (iii) gli operatori limitati autoaggiunti nel senso della definizione 3.46 sono tutti e soli gli operatori autoaggiunti nel senso della definizione 5.11 con dominio dato da tutto lo spazio. (3) La nozione di operatore essenzialmente autoaggiunto `e la pi` u importante delle quattro presentate sopra nelle applicazioni in Meccanica Quantistica, per il seguente fatto. Come vedremo tra poco, gli operatori essenzialmente autoaggiunti ammettono una sola estensione autoaggiunta, per cui portano tutta l’informazione di un operatore autoaggiunto. Per motivi che vedremo pi` u avanti, gli operatori importanti in Meccanica Quantistica sono operatori autoaggiunti; d’altra parte gli operatori pi` u comodi da trattare in tale teoria sono gli operatori differenziali. Risulta spesso che operatori differenziali della MQ definiti su domini opportuni siano essenzialmente autoaggiunti. In
5.2 Classi di operatori hermitiani
211
tal modo gli operatori differenziali essenzialmente autoaggiunti sono, da una parte, comodi per essere usati, dall’altra, portano le informazioni, in maniera univoca, di operatori autoaggiunti utili in Meccanica Quantistica. Per questo motivo ci soffermeremo su alcune propriet`a connesse all’autoaggiunzione essenziale. (4) Dato un operatore A : D(A) → H nello spazio di Hilbert H, si dice che B ∈ B(H) commuta con A, quando: BA ⊂ AB . Se il dominio di A `e denso e quindi esiste A∗ , si verifica facilmente che se B ∈ B(H) commuta con A allora B ∗ commuta con A∗ (lo si provi per esercizio). Indichiamo con {A} il commutante di A : D(A) → H, cio`e: {A} := {B ∈ B(H) | BA ⊂ AB} . Nel caso in cui A = A∗ risulta che {A} `e una sotto ∗-algebra di B(H) che `e chiusa rispetto alla topologia operatoriale forte. Si tratta dunque di un’algebra di von Neumann (vedi (3) in esempi 3.42). L’ulteriore commutante {A} := {{A} } `e ancora un’algebra di von Neumann, detta algebra di von Neumann generata da A. Vale la seguente elementare, ma importante, proposizione che useremo spesso senza citarla esplicitamente. La semplice dimostrazione `e lasciata al lettore. Proposizione 5.14. Siano H1 e H2 spazi di Hilbert e U : H1 → H2 operatore unitario. Se A : D(A) → H1 `e un operatore in H1 si consideri l’operatore in H2 : A2 : D(A2 ) → H2
con A2 := U A1 U −1 e D(A2 ) := U D(A1 ).
A2 `e chiudibile, chiuso, hermitiano, simmetrico, essenzialmente autoaggiunto, autoaggiunto, normale se e solo se A1 `e, rispettivamente, `e chiudibile, chiuso, hermitiano, simmetrico, essenzialmente autoaggiunto, autoaggiunto, normale. Notazione 5.15. D’ora in poi scriveremo anche A∗∗···∗ in luogo di (((A∗ )∗ ) · · ·)∗ . Proposizione 5.16. Siano (H, (|)) spazio di Hilbert e A operatore in H; allora valgono i seguenti fatti. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora: ∗
A∗ = A = A∗ = A∗∗∗ .
(5.11)
(b) A `e essenzialmente autoaggiunto se e solo se A `e autoaggiunto. (c) Se A `e autoaggiunto, allora `e simmetrico massimale: non ha estensioni proprie simmetriche. (d) Se A `e essenzialmente autoaggiunto, allora A ammette solo una estensione autoaggiunta: A (che coincide con A∗ ).
212
5 Operatori non limitati con domini densi in spazi di Hilbert
Dimostrazione. (a) Se D(A), D(A∗ ), D(A∗∗ ) sono densi, allora esistono A∗ , A∗∗ e A∗∗∗ . Inoltre ∗
A = (A∗∗ )∗ = A∗∗∗ = (A∗ )∗∗ = A∗ per (b) del teorema 5.9. Dato che A∗ `e chiuso (per (a) di teorema 5.9), vale infine: A∗ = A∗ . (b) Se A `e essenzialmente autoaggiunto, allora A = A∗ e quindi, in particolare, D(A) = D(A∗ ) `e denso. Calcolando l’aggiunto di A e tenendo conto di (b) in ∗ teorema 5.9, si ha: A = (A∗ )∗ = A, ossia A `e autoaggiunto. ∗ Viceversa, se A `e autoaggiunto, ossia esiste A = A, allora D(A), D(A∗ ), ∗ D(A∗∗ ) sono densi e, applicando (a): A∗ = A∗ = A ; quindi A∗ = A. Allora A `e essenzialmente autoaggiunto. (c) Sia A autoaggiunto e A ⊂ B con B simmetrico. Prendendo gli aggiunti, si ha A∗ ⊃ B ∗ . Ma B ∗ ⊃ B per la simmetria. Allora: A ⊂ B ⊂ B ∗ ⊂ A∗ = A , e quindi A = B = B ∗ . (d) Sia A∗ = A∗∗ e A ⊂ B con B = B ∗ . Prendendo l’aggiunto di A ⊂ B si ha che: B = B ∗ ⊂ A∗ . Prendendo due volte l’aggiunto di A ⊂ B troviamo anche che A∗∗ ⊂ B, ma allora: B = B ∗ ⊂ A∗ = A∗∗ ⊂ B , per cui B = A∗∗ , che coincide con A per (b) del teorema 5.9.
Passiamo ora a discutere i due teoremi fondamentali che caratterizzano gli operatori autoaggiunti ed essenzialmente autoaggiunti. Teorema 5.17. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A `e autoaggiunto, (b) A `e chiuso e Ker(A∗ ± iI) = {0}, (c) Ran(A ± iI) = H. Dimostrazione. (a) ⇒ (b). Se A = A∗ , allora A `e chiuso perch´e A∗ `e chiuso. Se x ∈ Ker(A∗ + iI), allora vale anche Ax = −ix e quindi i(x|x) = (Ax|x) = (x|Ax) = (x| − ix) = −i(x|x) , per cui (x|x) = 0 e quindi x = 0. La prova per Ker(A∗ − iI) = {0} `e analoga. (b) ⇒ (c). Dalla definizione di operatore aggiunto segue che (vedi l’osservazione 5.10): [Ran(A−iI)]⊥ = Ker(A∗ +iI). Quindi da (b) segue che Ran(A−iI) `e denso in H. Ora teniamo conto della chiusura di A per mostrare che in realt`a
5.2 Classi di operatori hermitiani
213
Ran(A − iI) = H. Si fissi y ∈ H arbitrariamente e si scelga {xn }n∈N ⊂ D(A) per cui (A − iI)xn → y ∈ H. Vale, se z ∈ D(A), ||(A − iI)z||2 = ||Az||2 + ||z||2 ≥ ||z||2 , da cui il fatto che {xn }n∈N `e una successione di Cauchy ed esiste x = limn→+∞ xn . La chiusura di A comporta subito quella di A − iI, per cui: (A − iI)x = y e quindi Ran(A − iI) = Ran(A − iI) = H. La prova per Ker(A∗ − iI) = {0} `e analoga. (c) ⇒ (a) Dato che A ⊂ A∗ per l’ipotesi di simmetria, `e sufficiente provare che D(A∗ ) ⊂ D(A). Sia y ∈ D(A∗ ). Dato che Ran(A − iI) = H, esiste un vettore x− ∈ D(A) tale che: (A − iI)x− = (A∗ − iI)y . a di sopra, si Su D(A) l’operatore A∗ coincide con A e pertanto, dall’identit` trova che: (A∗ − iI)(y − x− ) = 0 . Ma Ker(A∗ − iI) = Ran(A + iI)⊥ = {0}, per cui y = x− e y ∈ D(A). La dimostrazione nel caso di Ran(A + iI) `e analoga. Teorema 5.18. Sia A operatore simmetrico nello spazio di Hilbert H. I seguenti fatti sono equivalenti: (a) A `e essenzialmente autoaggiunto, (b) Ker(A∗ ± iI) = {0}, (c) Ran(A ± iI) = H. Dimostrazione. (a) ⇒ (b). Se A `e essenzialmente autoaggiunto, allora A∗ = A∗∗ e quindi A∗ `e autoaggiunto (e dunque chiuso). Applicando il teorema 5.17, segue che Ker(A∗∗ ± iI) = {0} e quindi vale (b) perch´e A∗∗ = A∗ . (b) ⇒ (a). A ⊂ A∗ per ipotesi e quindi, essendo D(A) denso, lo `e anche D(A∗ ). Di conseguenza, per la (b) del teorema 5.9, A `e chiudibile e A ⊂ A = A∗∗ (in particolare D(A∗∗ ) = D(A) ⊃ D(A) `e denso). Pertanto, da A ⊂ A∗ segue ∗ ∗ A ⊂ A∗ e, per la (a) di proposizione 5.16, si ha A∗ = A . In definitiva, A ⊂ A , ovvero A `e simmetrico. Possiamo allora applicare il teorema 5.17 all’operatore A, valendo per esso la proposizione (b) in tale teorema. Concludiamo che A `e autoaggiunto. Da (b) di proposizione 5.16 segue che A `e essenzialmente autoaggiunto. (b) ⇔ (c). Dato che Ran(A ± iI)⊥ = Ker(A∗ ∓ iI) e che Ran(A ± iI) ⊕ Ran(A ± iI)⊥ = H, (b) e (c) sono equivalenti. Per concludere presentiamo un concetto utile nelle applicazioni: quello di core per un operatore. Definizione 5.19. Sia A un operatore nello spazio di Hilbert H con dominio denso e sia A chiudibile. Un sottospazio denso S ⊂ D(A) `e detto essere un core di A se: A S = A .
214
5 Operatori non limitati con domini densi in spazi di Hilbert
Vale la seguente ovvia ma importante proposizione. Proposizione 5.20. Se A `e un operatore autoaggiunto nello spazio di Hilbert H, un sottospazio S ⊂ D(A) `e un core per A se e solo se A S `e essenzialmente autoaggiunto. Dimostrazione. Se A S `e essenzialmente autoaggiunto, allora ammette un’unica estensione autoaggiunta, che coincide con la sua chiusura per (d) in proposizione 5.16; nel caso in esame, tale estensione coincide necessariamente con A, che per ipotesi `e autoaggiunto. Quindi A S `e un core. Viceversa, se A S `e un core, la chiusura di A S `e autoaggiunta perch´e coincide con l’operatore autoaggiunto A. Per (b) di proposizione 5.16, A S `e dunque essenzialmente autoaggiunto.
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso Come esempi del formalismo costruito fino ad ora, introduciamo e studiamo alcune caratteristiche di due operatori autoaggiunti, di grande importanza in Meccanica Quantistica, che si chiamano rispettivamente operatore posizione ed operatore impulso. Il significato fisico di tali operatori sar` a chiarito nella seconda parte del libro. Nel seguito adotteremo le convenzioni le definizioni e le notazioni usate nella sezione 3.6. Inoltre x = (x1 , . . . , xn ) denota il punto generico di Rn . 5.3.1 L’operatore posizione Definizione 5.21. Sia H := L2 (Rn , dx), dove dx `e la misura di Lebesgue su Rn . Se i ∈ {1, 2, . . . , n} `e fissato, l’operatore in H: (Xi f)(x) = xi f(x) , con dominio:
D(Xi ) := f ∈ L2 (Rn , dx)
Rn
(5.12)
2
|xi f(x)| dx < +∞
,
(5.13)
si chiama operatore posizione rispetto alla coordinata i-esima. Proposizione 5.22. Per l’operatore Xi della definizione 5.21 valgono i seguenti fatti. (a) Xi `e autoaggiunto. (b) D(Rn ) e S(Rn ) sono core per Xi e quindi: Xi = Xi D(Rn ) = Xi S(Rn ) . Dimostrazione. (a) Il dominio di Xi `e sicuramente denso in H in quanto include lo spazio D(Rn ) delle funzioni infinitamente differenziabili a supporto
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
215
compatto e anche lo spazio delle funzioni di Schwartz S(Rn ) (vedi notazione 3.64) che sono entrambi densi in L2 (Rn , dx). Quindi Xi `e chiudibile ed ammette aggiunto. Dalla definizione di Xi e del suo dominio risulta immediatamente che (g|Xi f) = (Xi g|f) se f, g ∈ D(Xi ). Di conseguenza Xi `e hermitiano e simmetrico. Mostriamo che `e anche autoaggiunto. Dato che, per la simmetria Xi ⊂ Xi∗ `e sufficiente provare che D(Xi∗ ) = D(Xi ). Determiniamo l’aggiunto di Xi direttamente dalla definizione. f ∈ D(Xi∗ ) se e solo se esiste h ∈ L2 (Rn , dx) (che, per definizione, coincide con Xi∗ f) tale che: f(x)xi g(x)dx = h(x)g(x)dx per ogni g ∈ D(Xi ). Rn
Rn
Dato che D(Xi ) `e denso e vale: [xi f(x) − h(x)]g(x)dx = 0 per ogni g ∈ D(Xi ), Rn
possiamo anche dire che: f ∈ L2 (Rn , dx) appartiene a D(Xi∗ ) se e solo se vale xi f(x) = h(x) quasi ovunque, con h ∈ L2 (Rn , dx). In definitiva, D(Xi∗ ) `e composto da tutte e sole funzioni f ∈ L2 (Rn , dx) per cui 2 |xi f(x)| dx < +∞ , Rn
e quindi D(Xi∗ ) = D(Xi ) e Xi `e autoaggiunto. (b) Se definiamo l’operatore Xi come abbiamo fatto sopra, eccetto per il fatto che restringiamo il suo dominio allo spazio D(Rn ) oppure a S(Rn ), l’operatore ottenuto in tal modo cessa di essere autoaggiunto, ma rimane simmetrico. Gli aggiunti di Xi D(Rn ) e Xi S(Rn ) dovono entrambi coincidere con l’operatore Xi∗ gi`a trovato sopra, perch´e nella costruzione di Xi∗ abbiamo solo usato il fatto che Xi `e l’operatore che moltiplica per xi su un dominio denso: che fosse D(Xi ) definito in (5.13) o un suo sottospazio denso non cambiava il risultato. Definendo Xi come in (5.12) e (5.13), il suo aggiunto Xi∗ deve soddisfare Ker(Xi∗ ± iI) = {0} per (b) del teorema 5.17. Ma dato che Xi∗ `e lo stesso che si ottiene restringendo il dominio di Xi a D(Rn ) o S(Rn ), valendo (b) del teorema 5.18, l’operatore Xi , con dominio ristretto, risulta essere essenzialmente autoaggiunto. (b) `e allora conseguenza immediata della proposizione 5.20. 5.3.2 L’operatore impulso Passeremo ora ad introdurre l’operatore impulso. D’ora in poi faremo uso delle definizioni e convenzioni notazionali esposte nell’esempio 2.96 e in notazione 3.64. Abbiamo bisogno di alcune definizioni preliminari. Diremo che f : Rn → C `e una funzione localmente integrabile su Rn se vale f · g ∈ L1 (Rn , dx) per ogni funzione g ∈ D(Rn ).
216
5 Operatori non limitati con domini densi in spazi di Hilbert
Definizione 5.23. Sia f localmente integrabile. Se α `e un multindice, diremo che h : Rn → C `e la α-esima derivata di f in senso debole, e scriveremo w-∂ α f = h, se h : Rn → C `e localmente integrabile e vale: |α| h(x)g(x) dx = (−1) f(x)∂xα g(x) dx (5.14) Rn
Rn
per ogni funzione g ∈ D(Rn ). Osservazione 5.24. (1) La derivata in senso debole, se esiste `e univocamente determinata a meno di un insieme di misura nulla: se h e h sono localmente integrabili (ma non necessariamente L2 (Rn , dx) in qual caso, quanto stiamo per dire sarebbe immediato) e soddisfano (5.14), allora: (h(x) − h (x))g(x) dx = 0 per ogni g ∈ D(Rn ). (5.15) Rn
Ma allora h(x) − h (x) = 0 quasi ovunque per il lemma di Du Bois-Reymond [Vla81]: Lemma 5.25. (Di Du Bois-Reymond.) Se φ `e localmente integrabile su Rn , allora φ `e nulla quasi ovunque se e solo se: Rn φ(x)f(x) dx = 0 per ogni f ∈ D(Rn ). (2) Nel caso che f ∈ C |α|(Rn ), la derivata di ordine α in senso debole di f esiste e coincide con quella in senso ordinario (a meno di un insieme di misura nulla). Tuttavia vi sono casi in cui la derivata ordinaria non esiste ed esiste solo quella debole. (3) Le funzioni L2 (Rn , dx) sono localmente integrabili essendo D(Rn ) ⊂ L2 (Rn , dx) e valendo f · g ∈ L1 se f, g ∈ L2 . Per introdurre l’operatore impulso, consideriamo l’operatore Aj in H := L2 (Rn , dx): (Aj f)(x) = −i
∂ f(x) ∂xj
con D(Aj ) := D(Rn ),
(5.16)
dove `e una costante positiva (la costante di Planck) – il cui valore `e del tutto irrilevante in quello che segue. Dalla definizione di Aj risulta immediatamente che (g|Aj f) = (Aj g|f) se f, g ∈ D(Aj ). Aj `e dunque simmetrico essendo D(Aj ) = H. Mostriamo che Aj `e anche essenzialmente autoaggiunto. Determiniamo l’aggiunto di Aj che si indica con Pj := A∗j direttamente dalla definizione. Per f ∈ D(A∗j ) = D(Pj ) deve esistere φ ∈ L2 (Rn , dx) (che, per definizione, coincide con Pj f) tale che: ∂ φ(x)g(x)dx = −i f(x) g(x)dx , per ogni g ∈ D(Rn ) . (5.17) ∂xj Rn Rn
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
217
Prendendo il complesso coniugato ad ambo membri, la condizione (5.17) si esprime dicendo che: f ∈ L2 (Rn , dx) appartiene a D(Pj ) se e solo se ammette derivata in senso debole φ ∈ L2 (Rn , dx). Definizione 5.26. Sia H := L2 (Rn , dx), dove dx `e la misura di Lebesgue su Rn . Se i ∈ {1, 2, . . . , n} `e fissato, l’operatore in H: (Pj f)(x) = −iw-
∂ f(x) , ∂xj
(5.18)
con dominio:
( )
∂ 2 n D(Pj ) := f ∈ L2 (Rn , dx) esiste w- ∂x f ∈ L (R , dx) , j
(5.19)
si dice operatore impulso rispetto alla coordinata j-esima. Osservazione 5.27. Se n = 1, D(Pj ) si identifica con lo spazio di Sobolev H1 (R, dx). Proposizione 5.28. Per l’operatore Pj della definizione 5.26 valgono i seguenti fatti. (a) Pj `e autoaggiunto. (b) D(Rn ) e S(Rn ) sono core per Pj . Conseguentemente: ∂ f(x) ∂xj ∂ (A j f)(x) = −i f(x) ∂xj (Aj f)(x) = −i
con f ∈ D(Aj ) := D(Rn ) ,
(5.20)
con f ∈ D(Aj ) := S(Rn ) ,
(5.21)
sono essenzialmente autoaggiunti e Aj = Aj = Pj . Dimostrazione. Nel seguito, per semplicit`a notazionale, porremo = 1 (inglobando la costante −1 nell’unit` a di misura della coordinata xj ), la derivata parziale rispetto alla coordinata i-esima la indicheremo con ∂j e l’analoga derivata parziale in senso debole con w-∂j . Vogliamo provare che Ker(A∗j ± iI) = {0}. Ci` o proverebbe, in virt` u del teorema 5.18, che Aj `e essenzialmente autoaggiunto, ossia che Pj = A∗j `e autoaggiunto. Lo spazio Ker(A∗j ± iI) `e costituito dalle funzioni f ∈ L2 (Rn , dx) che ammettono derivata debole e che soddisfano: i(w-∂j f ± f) = 0. Consideriamo dunque l’equazione, per f ∈ L2 (Rn , dx): w-∂j f ± f = 0 . Moltiplicando per un esponenziale, tale equazione implica che: w-∂j e±xj f = 0 , Ci riduciamo quindi a provare che vale il seguente fatto.
(5.22)
(5.23)
218
5 Operatori non limitati con domini densi in spazi di Hilbert
Lemma 5.29. Se h : Rn → C `e localmente integrabile e soddisfa w-∂j h = 0 ,
(5.24)
allora h coincide quasi ovunque con una funzione costante nella variabile xj . Prova del lemma 5.29. Senza perdere generalit` a supporremo j = 1 e indicheremo con (x, y) le coordinate di Rn , in cui x `e la coordinata x1 e y indica le rimanenti n − 1 coordinate. Sia h localmente integrabile che soddisfi (5.24). Esplicitamente: ∂ h(x, y) g(x, y)dx ⊗ dy = 0 , per ogni g ∈ D(Rn ) . (5.25) ∂x n R Sia f ∈ D(Rn ) e scegliamo a > 0 sufficientemente grande in modo che valga suppf ⊂ [−a, a] × [−a, a]n−1. Definiamo χ ∈ D(R) per cui suppχ = [−a, a] e χ(x)dx = 1. Allora esiste una funzione g ∈ D(Rn ) tale che: R ∂ f(u, y)du . g(x, y) = f(x, y) − χ(x) ∂x R Infatti basta considerare: x f(u, y)du − g(x, y) := −∞
x
χ(u)du
f(u, y)du .
(5.26)
R
−∞
Questa funzione `e C ∞ per costruzione, la sua derivata in x coincide con: f(x, y) − χ(x) f(u, y)du . R
Inoltre il supporto di g `e limitato: se per qualche coordinata |yk | > a, f(u, y) = 0 qualunque sia u per cui g(x, y) = 0 qualunque sia x. Se x < −a si annullano il primo integrale in (5.26) ed anche il secondo visto che χ ha supporto in [−a, a]. Viceversa, se x > a vale: +∞ g(x, y) := f(u, y)du − 1 f(u, y)du = 0 , R
−∞
dove abbiamo tenuto conto delle condizioni suppχ = [−a, a] R χ(x)dx = 1. In definitiva g si annulla fuori da [−a, a] × [−a, a]n−1. Inserendo g in (5.25) ed usando il teorema di Fubini-Tonelli, troviamo:
h(x, y)f(x, y) dx ⊗ dy − h(x, y)χ(x)dx f(u, y) du ⊗ dy = 0 . Rn
Rn
R
Cambiando nome alle variabili:
h(x, y) − h(u, y)χ(u)du f(x, y) dx ⊗ dy = 0 , Rn
R
(5.27)
5.3 Alcune importanti applicazioni: operatore posizione e operatore impulso
219
essendo f una funzione qualsiasi di D(Rn ). Si osservi che la funzione: h(u, y)χ(u)du (x, y) → k(y) := R
`e localmente integrabile su R , perch´e la funzione: n
(x, y, u) → f(x, y)h(u, y)χ(u) `e integrabile su Rn+1 per ogni f ∈ D(Rn ) (basta notare che |f(x, y)| ≤ |f1 (x)||f2 (y)| per f1 e f2 opportune in D(R)). La (5.27), valida per ogni f ∈ D(Rn ), implica immediatamente che: h(u, y)χ(u)du = 0 h(x, y) − R
quasi ovunque su R per il lemma 5.25 di Du Bois-Reymond. In altre parole: n
h(x, y) = k(y)
quasi ovunque su Rn .
Nel caso in esame, il risultato trovato implica che ogni soluzione di (5.22) deve essere della forma f(x) = e±xj h(x), dove h non dipende dalla variabile xj . Il teorema Fubini-Tonelli implica immediatamente che Rn |f(x)|2 dx = di±2x 2 ||h||L2(Rn−1 ) R e j dxj . h deve quindi essere la funzione quasi ovunque nulla se vogliamo che, come richiesto, f ∈ L2 (Rn , dx). Ne consegue che Ker(A∗ ± iI) = {0} e dunque Pj = A∗j `e autoaggiunto (cio`e Aj `e essenzialmente autoaggiunto). Dato che S(Rn ) ⊃ D(Rn ), abbiamo facilmente che, Aj `e simmetrico e, se f ∈ D(A ∗j ), allora f ammette derivata generalizzata e vale: ∗
A j f = −iw-
∂ f. ∂xj ∗
Usando la stesa procedura seguita sopra, si ha che se f ∈ Ker(A j ± I) allora f = 0 e pertanto anche Aj `e essenzialmente autoaggiunto. Essendo Aj ⊂ Aj ed essendo anche Aj essenzialmente autoaggiunto, deve allora valere ∗∗ che A = A = A∗∗ = A = Pj per (d) di proposizione 5.16. Esiste un altro modo per introdurre l’operatore Pj . Consideriamo la trasformata di Fourier-Plancherel Fˆ : L2 (Rn , dx) → L2 (Rn , dk) vista nella sezione 3.6. Useremo le stesse notazioni usate in tale sezione. Definiamo nello spazio L2 (Rn , dk) l’analogo dell’operatore Xj introdotto sopra, che per` o indicheremo con Kj dato che le coordinate di Rn vengono indicate con (k1 , . . . , kn) nello spazio “di arrivo” della trasformata di Fourier-Plancherel. Essendo Fˆ una trasformazione unitaria, l’operatore Fˆ −1 Kj Fˆ sar`a autoaggiunto se definito sul dominio Fˆ −1 D(Kj ).
220
5 Operatori non limitati con domini densi in spazi di Hilbert
Proposizione 5.30. Se Kj `e l’operatore posizione rispetto alla coordinata j-esima nello spazio di arrivo della trasformata di Fourier-Plancherel Fˆ : L2 (Rn , dx) → L2 (Rn , dk), vale: Pj = Fˆ−1 Kj Fˆ . Dimostrazione. Per provare ci` o `e sufficiente mostrare che i due operatori coincidono su un dominio in cui sono essenzialmente autoaggiunti. Consideriamo lo spazio S(Rn ). Come sappiamo dalla sezione 3.6, la trasformata di Fourier-Plancherel si riduce alla trasformata di Fourier su tale spazio e vale: Fˆ (S(Rn )) = S(Rn ). Inoltre, dalle propriet` a della trasformata di Fourier abbiamo che, se g ∈ S(Rn ) e 1 f(x) = eik·x g(k) dk (2π)n/2 Rn allora:
∂ 1 −i f(x) = ∂xj (2π)n/2 In altre parole abbiamo ottenuto che:
Rn
eik·x kg(k) dk .
Pj S(Rn ) = Fˆ −1 Kj S(Rn ) Fˆ . Notiamo che Kj `e essenzialmente autoaggiunto su S(Rn ) per la proposizione 5.22, per cui lo `e anche Fˆ −1 Kj S(Rn ) Fˆ su S(Rn ), essendo Fˆ unitaria. Dato che anche Pj S(Rn ) = Aj `e essenzialmente autoaggiunto (proposizione 5.28) e che le estensioni autoaggiunte di operatori essenzialmente autoaggiunti sono uniche e coincidono con la chiusura dell’operatore (per (d) di proposizione 5.16), concludiamo che Pj = Fˆ −1 Kj S(Rn ) Fˆ = Fˆ −1 Kj S(Rn ) Fˆ = Fˆ −1 Kj Fˆ . Questo conclude la dimostrazione.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte In questa rimanente parte del capitolo introdurremo alcuni utili criteri per stabilire se un operatore ammette estensioni autoaggiunte ed eventualmente quante. 5.4.1 La trasformata di Cayley e gli indici di difetto Uno degli strumenti tecnici di centrale importanza per discutere questi criteri `e la cosiddetta trasformata di Cayley, che introduciamo nel seguito. Prima estendiamo il concetto di isometria (definizione 3.6) agli operatori con dominio non massimale.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
221
Definizione 5.31. Un operatore U : D(U ) → H, nello spazio di Hilbert H, `e detto isometria, se soddisfa: (U x|U y) = (x|y)
per ogni coppia x, y ∈ D(U ).
Osservazioni 5.32. ` chiaro che se D(U ) = H la definizione di isometria data sopra individua (1) E gli operatori isometrici nel senso della definizione 3.46. (2) Per la proposizione 3.8, la definizione di isometria data sopra equivale a richiedere che U soddisfi ||U x|| = ||x||, per ogni x ∈ D(U ). La trasformazione R t → (t − i)(t + i)−1 ∈ C definisce una corrispondenza biunivoca tra la retta reale R ed il cerchio in C di raggio unitario centrato nell’origine e privato di 1. Esiste un’analoga corrispondenza che associa operatori isometrici ad operatori simmetrici. Questa corrispondenza, di cui studieremo solo alcune propriet` a, `e la trasformata di Cayley. Teorema 5.33. Sia H uno spazio di Hilbert. (a) Se A `e un operatore simmetrico in H: (i) A + iI `e iniettivo, (ii) `e ben definita la trasformata di Cayley di A: V := (A − iI)(A + iI)−1 : Ran(A + iI) → H ,
(5.28)
(iii) V risulta essere un’isometria con Ran(V ) = Ran(A − iI). (b) Se vale (5.28) allora valgono i seguenti fatti: (i) I − V `e iniettivo, (ii) Ran(I − V ) = D(A) e A := i(I + V )(I − V )−1 .
(5.29)
(c) Se A operatore simmetrico in H, A `e autoaggiunto se e solo se la sua trasformata di Cayley V `e un operatore unitario su H. (d) Se V : H → H `e unitario e I − V `e iniettivo, V `e la trasformata di Cayley di qualche operatore in H autoaggiunto. Dimostrazione. (a) Per computo diretto, usando la simmetria di A e le propriet` a di (anti-)linearit` a del prodotto scalare, si verifica subito che, se f ∈ D(A): ||(A ± iI)f||2 = ||Af||2 + ||f||2 . (5.30) Di conseguenza, se (A + iI)f = 0 o (A − iI)f = 0, allora f = 0. Gli operatori A ± iI sono quindi iniettivi su D(A) e quindi V `e ben definita da D(V ) := Ran(A + iI) a valori in H. Da (5.30) segue che, per ogni g ∈ D(A) ||(A − iI)g|| = ||(A + iI)g|| .
222
5 Operatori non limitati con domini densi in spazi di Hilbert
Se poniamo g = (A+iI)−1 h, per h ∈ Ran(A+iI), troviamo immediatamente: ||V h|| = ||(A − iI)(A + iI)−1 h|| = ||h|| , per cui V isometria con dominio D(V ) = Ran(A+iI) e Ran(V ) = Ran(A−iI). (b) D(V ) `e costituito dai vettori g = (A + iI)f per f ∈ D(A). Applicando V a g troviamo V g = (A − iI)f. Aggiungendo e togliendo g = (A + iI)f membro a membro, si ottengono le relazioni: (I + V )g = 2Af , (I − V )g = 2if .
(5.31) (5.32)
(5.32) mostra che (I − V ) `e iniettiva in quanto, se (I − V )g = 0, allora f = 0 e quindi g = (A + iI)f = 0. Possiamo allora scrivere, se f ∈ D(A): g = 2i(I − V )−1 f .
(5.33)
Inoltre Ran(I − V ) = D(A) segue subito da (5.32). Applicando (I + V ) ad ambo membri di (5.33) ed usando (5.31) otteniamo: Af = i(I + V )(I − V )−1 f
per ogni f ∈ D(A).
(c) Supponiamo che A = A∗ . Per il teorema 5.17, deve accadere che Ran(A + iI) = Ran(A − iI) = H. Allora, per (a) V `e un’isometria da Ran(A + iI) = H con immagine H = Ran(A − iI). Quindi V `e un’isometria suriettiva e cio`e un operatore unitario. Supponiamo ora che V : H → H sia operatore unitario e sia la trasformata di Cayley di A simmetrico in H. Per (a) deve essere Ran(A+iI) = Ran(A−iI) = H. Questo equivale a dire che A = A∗ per il teorema 5.17. ` sufficiente provare che V `e la trasformata di Cayley di un operatore (d) E simmetrico. Per (c) tale operatore simmetrico `e autoaggiunto. Per ipotesi, c’`e una corrispondenza biettiva z → x, tra D(V ) = H e Ran(I − V ), data da x := z − V z. Definiamo l’operatore A : Ran(I − V ) → H, dato da: Ax := i(z + V z) ,
se x = z − V z.
(5.34)
Se x, y ∈ D(A) = Ran(I − V ), allora x = z − V z e y = u − V u per qualche coppia z, u ∈ D(V ). Dato che V `e un’isometria, vale che: (Ax|y) = i(z +V z|u −V u) = i(V z|u)−i(z|V u) = (z −V z|iu +iV u) = (x|Ay), e quindi A `e hermitiano. Per provare che `e anche simmetrico, notiamo che D(A) = Ran(I − V ) `e denso. Infatti [Ran(I − V )]⊥ = Ker(I − V ∗ ). Se non fosse Ker(I − V ∗ ) = {0}, ci sarebbe u ∈ H, non nullo, tale che V ∗ u = u e allora, applicando V ad ambo membri, u = V u. Questo `e impossibile perch´e I − V `e iniettivo per ipotesi.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
223
Per concludere, proviamo che V `e la trasformata di Cayley di A. La (5.34) pu` o essere riscritta nella forma: 2iV z = Ax − ix ,
2iz = Ax + ix ,
se z ∈ H.
(5.35)
Allora: V (Ax + ix) = Ax − ix per x ∈ D(A) e H = D(V ) = Ran(A + iI). Ma allora V `e la trasformata di Cayley di A perch´e vale: V (A + iI) = A − iI e quindi: V = (A − iI)(A + iI)−1 . Questo conclude la dimostrazione del teorema.
Osservazione 5.34. Dall’enunciato e dalla dimostrazione del teorema risulta che se A `e simmetrico allora Ker(A ± iI) = {0}. In generale per` o non accade anche che Ker(A∗ ± iI) = {0}! Quest’ultima `e una condizione molto pi` u forte che equivale alla essenziale autoaggiunzione di A (se A `e simmetrico) per il teorema 5.18. Passiamo alle conseguenze del teorema 5.33 nello studio dell’esistenza di estensioni autoaggiunte di un operatore simmetrico. Il primo dei teoremi a riguardo `e il seguente, che introduce i cosiddetti indici di difetto. Teorema 5.35. Sia A un operatore simmetrico sullo spazio di Hilbert H. Definiti gli indici di difetto: d±(A) := dim Ker(A∗ ± iI) , vale quanto segue: (a) A ammette estensioni autoaggiunte se e solo se d+ (A) = d− (A), (b) Se d+ (A) = d−(A), esiste una corrispondenza biunivoca tra estensioni autoaggiunte di A ed operatori isometrici suriettivi da Ker(A∗ − iI) a Ker(A∗ + iI). A ammette tante estensioni autoaggiunte quanti sono gli operatori isometrici suriettivi suddetti e, in particolare, A ammette pi` u di una estensione autoaggiunta se d+ (A) = d− (A) > 0. Osservazione 5.36. Gli indici di difetto possono definirsi equivalentemente come: d± (A) := dim [Ran(A ∓ iI)]⊥ , dato che Ker(A∗ ± iI) = [Ran(A ∓ iI)]⊥ .
Prova del teorema 5.35. Consideriamo la trasformata di Cayley V di A. Supponiamo che A ammetta un’estensione autoaggiunta B. Sia U : H → H la ` immediato provare che U `e un’estensione di V trasformata di Cayley di B. E usando (5.28) e tenendo conto che (B + iI)−1 estende (A + iI)−1 e B − iI estende A − iI. Di conseguenza, U trasforma Ran(A + iI) in Ran(A − iI). Essendo U unitario, si ha che y ⊥ Ran(A+iI) se e solo se U y ⊥ U (Ran(A+iI)).
224
5 Operatori non limitati con domini densi in spazi di Hilbert
In altre parole U ([Ran(A + iI)]⊥ ) = [Ran(A − iI)]⊥ . Per (d) di proposizione 3.38, questo equivale a dire U (Ker(A∗ + iI)) = Ker(A∗ − iI). Dato che U `e un’isometria, deve allora essere dim Ker(A∗ + iI) = dim Ker(A∗ − iI) ossia d+ (A) = d− (A). Mostriamo che, viceversa, se vale d+ = d− , allora A ammette estensioni autoaggiunte e queste non sono uniche se d+ (A) = d−(A) > 0. Sia V la trasformata di Cayley di A. Dato che V `e limitata, usando la proposizione 2.57, possiamo estendere V , in modo unico, ad un operatore isometrico da U : Ran(A + iI) → Ran(A − iI). Possiamo fare la stessa cosa per V −1 , estendendola, in modo unico, ad un operatore isometrico da ` chiaro che, per continuit` Ran(A − iI) a Ran(A + iI). E a, tale operatore deve ⊥
essere U −1 : Ran(A − iI) → Ran(A + iI). Ricordiamo che Ran(A ± iI) = [Ran(A ± iI)]⊥ = Ker(A∗ ∓ iI). Nell’ipotesi di d+ (A) = d− (A), possiamo infine definire un operatore unitario U0 : Ker(A + iI) → Ker(A − iI). Valendo le decomposizioni ortogonali di sottospazi chiusi H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , l’operatore W : (x, y) := U ⊕U0 :→ (U x, U0 y), con x ∈ Ran(A + iI) e y ∈ Ker(A∗ − iI), `e un operatore unitario su H. Inoltre I − W `e iniettivo. Infatti, Ker(I − W ) consiste nelle coppie (x, y) = (0, 0) con U x = x e U0 y = y: la prima equazione ammette solo la soluzione x = 0 perch´e U `e un’isometria e la seconda equazione implica che y ∈ Ker(A∗ + iI) ∩ Ker(A∗ − iI) che produce subito y = 0. Possiamo allora applicare (d) del teorema 5.33: W `e la trasformata di Cayley di un operatore B autoaggiunto. Dato che W estende U , B `e un’estensione autoaggiunta di A. La scelta dell’operatore unitario U0 pu` o essere fatta in pi` u modi se d+ (A) = d−(A) > 0, tale scelta definisce diverse estensioni autoaggiunte di A. Mostriamo ora che la corrispondenza tra le estensioni autoaggiunte di A e gli operatori isometrici suriettivi U0 `e biunivoca. I punti (a) e (b) del teorema 5.33 implicano immediatamente che, due operatori simmetrici sono diversi se e solo se le loro trasformate di Cayley sono diverse. Consideriamo allora le estensioni autoaggiunte dell’operatore A. Ogni estensione autoaggiunta, B, individua una trasformata di Cayley W unitaria che estende l’operatore U (definito sopra) in un operatore unitario su H. Dato che: U : Ran(A + iI) → Ran(A − iI) `e isometrico suriettivo, che valgono le decomposizioni H = Ran(A + iI) ⊕ Ker(A∗ − iI) = Ran(A − iI) ⊕ Ker(A∗ + iI) , e che infine W estende U , ci`o pu` o accadere solo se W determina un’isometria suriettiva U0 : Ker(A∗ − iI) → Ker(A∗ + iI). Due estensioni autoaggiunte
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
225
B, B distinte devono individuare due operatori U0 , U0 distinti, altrimenti le trasformate di Cayley W, W dei due operatori coinciderebbero e quindi gli operatori coinciderebbero a loro volta. Abbiamo ottenuto che l’applicazione che manda l’estensione autoaggiunta di A, B, nell’associata isometria suriettiva U0 `e iniettiva. Questa applicazione `e anche suriettiva dato che, come visto sopra, la scelta dell’isometria suriettiva U0 determina un’estensione autoaggiunta di A: l’unica che ha trasformata di Cayley data da W := U ⊕ U0 . Una prima importante conseguenza del teorema 5.35 `e la seguente. Teorema 5.37. Un operatore simmetrico A sullo spazio di Hilbert H `e essenzialmente autoaggiunto se e solo se ammette un’unica estensione autoaggiunta. Dimostrazione. Se A `e essenzialmente autoaggiunto allora ammette un’unica estensione autoaggiunta come noto da (d) di proposizione 5.17. Per il teorema 5.35, se A `e simmetrico ammette estensioni autoaggiunte solo se d+ = d− . In particolare, se ammette un’unica estensione autoaggiunta deve essere d+ = d− = 0. Ma allora, per (b) del teorema 5.18, A `e essenzialmente autoaggiunto. 5.4.2 Il criterio di Von Neumann Un secondo teorema che enunceremo e dimostreremo ora `e in realt` a un corollario del teorema 5.33. Tale teorema `e dovuto a von Neumann che stabilisce condizioni sufficienti affinch´e un operatore simmetrico ammetta estensioni autoaggiunte. Abbiamo bisogno di due definizioni preliminari. Definizione 5.38. Siano X e X spazi vettoriali su C dotati di prodotto scalare hermitiano ( | )X e ( | )X rispettivamente. Una funzione suriettiva V : X → X `e detta operatore antiunitario se soddisfa le seguenti propriet` a: (a) antilinearit` a : V (αx + βy) = αV x + βV y per ogni x, y ∈ X, α, β ∈ C; (b) anti isometricit` a: (V x|V y)X = (x|y)X per ogni x, y ∈ X. Osservazione 5.39. Notare la coniugazione complessa a secondo membro in (b), ma osservi che vale comunque ||V z||X = ||z||X per ogni z ∈ X. Si noti che V `e biettivo. Definizione 5.40. Se (H, ( | )) `e uno spazio di Hilbert, un operatore antiunitario C : H → H `e detto coniugazione oppure equivalentemente operatore di coniugazione se `e involutivo, cio`e se soddisfa: CC = I. Osservazione 5.41. Una coniugazione `e definita su uno spazio vettoriale complesso con prodotto scalare hermitiano e, in generale, non `e un’involuzione nel senso della definizione 3.40, che `e invece definita su un’algebra.
226
5 Operatori non limitati con domini densi in spazi di Hilbert
Teorema 5.42. (Di von Neumann). Sia A `e un operatore simmetrico nello spazio di Hilbert H. Se esiste una coniugazione C : H → H tale che valga C(D(A)) ⊂ D(A) ed anche: AC = CA . allora A ammette estensioni autoaggiunte. Dimostrazione. Mostriamo prima di tutto che C(D(A∗ )) ⊂ D(A∗ ) e che vale anche A∗ C = CA∗ . Infatti, dalla definizione di aggiunto (A∗ f|Cg) = (f|ACg) per ogni f ∈ D(A∗ ) e g ∈ D(A). Usando il fatto che C `e antiunitaria: (CCg|CA∗f) = (CACg|Cf). Dato che C commuta con A e CC = I, si ha ancora (g|CA∗ f) = (Ag|Cf)), ossia (CA∗ f|g) = (Cf|Ag) per ogni f ∈ D(A∗ ) e g ∈ D(A). Dalla definizione di aggiunto, questo significa che Cf ∈ D(A∗ ) se f ∈ D(A∗ ) e CA∗ f = A∗ Cf. Passiamo a provare l’esistenza delle estensioni autoaggiunte facendo uso del teorema 5.35. In base a quanto appena provato, se A∗ f = if, applicando C ad ambo membri ed usando il fatto che C sia antilineare e commuti con A∗ , troviamo: A∗ Cf = −iCf. Per cui C `e un’applicazione (iniettiva perch´e conserva la norma) da Ker(A∗ − iI) a Ker(A∗ + iI). Tale applicazione `e anche suriettiva in quanto, se vale A∗ g = −ig, definendo f := Cg troviamo che deve essere A∗ f = +if e, riapplicando C a f (tenendo conto di CC = I), troviamo Cf = g. Quindi C `e un’applicazione biettiva da Ker(A∗ − iI) a Ker(A∗ + iI). Il fatto che sia anche anti isometrica, e quindi preservi l’ortonormalit`a di vettori, comporta subito che trasformi biettivamente basi hilbertiane in basi hilbertiane, in particolare quindi, conservandone la cardinalit` a. Allora deve essere d+ (A) = d−(A). Per il teorema 5.33 vale la tesi. 5.4.3 Il criterio di Nelson Discutiamo, per concludere, il criterio di Nelson che fornisce condizioni sufficienti affinch´e un operatore simmetrico sia essenzialmente autoaggiunto. Una parte della dimostrazione del teorema finale sar` a pienamente comprensibile solo dopo avere dimostrato alcuni risultati di teoria spettrale, nei capitoli 8 e 9. Abbiamo comunque ritenuto corretto presentare il teorema in questo capitolo. Il lettore pu` o postporre la dimostrazione fino a quando abbia raggiunto familiarit` a con la teoria sviluppata nei due capitoli menzionati. Sono necessarie alcune definizioni e risultati preliminari. Definizione 5.43. Sia A operatore nello spazio di Hilbert H. (a) ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), `e detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). (b) ψ ∈ C ∞ (A) `e detto vettore analitico per A, se vale: +∞
||An ψ|| n t < +∞ n! n=0
per qualche t > 0.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
227
(d) ψ ∈ C ∞ (A) `e detto vettore di unicit` a per A, se l’operatore A Dψ `e essenzialmente autoaggiunto come operatore nello spazio di Hilbert Hψ := Dψ , dove Dψ `e il sottospazio di H delle combinazioni lineari (finite) vettori An ψ con n = 0, 1, 2 . . . . Se ψ `e un vettore analitico per A, la serie: +∞ ||An ψ|| n t , n! n=0
converge per qualche t > 0. Allora, per i noti teoremi di convergenza sulle serie di potenze, converger`a assolutamente ed uniformemente la serie complessa: +∞ ||An ψ|| n z , n! n=0
per ogni z ∈ C con |z| < t. Ulteriormente convergeranno, per |z| < t, anche le serie delle derivate di ogni ordine, cio`e le serie: +∞
||An+p ψ|| n z , n! n=p per ogni fissato p = 1, 2, 3, . . .. Quest’ultimo fatto ha un’importante conseguenza, di verifica immediata usando ripetutamente la disuguaglianza triangolare e la propriet` a di omogeneit` a della norma. Proposizione 5.44. Se ψ `e un vettore analitico per A operatore nello spazio di Hilbert H, allora tutti vettori in Dψ sono vettori analitici per A. Pi` u precisamente, se la serie: +∞ ||An ψ|| n t , n! n=0 converge per t > 0 e φ ∈ Dψ , allora la serie: +∞ n=0
||An φ|| n s , n!
converge per ogni s ∈ C con |s| < t. Vale infine la seguente proposizione nota anche come Lemma di Nussbaum. Proposizione 5.45. (“Lemma di Nussbaum”.) Sia A operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori di unicit` a le cui combinazioni lineari formano un insieme denso in H, allora A `e essenzialmente autoaggiunto.
228
5 Operatori non limitati con domini densi in spazi di Hilbert
Dimostrazione. Per il teorema 5.18, `e sufficiente provare che gli spazi Ran(A± iI) sono densi. Nelle ipotesi fatte, dati φ ∈ H e > 0, ci sar`a una combinazione N lineare finita di vettori di unicit` a ψi con ||φ − i=1 αi ψi || < /2. Dato che ψi ∈ Hψ e A Dψ `e essenzialmente autoaggiunto in tale spazio di Hilbert, per (c) del teorema 5.18, esistono vettori ηi ∈ Hψ con ||(A Dψ +iI)ηi − ψi || ≤ −1 N N N |α | . Allora, posto η := /2 j j=1 i=1 αi ηi e ψ := i=1 αi ψi , vale η ∈ D(A) e ||(A + iI)η − φ|| ≤ ||(A Dψ +iI)η − ψ|| + ||φ − ψ|| < . Dato che > 0 `e arbitrario, abbiamo che Ran(A + iI) `e denso. La prova per il caso Ran(A − iI) `e analoga. Per (c) del teorema 5.18, A `e essenzialmente autoaggiunto. La proposizione precedente permette di dimostrare il teorema di Nelson la cui dimostrazione, come preannunciato, richiede alcuni risultati di teoria spettrale per operatori autoaggiunti non limitati che vedremo nei capitoli 8 e 9, ma che sono indipendenti dal teorema di Nelson stesso. Teorema 5.46. (Criterio di Nelson.) Sia A un operatore simmetrico nello spazio di Hilbert H. Se D(A) contiene un insieme di vettori analitici per A le cui combinazioni lineari finite sono dense in H, allora A `e essenzialmente autoaggiunto. Dimostrazione. Per la proposizione 5.45 `e sufficiente provare che, nelle ipotesi fatte, ogni vettore analitico ψ0 per A `e anche vettore di unicit` a per A. Notiamo che A Dψ0 `e sicuramente un operatore simmetrico in Hψ0 := Dψ0 , dato che `e hermitiano e il suo dominio `e denso in Hψ0 . Supponiamo che A Dψ0 ammetta un’estensione autoaggiunta B in Hψ0 . (Nota: stiamo parlando di estensioni autoaggiunte di A Dψ0 nello spazio di Hilbert Hψ0 , non in H!) Sia μψ la misura spettrale di ψ ∈ Dψ0 rispetto alla PVM dello sviluppo spettrale di (B) B (cfr (c) in teorema 8.30 e teorema 9.9) definita come μψ (E) := (ψ|PE ψ) (B) per ogni insieme di Borel E ⊂ σ(B) ⊂ R, dove PE `e la misura a valori di proiezione associata all’operatore autoaggiunto B. Dato che ψ0 `e analitico: +∞ n=0
||An ψ0 || n t0 < +∞ n!
per qualche t0 > 0.
Quindi, per quanto detto nell’osservazione 5.41, +∞ n=0
||An ψ|| n t < +∞ per ogni t < t0 con t ≥ 0. n!
Se z ∈ C e 0 < |z| < t0 allora:
n +∞ +∞ n
z n
z
x dμψ (x) =
1 · |xn |dμψ (x)
n!
n! σ(B) n=0 σ(B) n=0
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte +∞ n t0 ≤ n! n=0
=
1/2 dμψ (x)
229
1/2 2n
x dμψ (x)
σ(B)
σ(B)
+∞ n +∞ tn t0 0 ||ψ|| ||B n ψ|| = ||ψ|| ||An ψ|| < +∞ , n! n! n=0 n=0
dove abbiamo usato le propriet` a in (c) del teorema 9.4 rispetto alla misura spettrale P (B) dello sviluppo spettrale di B (teorema spettrale 9.9). Il teorema di Fubini-Tonelli implica che, se 0 < |z| < t0 , possiamo scambiare il simbolo di serie con quello di integrale nell’integrale di partenza con l’integrando senza valore assoluto: +∞ +∞ n zn n z n x = x dμψ (x) . n! σ(B) n=0 n! n=0 σ(B) Allora, se 0 ≤ |z| < t0 e se ψ appartiene al dominio di ezB (cfr definizione 9.10) +∞ n z n (ψ|ezB ψ) = x dμψ (x) ezx dμψ (x) = σ(B) σ(B) n=0 n! =
+∞ n=0
zn n!
xn dμψ (x) = σ(B)
+∞ n z (ψ|An ψ) . n! n=0
In particolare ci`o accade sicuramente se z = it (con |t| < t0 ) dato che il dominio di eitB `e tutto lo spazio di Hilbert per il corollario 9.5: (ψ|eitB ψ) =
+∞ (it)n (ψ|An ψ) . n! n=0
(5.36)
(Si osservi che la serie a secondo membro `e una serie di potenze e pertanto essa converge in un disco aperto di raggio t0 , ci` o definisce un prolungamento analitico della funzione a primo membro per it rimpiazzato da z in tale disco anche se ψ non appartiene al dominio di ezB .) Consideriamo un’altra estensione autoaggiunta di ADψ0 , B . Ripetendo i ragionamenti di sopra troviamo che, per |t| < t0 : +∞ (it)n (ψ|eitB ψ) = (5.37) (ψ|An ψ) . n! n=0 (5.36) e (5.37) implicano che, per ogni |t| < t0 e per ogni ψ ∈ Dψ0 :
(ψ|(eitB − eitB )ψ) = 0 . Dato che Dψ0 `e uno spazio denso in Hψ0 , concludiamo che (vedi l’esercizio svolto 3.10), per ogni |t| < t0 :
eitB = eitB .
230
5 Operatori non limitati con domini densi in spazi di Hilbert
Calcolando la derivata in senso forte per t = 0, per il teorema di Stone (teorema 9.25), risulta che (si tenga conto del fatto che t0 > 0 per ipotesi): B = B . Concludiamo che tutte le eventuali estensioni autoaggiunte di A Dψ coincidono. Mostriamo che esiste almeno un’estensione autoaggiunta. Definiamo C : Dψ0 → Hψ0 come: C:
N n=0
an An ψ0 →
N
an An ψ0 .
n=0
Si prova facilmente che C si estende in modo unico ad una coniugazione su Hψ0 , che indicheremo ancora con C (vedi l’esercizio 5.15). Inoltre, per costruzione CA Dψ0 = A Dψ0 C, per cui A Dψ0 ha estensioni autoaggiunte per il teorema 5.42. In conclusione, per ogni vettore analitico ψ0 , A Dψ0 deve essere essenzialmente autoaggiunto in Hψ0 per il teorema 5.37, perch´e `e simmetrico ed ammette esattamente un’estensione autoaggiunta. Abbiamo in questo modo provato che ogni vettore analitico ψ0 `e anche vettore di unicit` a per A. Questo conclude la dimostrazione. Esempi 5.47. (1) Un esempio tipico nel quale applicare il criterio di von Neumann, `e il caso dell’operatore di rilevanza fondamentale in Meccanica Quantistica: H := −Δ + V dove Δ `e il solito operatore laplaciano su Rn : n ∂2 Δ := , ∂x2i i=1
e V `e una funzione localmente integrabile a valori reali. Se definiamo il dominio di H come D(Rn ), risulta subito che H `e un operatore simmetrico su L2 (Rn , dx). Definendo C come l’operatore antiunitario che associa ad ogni funzione f ∈ L2 (Rn , dx) la funzione che punto per punto assume i valori complessi coniugati di f, `e chiaro che vale CH = HC, per cui H ammette estensioni autoaggiunte. Precisando meglio la natura di V si riesce a provare che H `e essenzialmente autoaggiunto, come vedremo alla fine del capitolo 9. ∂ (2) L’operatore Ai := −i ∂x definito su D(Rn ) (vedi proposizione 5.28), come i sappiamo `e essenzialmente autoaggiunto, quindi ammette estensioni autoaggiunte. Esiste una coniugazione C che commuti con Ai ? (Si noti che potrebbe anche non esistere). La coniugazione usata in (1) non commuta con Ai malgrado ammetta il suo dominio come spazio invariante. Un’altra coniugazione `e C : L2 (Rn , dx) → L2 (Rn , dx) definita da: (Cf)(x) := f(−x) (quasi ovunque) ` facile verificare che C(D(Rn )) ⊂ D(Rn ) e che per ogni f ∈ L2 (Rn , dx). E CAi = Ai C.
5.4 Criteri di esistenza e unicit` a per le estensioni autoaggiunte
231
(3) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx) dove dx `e la solita d misura di Lebesgue, e i consideri A := i dx con dominio dato dallo spazio del1 le funzioni C ([0, 1]) (cio`e funzioni di classe C 1 ((0, 1)) che ammettono limiti finiti per la derivata prima in 0 e 1), che si annullano in 0 e in 1. Si verifica immediatamente che l’operatore `e hermitiano, usando l’integrazione per parti e tenendo conto che le funzioni si annullano agli estremi di integrazione annullando i termini dovuti al bordo. Inoltre si pu` o verificare che il dominio di A `e effettivamente denso, per cui l’operatore A `e simmetrico. Mostriamo che A non `e essenzialmente autoaggiunto. Infatti, la condizione che g ∈ D(A∗ ) soddisfi A∗ g = ig ovvero A∗ g = −ig si scrive rispettivamente: 0
1
g(x) [f (x) ± f(x)] dx = 0
per ogni f ∈ D(A). Usando l’integrazione per parti, si verifica immediatamente che, le funzioni di L2 ([0, 1], dx) definite da g(x) = ex e g(x) := e−x , soddisfano l’identit` a di sopra per ogni f di classe C 1 ([0, 1]) che si annulli in 0 e in 1. Queste due ultime condizioni sono fondamentali per verificare l’identit` a di sopra integrando per parti, in quanto le due funzioni esponenziali non si annullano in 0 e 1. In virt` u del teorema 5.18, A non `e essenzialmente autoaggiunto. Tuttavia esistono estensioni autoaggiunte a causa del teorema 5.37. Infatti la trasformazione antilineare C : L2 ([0, 1], dx) → L2 ([0, 1], dx) definita da (Cf)(x) := f(1 − x) manda funzioni C 1 ([0, 1]) che si annullano in 0 e 1 in funzioni C 1 ([0, 1]) che si annullano in 0 e 1 ed inoltre:
d d d d Ci f (x) = −i f(1 − x) = i f(1 − x) = i (Cf)(x) dx d(1 − x) dx dx per cui CA = AC. Tali estensioni devono essere in numero maggiore di 1, altrimenti A sarebbe essenzialmente autoaggiunto per il teorema 5.35, cosa che sappiamo essere falsa. Si osservi che i risultati ottenuti non cambierebbero considerando differenti domini analoghi a quello usato sopra, in particolare considerando come dominio quello delle funzioni C ∞ ([0, 1]) che si annullano in 0 e 1, oppure quello delle funzioni C ∞ su [0, 1] a supporto compatto contenuto in (0, 1). (4) Si consideri lo spazio di Hilbert H := L2 ([0, 1], dx), dove dx `e la solita d misura di Lebesgue, e si consideri A := −i dx con dominio dato dallo spazio delle funzioni C ∞ ([0, 1]) periodiche e con derivate di ogni ordine periodiche, di periodo [0, 1]. L’integrazione per parti prova immediatamente che A `e hermitiano. Le funzioni esponenziali en (x) := ei2πnx, per x ∈ [0, 1], con n ∈ Z formano una base hilbertiana di H come segue da (1) in esempi 3.33. Queste funzioni sono tutte contenute in D(A), per cui, essendo lo spazio generato da
232
5 Operatori non limitati con domini densi in spazi di Hilbert
esse denso in H, D(A) `e denso in H e quindi A `e simmetrico. Ogni f ∈ H `e in corrispondenza biunivoca con la successione dei coefficienti di Fourier {fn }n∈Z ⊂ 2 (Z) dello sviluppo: f = fn en . n∈Z
Abbiamo in tal modo definito un operatore unitario U : H → 2 (Z) tale che U : f → {fn }n∈Z (vedi teorema 3.29). Dalla teoria elementare delle serie di Fourier si verifica facilmente che: U D(A)U −1 =: D(A ) `e lo spazio delle successioni {fn } di 2 (Z) tali che, per ogni N ∈ N, nN |fn | → 0 per n → +∞. Inoltre, se A := U AU −1 e {fn }n∈Z ∈ D(A ), A : {fn }n∈Z → {2πnfn }n∈Z . Ragionando come per l’operatore Xi nella prova della proposizione 5.22, si verifica subito che:
D(A∗ ) = {gn }n∈Z ⊂ 2 (Z) |2πngn |2 < +∞
n∈Z
e, su questo dominio:
A∗ : {fn } → {2πnfn } .
Procedendo come nella prova della proposizione 5.22, si verifica subito che l’aggiunto di questo operatore coincide con l’operatore stesso. Quindi A∗ `e autoaggiunto e A `e essenzialmente autoaggiunto. Dato che U `e unitaria, concludiamo (lo si provi in dettaglio) che anche A `e essenzialmente autoaggiunto e che per la sua unica estensione autoaggiunta A, vale A = U A U −1 . (5) L’esempio (4) pu` o essere trattato molto pi` u rapidamente con il criterio di Nelson. Il dominio di A contiene le funzioni en le cui combinazioni lineari sono dense in H := L2 ([0, 1], dx). Vale anche Aen = 2πnen , per cui: +∞ k=0
+∞
||Ak en || k (2πn)k k t = (t) = e2πnt < +∞ , k! k! k=0
per ogni t > 0. Quindi A `e essenzialmente autoaggiunto.
Esercizi 5.1. Sia A un operatore nello spazio di Hilbert H con dominio denso D(A). Siano α, β ∈ C e si consideri il dominio naturale D(αA+βI) := D(A). Provare che: (i) αA + βI : D(αA + βI) → H ammette aggiunto e (αA + βI)∗ = αA∗ + βI .
Esercizi
233
(ii) αA + βI `e hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto se e solo se A `e, rispettivamente, hermitiano, simmetrico, autoaggiunto, essenzialmente autoaggiunto. (iii) αA + βI `e chiudibile se e solo se A `e chiudibile ed in tal caso vale: αA + βI = αA + βI . Suggerimento. Applicare direttamente le definizioni necessarie. 5.2. Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che, se A + B : D(A) ∩ D(B) → H `e densamente definito, allora: A∗ + B ∗ ⊂ (A + B)∗ . 5.3. Siano A e B operatori nello spazio di Hilbert H densamente definiti. Provare che, se il dominio naturale D(AB) `e densamente definito, allora AB : D(AB) → H ammette aggiunto e: B ∗ A∗ ⊂ (AB)∗ . 5.4. Sia A un operatore nello spazio di Hilbert H densamente definito e L : H → H un operatore limitato. Provare, applicando la definizione di aggiunto, che vale la relazione: (LA)∗ = A∗ L∗ . Dimostrare infine che vale la relazione: (L + A)∗ = L∗ + A∗ . 5.5. Sia A operatore simmetrico sullo spazio di Hilbert H. Provare che, se A : D(A) → H `e biettivo, allora `e autoaggiunto. (Tenere conto del fatto che, come si dimostra dal teorema spettrale per operatori autoaggiunti non limitati, che vedremo pi` u avanti, l’inverso di un operatore autoaggiunto (quando esiste) `e autoaggiunto.) Soluzione. Se A `e simmetrico lo `e A−1 : H → D(A). Questo `e definito su tutto lo spazio di Hilbert per cui `e autoaggiunto. Il suo inverso sar` a a sua volta autoaggiunto. 5.6. Nel seguito se A `e un operatore su H, il commutante {A} `e l’insieme degli operatori di B(H) per cui BA ⊂ AB. Sia A : D(A) → H operatore nello spazio di Hilbert H. Provare che se D(A) `e denso e A `e chiuso, allora {A} ∩ {A∗ } `e una sotto ∗-algebra di B(H) con unit` a ed `e chiusa rispetto alla topologia forte. Dimostrare che se A `e autoaggiunto ed `e definito su tutto H, allora l’algebra di von Neumann ({A} ) coincide con l’algebra di von Neumann generata da {A} nel senso di (3) in esempi 3.42. 5.7. Dimostrare la proposizione 5.14.
234
5 Operatori non limitati con domini densi in spazi di Hilbert
5.8. Si studi l’hermiticit` a, la simmetria e l’essenziale autoaggiunzione nello spazio di Hilbert H = L2 ([0, 1], dx), dell’operatore −d2 /dx2 , con dominio dato dalle funzioni C ∞ ([0, 1]) e (i) periodiche oppure, (ii) che si annullano agli estremi. 5.9. Si dimostri che le estensioni autoaggiunte dell’operatore nell’esempio (3) in esempi 5.47 sono parametrizzabili da un unico parametro reale. Suggerimento. Si studino le dimensioni di Ker(A∗ ± iI) = Ran(A ∓ iI). 5.10. Dimostrare che l’operatore in L2 (R, dx) dato da: H := −
d2 + x2 . dx2
` essenzialmente autoaggiunto se D(H) := S(R). E Suggerimento. Cercare una base hilbertiana di L2 (R, dx) fatta di autovettori di H. 5.11. Si consideri l’operatore di Laplace in Rn gi`a considerato in (1) in esempi 5.47: n ∂2 Δ := . ∂x2i i=1 Si dimostri esplicitamente che Δ `e essenzialmente autoaggiunto sullo spazio di Schwartz S(Rn ) nello spazio di Hilbert L2 (Rn , dx) e dunque ammette una sola estensione autoaggiunta Δ. Si provi infine che, se F : L2 (Rn , dx) → L2 (Rn , dk) `e la trasformata di FourierPlancherel (vedi sezione 3.6), vale: FΔF−1 f (k) := −k 2 f(k) , dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
2 n 4 2
f ∈ L (R , dk) k |f(k)| dk < +∞ . Rn
Suggerimento. L’operatore Δ `e simmetrico su S(R3 ), pertanto possiamo usare il teorema 5.18 verificando la validit`a della condizione (b). Notando che lo spazio di Schwartz `e invariante sotto l’azione dell’operatore unitario F dato dalla trasformata di Fourier-Plancherel come provato nella sezione 3.6, possia := FΔF −1 . mo studiare la condizione (b) del teorema 5.18 per l’operatore Δ 3 Tale operatore `e essenzialmente autoaggiunto su S(R ) se e solo se lo `e Δ su sulle funzioni di S(Rn ), si riduce alla semplice moltipliS(R3 ). L’azione di Δ cazione per −k 2 = −(k12 +k22 +. . .+kn2 ) che definisce, come si prova subito, un operatore autoaggiunto sul dominio naturale suddetto. La condizione (b) del
Esercizi
235
∗ usando la stessa teorema 5.18 pu`o allora essere verificata facilmente per Δ n n definizione di aggiunto ed il fatto che S(R ) ⊃ D(R ). L’unicit` a dell’estensione autoaggiunta per operatori essenzialmente autoaggiunti prova l’ultima parte dell’esercizio tenendo conto del fatto che F `e un operatore unitario. 5.12. Ricordando che D(Rn ) indica lo spazio delle funzioni complesse infinitamente differenziabili a supporto compatto su Rn , in riferimento all’esercizio precedente ed indicando con Δ l’unica estensione autoaggiunta di Δ : S(Rn ) → L2 (Rn , dx), mostrare che D(Rn ) `e un core per Δ. In altre parole ΔD(Rn ) `e essenzialmente autoaggiunto e ΔD(Rn ) = Δ. Suggerimento. Per provare quanto richiesto basta dimostrare che (ΔD(Rn ) )∗ = Δ (perch´e da ci`o segue che, prendendo l’aggiunto, ΔD(Rn ) = ∗ ((Δ D(Rn ) )∗ )∗ = Δ = Δ). Per provare l’identit` a detta notiamo che se ∗ ψ ∈ D((ΔD(Rn ) ) ) allora, per ogni ϕ ∈ D(Rn ), deve valere: (Δϕ|ψ) = (ϕ|ψ ), dove ψ = (Δ D(Rn ) )∗ ψ ∈ L2 (Rn , dx). Passando in trasformata di FourierPlancherel si vede subito che, nelle ipotesi fatte, Fψ = −k 2 Fψ, dato che n F(D(R )) `e denso in L2 (Rn , dk). Abbiamo ottenuto che ψ ∈ D(Δ) e ψ = Δψ e quindi: (Δ D(Rn ) )∗ ⊂ Δ. Supponiamo viceversa che ψ ∈ D(Δ). In questo caso, passando in trasformata di Fourier-Plancherel −k 2 Fψ ∈ L2 (Rn , dk) e, per ogni ϕ ∈ D(Rn ) possiamo scrivere: (Δϕ|ψ) = − dkk 2 (Fϕ)Fψ = − dk(Fϕ)k 2 Fψ = (ϕ|Δψ). Per definizione di operatore aggiunto abbiamo trovato che: ψ ∈ D((Δ D(Rn ) )∗ ) e (Δ D(Rn ) )∗ ψ = Δψ. Abbiamo con ci`o provato che vale anche l’altra inclusione: (ΔD(Rn ) )∗ ⊃ Δ. 5.13. Ricordiamo che se A `e un operatore su H, allora il commutante {A} `e l’insieme degli operatori di B(H) tali che BA ⊂ AB. Sia A : D(A) → H autoaggiunto. Sia T la trasformata di Cayley di A. Provare che ({A} ) generata da A coincide con l’algebra di von Neumann ({T } ) generata da {T } (vedi (3) in esempi 3.42). 5.14. Dimostrare la proposizione 5.44. 5.15. Dimostrare che se A : D(A) → H `e un operatore simmetrico sullo spazio di Hilbert H e ψ ∈ C ∞(A) `e tale che le combinazioni lineari finite di vettori An ψ, n ∈ N, sono dense in H, allora la richiesta che, per ogni scelta di N = 0, 1, 2, . . . e an ∈ C, C:
N n=0
an An ψ →
N
an An ψ
n=0
individua una coniugazione C : H → H (definizione 5.38). Traccia di soluzione. prima cosa da provare `e che C `e ben definita coLa N N1 N me funzione, cio`e che, se n=0 an An ψ = n=0 an An ψ allora n=0 an An ψ =
236
5 Operatori non limitati con domini densi in spazi di Hilbert
N1 Ψ
an An ψ. Per provare n=0 M = m=0 bm Am ψ, vale:
ci`o, basta osservare che, nelle ipotesi dette se
N N
1
n n ψ an A Ψ = ψ an A Ψ per cui
n=0
N n=0
n=0
N
1
n n an A ψ Ψ = an A ψ Ψ .
n=0
N n Dato che i vettori Ψ formano un insieme denso, segue che n=0 an A ψ = N1 n n=0 an A ψ come si voleva. Per costruzione si verifica che se Ψ e Ψ sono della forma detta sopra: (CΨ |CΨ ) = (Ψ |Ψ ). Dato che i vettori Ψ sono densi in H e che ||CΨ || = ||Ψ ||, si prova immediatamente che C si estende per continuit`a e antilinearit` a a tutto H. Tale operatore antilineare soddisfa (CΨ |CΨ ) = (Ψ |Ψ ) su tutto H ed `e suriettivo, come si ottiene estendendo per continuit`a la relazione CCΨ = IΨ .
Parte II
Teoria Spettrale e formalismo della Meccanica Quantistica
6 Brevi cenni di fenomenologia dei sistemi quantistici e di Meccanica Ondulatoria Ci sono soltanto due possibili conclusioni: se il risultato conferma le ipotesi, allora hai appena fatto una misura. Se il risultato `e contrario alle ipotesi, allora hai fatto una scoperta. Enrico Fermi
In questo capitolo cercheremo di fornire qualche idea generale riguardo a cosa si intenda per sistema quantistico e per fenomenologia quantistica. Le parti successive alla prima sezione di questo capitolo possono essere tralasciate dal lettore pi` u matematico, non interessato alla genesi dei concetti fisici della MQ. In tali paragrafi passeremo rapidamente ad enunciare in modo piuttosto sommario alcuni dei fatti sperimentali e dei modelli teorici “proto quantistici” che hanno infine condotto alla formulazione prima della meccanica ondulatoria e poi della MQ vera e propria. Molti dettagli fisici si possono trovare in [CCP82]. Ometteremo completamente ogni discussione su alcune importanti tappe di questo percorso storico: spettroscopia atomica, modelli atomici (Rutherford, Bohr, Bohr-Sommerfeld), esperimento di Franck-Hertz, per i quali si rimanda a testi di fisica (es. [CCP82]). Il nostro succinto sommario metter`a solo a giustificare il modello di base per la teoria matematica della MQ che svilupperemo nei prossimi capitoli. Notazione 6.1. In questo capitolo e a volte nei successivi, come di consueto nelle trattazioni di fisica, indicheremo i vettori dello spazio tridimensionale (identificabile con R3 una volta fissato un sistema di riferimento), con le lettere in grassetto: x. Nello stesso modo la misura di Lebesgue in R3 sar`a indicata con d3 x.
6.1 Generalit` a sui sistemi quantistici ` Usiamo qui la parola sistema fisico in senso molto generico e discorsivo. E molto difficile definire dal punto di vista fisico cosa sia un sistema quantistico. Possiamo cominciare a dire che pi` u di sistema fisico quantistico pi` u opportuno parlare di sistema fisico dal comportamento quantistico, distinguendo tali sistemi fisici da un punto di vista pi` u fenomenologico-sperimentale che teorico. All’interno della formulazione teorica della meccanica quantistica non esiste Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
240
6 Fenomenologia quantistica
una precisa demarcazione tra sistemi classici e sistemi quantistici, se non una demarcazione imposta del tutto “a mano”, e tale questione `e oggi, ancora di pi` u che in passato, oggetto di discussione ed attivit`a di ricerca teorica e sperimentale. Parlando in modo del tutto generico, possiamo dire che hanno comportamento quantistico i sistemi della microfisica, cio`e molecole, atomi, nuclei e particelle subnucleari quando presi individualmente o a piccoli numeri. Sistemi fisici costituiti da pi` u copie di tali sottosistemi (per esempio cristalli ) possono avere a loro volta comportamento quantistico. Alcuni sistemi macroscopici hanno comportamento tipicamente quantistico solo in determinate condizioni difficili da realizzare (es. condensazione di Bose-Einstein, L.A.S.E.R.). In modo leggermente pi` u preciso della rozza distinzione tra microsistemi e macrosistemi esposta sopra, possiamo dire che, generalmente parlando, quando un qualsiasi sistema fisico si comporta quantisticamente l’azione caratteristica del sistema, cio`e il numero dalle dimensioni fisiche di Energia × Tempo (equivalentemente Quantit` a di Moto × Lunghezza ovvero Momento angolare) ottenuto combinando opportunamente le dimensioni fisiche caratteristiche del sistema (es. massa, velocit`a, dimensioni lineari ecc...) nei processi considerati `e dell’ordine o inferiore al valore della costante di Planck: h = 6.6262 · 10−34Js. La costante di Planck e la parola quantum che caratterizza il nome della MQ vennero introdotte per la prima volta da Planck nel 1900 nel suo lavoro sulla teoria del corpo nero, per eliminare il problema dell’energia totale, teoricamente infinita, di un sistema fisico costituito da radiazione elettromagnetica in equilibrio termodinamico con le pareti di una cavit` a tenuta ad una temperatura fissata. La sua ipotesi teorica, rivelatasi poi esatta, prevedeva che la radiazione in potesse scambiare energia con le pareti in quantit` a proporzionali alle frequenza degli oscillatori atomici nelle pareti, la cui costante universale di proporzionalit` a era proprio la costante di Planck suddetta. Tali quantit` a di energia vennero chiamate in latino quanta, quanti in italiano. Tornando al criterio per discriminare i sistemi quantistici da quelli classici usando la costante h, consideriamo per esempio un elettrone legato ad un nucleo di idrogeno. Un’azione caratteristica dell’elettrone si ottiene come, per esempio il prodotto della massa dell’elettrone (∼ 9 · 10−31 Kg), per una stima della velocit`a intorno al nucleo (∼ 106 m/s) per il valore del raggio di Bohr dell’atomo di idrogeno (∼ 5 · 10−11m). Il calcolo fornisce un’azione caratteristica dell’ordine di 4.5·10−35Js pi` u piccolo dunque della costante di Planck. Ci si aspetta quindi che l’elettrone nell’atomo abbia comportamento quantistico, come infatti accade. Si pu` o fare un calcolo analogo per sistemi fisici macroscopici come per esempio un pendolo di massa di qualche grammo e lunghezza dell’ordine del centimetro che oscilla sottoposto alla forza di gravit`a. Un’azione caratteristica di questo sistema pu`o essere definita come il prodotto dell’energia cinetica massima per il periodo di oscillazione. Si trovano, per il sistema in questio-
6.2 Alcune propriet` a particellari delle onde elettromagnetiche
241
ne valori dell’azione caratteristica di moltissimi ordini di grandezza superiori ad h. Osservazione 6.2. Una delle propriet`a peculiari dei sistemi quantistici `e il fatto che l’insieme, in gergo lo spettro, dei valori assumibili dalle grandezze fisiche che caratterizzano gli stati di un sistema quantistico, come l’energia, `e generalmente diverso dallo spettro dei valori delle stesse grandezze valutate su sistemi macroscopici analoghi. In certi casi, la differenza `e sorprendente perch´e si passa da uno spettro continuo di valori possibili nel caso classico, ` importante per` ad uno spettro discreto, nel caso quantistico. E o precisare la discretezza dello spettro dei valori assumibili da una generica grandezza fisica quantistica non `e una caratteristica necessaria in MQ: esistono grandezze quantistiche con spettro di valori continuo anche in MQ. Questo fraintendimento `e all’origine o, a volte, conseguenza di una delle interpretazioni pi` u frequenti, ma riduttiva, dell’aggettivo quantistica nella parola Meccanica Quantistica.
6.2 Alcune propriet` a particellari delle onde elettromagnetiche Le onde elettromagnetiche (e quindi in particolare la luce), in particolari circostanze sperimentali, rivelano comportamenti tipici di insiemi di particelle. Nella descrizione matematica di tali comportamenti classicamente anomali `e coinvolta la costante di Planck. Possiamo citare due esempi di comportamento classicamente anomalo, che hanno svolto un ruolo fondamentale nello sviluppo iniziale della MQ per i corrispondenti modelli teorici proto quantistici, costruiti nel tentativo di darne una spiegazione: l’effetto fotoelettrico e l’effetto Compton. 6.2.1 Effetto Fotoelettrico L’effetto fotoelettrico riguarda l’emissione di elettroni (corrente elettrica) da parte di metalli in seguito ad illuminazione con un’onda elettromagnetica. Tale effetto era noto dalla prima met`a del secolo XIX e alcune sue caratteristiche risultavano del tutto inspiegabili alla luce della teoria classica dell’interazione onde elettromagnetica e materia [CCP82]. In particolare era inspiegabile la presenza di un valore minimo della frequenza della luce usata per irraggiare il metallo, al di sotto del quale non si ha emissione elettronica. Il valore di tale soglia dipende dal metallo usato. Una volta raggiunta la soglia, l’istantaneit` a del processo di emissione era del tutto inspiegabile. Secondo la teoria classica l’emissione di elettroni dovrebbe apparire indipendentemente dalla frequenza usata pur di aspettare un tempo sufficientemente lungo, in modo da fare assorbire agli elettroni del metallo energia sufficiente da vincere l’energia di legame con gli atomi.
242
6 Fenomenologia quantistica
Nel 1905 A. Einstein propose un modello, per l’epoca molto ardito, che rendeva conto di tutte le propriet` a anomale dell’effetto fotoelettrico1 e con una precisione notevole in riferimento ai dati sperimentali. Seguendo Planck, l’ipotesi centrale di Einstein era che un onda elettromagnetica monocromatica, cio´e con frequenza definita, che indicheremo con ν, fosse in realt`a costituita da particelle materiali, dette quanti di luce, ciascuna dotata di energia: E = hν .
(6.1)
In tale modello l’energia totale dell’onda elettromagnetica sarebbe quindi stata pari alla somma delle energie dei singoli quanti di luce. Tutto ci` o era ed `e in contrasto totale con la teoria dell’elettromagnetismo classico, in cui un’onda elettromagnetica `e un sistema continuo, la cui energia `e proporzionale all’ampiezza dell’onda invece che alla frequenza. Quello che dunque sarebbe dovuto accadere nell’effetto fotoelettrico, secondo il modello di Einstein, `e che, illuminando il metallo con un onda monocromatica, ciascuno dei pacchetti energetici associati all’onda potesse essere assorbito da un elettrone del metallo e trasformato in energia cinetica. Pi` u precisamente l’ipotesi di Einstein per spiegare la fenomenologia sperimentale, era che il pacchetto potesse essere o assorbito completamente oppure non assorbito affatto, senza possibilit` a di assorbimenti parziali. Se, e solo se, l’energia del quanto fosse stata uguale o superiore all’energia dell’elettrone di legame con il metallo E0 (dipendente dal metallo e misurabile indipendentemente dall’effetto fotoelettrico), l’elettrone sarebbe stato istantaneamente espulso, trasformando in energia cinetica l’eventuale energia in eccesso del quanto assorbito. La frequenza ν0 := E0 /h avrebbe individuato cos`ı la soglia sulla frequenza osservata sperimentalmente. Tale ipotesi si rivel`o in perfetto accordo con dati sperimentali. 6.2.2 Effetto Compton L’osservazione e lo studio dell’effetto Compton risalgono al 1923. Esso riguarda la diffusione di onde elettromagnetiche monocromatiche di altissima frequenza – raggi X (> 1017Hz) e raggi γ (> 1018 Hz) – da parte di materia estesa ` utile ricordare nel seguito che le onde elettroma(gas, liquidi e solidi). E gnetiche monocromatiche hanno sia frequenza che lunghezza d’onda fissate, per cui nel seguito ci riferiremo anche alla loro lunghezza d’onda. Schematizzando al massimo, l’effetto sperimentale consiste in questo. Irraggiando la sostanza (che diremo ostacolo) con un’onda elettromagnetica monocromatica piana propagantesi nella direzione z con lunghezza d’onda λ nota, si osserva un’onda diffusa dall’ostacolo con diverse componenti (cio`e diverse lunghezze d’onda o frequenze). Una componente `e diffusa in tutte le direzioni ed ha la stessa lunghezza d’onda della radiazione incidente, l’altra componente ha una lunghezza d’onda leggermente superiore a λ, λ(θ) che dipende dall’angolo di 1
Einstein ricevette il Premio Nobel per la Fisica proprio per tale lavoro.
6.2 Alcune propriet` a particellari delle onde elettromagnetiche
243
osservazione θ. Se pi` u precisamente, θ `e definito come l’angolo tra la direzione di propagazione dell’onda incidente z e la direzione di propagazione dell’onda diffusa oltre l’ostacolo, con lunghezza d’onda λ(θ), misurando θ a partire dall’asse z, vale la relazione: λ(θ) = λ + f (1 − cosθ)
(6.2)
dove la costante f ha le dimensioni di una lunghezza e si ottiene dai dati sperimentali. Il suo valore `e2 f = 0.024(±0.001) ˚ A. Si noti che si ha completa isotropia attorno all’asse z. La teoria elettromagnetica classica era ed `e assolutamente incapace di spiegare un tale fenomeno. Tuttavia, come Compton dimostr`o, il fenomeno poteva essere spiegato assumendo le tre ipotesi seguenti, del tutto incompatibili con la teoria classica, ma in accordo con l’ipotesi dei quanti di luce di Einstein. (a) L’onda elettromagnetica `e costituita da particelle che trasportano energia, esattamente come aveva ipotizzato Einstein, secondo la legge (6.1). (b) Ogni quanto di luce possiede anche un impulso p := k ,
(6.3)
dove k `e il vettore d’onda dell’onda elettromagnetica associata al quanto (vedi sotto). (c) I quanti di luce interagiscano, in un processo d’urto (in generale in regime relativistico), con gli atomi e con gli elettroni pi` u esterni degli atomi dell’ostacolo soddisfacendo le leggi di conservazione dell’impulso e dell’energia. Osservazione 6.3. A commento di (c), ricordiamo che il vettore vettore d’onda k associato ad un onda piana monocromatica ha, per definizione, direzione e verso pari a quello di propagazione dell’onda e modulo dato da 2π/λ, dove λ `e la lunghezza d’onda dell’onda. Equivalentemente, se ν `e la frequenza dell’onda, |k| = 2π/λ = 2πν/c , (6.4) dove si `e usata la ben nota relazione: νλ = c ,
(6.5)
valida per le onde elettromagnetiche monocromatiche ed essendo c = 2.99792 · 108 m/s `e la velocit` a della luce. Possiamo dare qualche dettaglio in pi` u per il lettore interessato. Le leggi di conservazione dell’energia e dell’impulso da usarsi in regime relativistico, cio`e quando (qualcuna) delle velocit` a coinvolte sono dell’ordine di c, si scrivono rispettivamente, nelle ipotesi fatte: me c2 + hν(θ) , 1 − v2 /c2 me v + k(θ) . k = 1 − v2 /c2
me c2 + hν =
2
Ricordiamo che 1 ˚ A= 10−10 m.
(6.6) (6.7)
244
6 Fenomenologia quantistica
A primo membro compaiono le quantit`a precedenti dell’urto a secondo membro quelle successive all’urto. me = 9.1096 · 10−31Kg `e la massa dell’elettrone. L’elettrone `e pensato in quiete prima dell’urto con il quanto di luce. In seguito all’urto, il quanto di luce viene diffuso nella direzione individuata da θ, mentre l’elettrone acquista velocit`a v. Il vettore d’onda precedente all’urto, k, `e quindi nella direzione (generica ma fissata) z mentre il vettore d’onda del quanto di luce dopo l’urto, k(θ), forma un angolo θ con k. Dalla (6.7), tenendo conto della definizione del vettore d’onda, si ricava subito che: m2e c2 h2 ν 2 h2 ν(θ)2 hν hν(θ) = 2 + −2 cos θ . 2 2 1 − v /c c c2 c c Eliminando ν tra la relazione appena ottenuta e la (6.6) si ricava immediatamente ν(θ) = ν −
hνν(θ) (1 − cosθ) . me c2
(6.8)
Tenendo conto della relazione (6.1) e ν = c/λ, si ricava facilmente la (6.2) nella forma: λ(θ) = λ +
h (1 − cosθ) me c
(6.9)
da cui si evince che f = h/(me c), il cui valore numerico coincide proprio con quello ottenuto sperimentalmente quando si sostituiscono i valori numerici di h, me e c. Si osservi anche, che nel limite formale per me → +∞, la (6.9) fornisce λ(θ) → λ. Ci` o porta anche a spiegare la componente dell’onda diffusa isotropicamente senza variazione della lunghezza d’onda (rispetto alla lunghezza d’onda della radiazione incidente), come dovuta a quanti di luce che interagiscono con particelle di massa molto pi` u grande di quella elettronica (un atomo del materiale o tutto l’ostacolo nel suo complesso). Osservazione 6.4. Il modello di Einstein e quello di Compton spiegano perfettamente l’effetto fotoelettrico e la formula (6.2) in termini quantitativi e qualitativi. Tuttavia devono considerarsi come modelli ad hoc, slegati ed addirittura in contrasto con il corpus della fisica teorica dell’epoca: l’idea della costituzione corpuscolare delle onde elettromagnetiche e quindi della luce, come noto dai tempi di Newton e Huygens, non pu` o spiegare effetti ondulatori notissimi della luce quali i fenomeni di interferenza e diffrazione. In qualche modo il modello ondulatorio e quello corpuscolare della luce (onde elettromagnetiche) devono coesistere nella realt` a, ma ci`o non `e possibile nel paradigma della fisica classica. Ci`o invece accade nella formulazione relativistica completa della MQ introducendo il concetto di fotone, particella priva di massa, del quale non ci discuteremo se non con brevi accenni.
6.3 Cenni di Meccanica Ondulatoria
245
6.3 Cenni di Meccanica Ondulatoria In queste dispense non ci occuperemo pi` u delle propriet` a quantistiche della luce che richiederebbero uno sviluppo ulteriore del formalismo della MQ che presenteremo. Le idee esposte sopra sui primi tentativi di descrizione quantistica della luce furono per`o utili, ribaltando il punto di vista, per arrivare alla formulazione della meccanica ondulatoria, il primo passo verso la formulazione della MQ. La meccanica ondulatoria `e una delle due prime versioni un p` o rudimentali della MQ per particelle dotate di massa3 . Nel seguito ci occuperemo molto succintamente di esporre alcune idee portanti della meccanica ondulatoria che mettono in luce alcuni punti fondamentali e generali che useremo per costruire il formalismo proprio della MQ. In particolare tralasceremo alcuni risultati storicamente connessi quali l’equazione stazionaria di Schr¨odinger e la spiegazione, tramite essa, dello spettro energetico dell’atomo di idrogeno. Torneremo pi` u avanti su questi argomenti dopo avere costruito il formalismo. 6.3.1 Onde di de Broglie Un quanto di luce di Einstein e Compton `e associato ad un’onda elettromagnetica piana monocromatica di numero d’onda k = p/ e pulsazione ω = E/, dove lo ricordiamo, la pulsazione `e semplicemente 2π volte la frequenza ν. Ogni componente dell’onda piana elettromagnetica (una componente lungo i tre versori ortogonali del vettore di campo elettrico o magnetico che vibra perpendicolarmente a k) ha allora la forma di un’onda scalare: ψ(t, x) = Aei(k·x−tω) .
(6.10)
In realt` a solo la parte reale dell’onda di sopra ha senso fisico, ma `e pi` u comodo lavorare con onde complesse per vari motivi, in particolare perch`e appaiono nella decomposizione di Fourier (vedi sezione 3.6) di una soluzione generale dell equazioni del campo elettromagnetico (equazioni di Maxwell) e pi` u generalmente dell’equazione di d’Alembert. In termini di impulso e energia del quanto di luce associato, la stessa onda pu` o riscriversi: i
ψ(t, x) = Ae (p·x−tE) .
(6.11)
Dove, lo si noti, compaiono solo l’impulso e l’energia del quanto di luce. Nel 1924 de Broglie fece un’ipotesi estremamente rivoluzionaria: come alle onde elettromagnetiche si associavano delle particelle (fotoni) in certi contesti sperimentali, si dovevano poter associare, viceversa, delle onde di qualche genere alle particelle materiali. Secondo de Broglie, tali onde materiali dovevano avere la stessa forma (6.11) dove ora, per`o, p e E avrebbero dovuto essere, 3 L’altra versione sviluppata parallelamente da Heisenberg consisteva nella cosiddetta meccanica delle matrici [CCP82] che non tratteremo.
246
6 Fenomenologia quantistica
rispettivamente, l’impulso e l’energia (cinetica) della particella materiale. La lunghezza d’onda associata ad una particella di impulso p: λ = h/|p| ,
(6.12)
viene detta lunghezza d’onda di de Broglie della particella. Non era affatto chiara la natura di tali fantomatiche onde, fino al 1927, quando si ebbe evidenza sperimentale di onde associate al comportamento di elettroni, con due distinti esperimenti da parte di Davisson e Germer e, separatamente, G.P. Thompson. Senza entrare nei dettagli degli esperimenti, ` noto che, quando un’onda (elettromagnetica, premettiamo quanto segue. E sonora ecc...) incontra un ostacolo, con una struttura interna di dimensioni tipiche dell’ordine o superiori alla lunghezza d’onda dell’onda incidente, l’onda diffusa dall’ostacolo produce un fenomeno detto diffrazione: le varie parti interne dell’ostacolo agiscono sull’onda creando interferenza costruttiva e distruttiva, in modo che l’onda diffusa proietti, su uno schermo su cui incide, delle figure costituite da zone d’ombra e zone di maggiore intensit` a (cio`e pi` u chiare nel caso di onde luminose). Tali figure si dicono figure di diffrazione. Se l’ostacolo `e un cristallo, dalle figure di diffrazione si pu` o risalire alla struttura interna del cristallo. Davisson, Germer e G.P. Thompson, produssero figure di diffrazione ottenute da fasci di elettroni sparati su cristalli. Pi` u precisamente, le figure di diffrazione si produssero su uno schermo dall’accumularsi delle tracce puntiformi degli elettroni, diffusi da un cristallo di passo reticolare dell’ordine di 1 ˚ A. La peculiarit`a notevole, che corroborava l’ipotesi di de Broglie, era il fatto che che, negli esperimenti detti, le figure di diffrazione apparivano solo se la lunghezza di de Broglie degli elettroni era dell’ordine o inferiore al passo reticolare, esattamente come nel fenomeno della diffrazione prodotto da onde elettromagnetiche. ` importante sottolineare che il fenomeno della diffrazioOsservazione 6.5. E ne `e strettamente dovuto alla natura ondulatoria dell’onda (al fatto che ci sia qualcosa che oscilli ed al principio di sovrapposizione). Non `e possibile produrre figure di diffrazione usando particelle che soddisfino le usuali leggi della meccanica classica, su qualsivoglia ostacolo. 6.3.2 Funzione d’onda di Schr¨ odinger e interpretazione probabilistica di Born Nel 1926, in due famosi e geniali articoli, Schr¨ odinger prese sul serio l’ipotesi di de Broglie e fece un’assunzione pi` u precisa: quella di associare ad una particella materiale, non un’onda piana come (6.11), ma un pacchetto d’onde costituito dalla sovrapposizione (nel senso della trasformata di Fourier, vedi sezione 3.6) di onde piane di de Broglie. Nel caso di particelle libere, cio`e la cui energia `e data dalla sola energia cinetica, l’onda di Schr¨ odinger si scrive: i e (p·x−tE(p)) ˆ ψ(t, x) = (6.13) ψ(p) d3 p , (2π2 )3/2 R3
6.3 Cenni di Meccanica Ondulatoria
247
dove E(p) := p2 /(2m) essendo m la massa della particella. Nei due articoli Schr¨ odinger osserv`o che l’ottica geometrica si basa su un’equazione, detta equazione dell’iconale [CCP82], che ha una struttura formalmente analoga all’equazione di Hamilton-Jacobi [FaMa94, CCP82] per una particella della meccanica classica. Schr¨odinger tent` o allora di determinare un’equazione fondamentale di una meccanica ondulatoria per la materia, rispetto alla quale l’equazione di Hamilton-Jacobi della meccanica giocasse lo stesso ruolo approssimato che equazione dell’iconale (ottica geometrica) gioca rispetto all’equazione di d’Alembert (ottica ondulatoria) [CCP82]. In questo modo pervenne alla notissima equazione di Schr¨ odinger. Noi ricaveremo tale equazione dopo avere costruito il formalismo. Nel caso di una particella soggetta ad una forza dovuta ad un potenziale U , f (t, x) = −∇U (t, x), l’equazione `e: * + ∂ψ(t, x) 2 i = − Δ + U (t, x) ψ(t, x) (6.14) ∂t 2m 3 ∂2 e l’operatore di Laplace in R3 . dove Δ = j=1 ∂x 2 ` j L’onda di de Broglie-Schr¨ odinger ψ, che `e una funzione a valori complessi, venne chiamata funzione d’onda della particella a cui `e associata. L’interpretazione fisica della funzione d’onda ψ – almeno nell’interpretazione standard (“di Copenhagen”) del formalismo della MQ – venne data Born sempre nel 1926: |ψ(t, x)|2 |ψ(t, y)|2 d3 y R3
ρ(t, x) :=
`e la densit` a di probabilit` a di trovare la particella nel punto x al tempo t, quando si esegua un esperimento per determinarne la posizione. L’interpretazione di Born che si rivel` o in accordo con l’esperienza, era gi`a in sostanziale accordo con i risultati degli esperimenti di Davisson, Germer e G.P. Thompson, in cui le tracce delle particelle sullo schermo si addensavano nelle regioni in cui ρ(t, x) > 0 ed erano assenti nelle regioni in cui ρ(t, x) = 0, dando luogo alle figure di diffrazione. Osservazioni 6.6. (1) Dal punto di vista matematico, l’assunzione dell’interpretazione di Born richiede che abbiano senso fisico solo le funzioni d’onda a quadrato sommabile e non quasi ovunque nulle, cio`e gli elementi non nulli di L2 (R3 , d3x): uno spazio di Hilbert entra in gioco per la prima volta, nella costruzione della MQ. (Il fatto che le onde piane di de Broglie non abbiano diretto significato fisico alla luce dell’interpretazione di Born non appartenendo a L2 (R3 , d3 x), `e fisicamente irrilevante. Le onde piane monocromatiche usate per interpretare i risultati sperimentali secondo l’ipotesi di de Broglie possono essere approsˆ simate a piacimento da elementi di L2 (R3 , d3 x) usando distribuzioni ψ(p) strette attorno ad un valore p0 , che determina con l’approssimazione voluta la lunghezza d’onda λ0 = |p0 |/h di de Broglie.)
248
6 Fenomenologia quantistica
(2) Assumendo l’interpretazione di Born si deve concludere che, quando non viene eseguito alcun esperimento per determinarne la posizione, la particella associata alla funzione d’onda ψ, non pu` o evolvere temporalmente secondo le leggi della meccanica classica: se seguisse una traiettoria regolare come prescritto dalla meccanica classica, la funzione |ψ|2 associata dovrebbe essere quasi ovunque nulla fuori dalla traiettoria. Tuttavia avendo ogni traiettoria regolare in R3 misura nulla, |ψ|2 dovrebbe essere nulla quasi ovunque in R3 , portando ad una contraddizione. In altre parole, quando non si esegue un esperimento per determinare la posizione della particella, la particella non deve considerarsi un oggetto classico, ma la sua evoluzione temporale `e descritta dall’evoluzione dell’onda ψ (secondo l’equazione di Schr¨ odinger). (3) Se si ammette, come nell’interpretazione di Copenhagen, che la funzione d’onda ψ sia una descrizione completa dello stato fisico della particella, si deve concludere che la posizione della particella sia fisicamente indefinita prima di eseguire un esperimento che la determini e che venga fissata all’atto dell’esperimento in modo probabilistico. Non `e corretto pensare che l’uso di una descrizione probabilistica sia dovuto ad insufficiente conoscenza dello stato del sistema: “la posizione esiste ma noi non la conosciamo”. Nell’interpretazione di Copenhagen la posizione non esiste fino a quando non si esegue un esperimento per determinarla e lo stato della particella (l’informazione massima sulle sue propriet` a fisiche variabili nel tempo) `e descritto dall’onda ψ. Nella meccanica ondulatoria la particella quantistica ha dunque una duplice natura di onda-corpuscolo, ma le due nature non vengono mai in contrasto perch´e non si manifestano mai contemporaneamente.
6.4 Principio di Indeterminazione di Heisenberg Quando cerchiamo di valutare sperimentalmente il valore di qualsiasi grandezza definita per un sistema fisico, interagendo con esso, possiamo alterare lo stato del sistema. Tuttavia nella descrizione classica, in linea di principio, possiamo rendere piccola a piacere la perturbazione apportata allo stato. Nel 1927 Heisenberg si rese conto che le ipotesi di Planck, Einstein, Compton, de Broglie avevano una conseguenza (anche epistemologica) notevole in questo contesto. In termini quantitativi il principio di Heisenberg stabilisce che, considerando sistemi quantistici e particolari grandezze che si vogliono misurare, non `e sempre possibile rendere piccola a piacere la perturbazione apportata allo stato del sistema dalla procedura di misura: la costante di Planck rappresenta un limite invalicabile per il prodotto delle indeterminazioni di alcune coppie di grandezze. Pi` u precisamente, esaminando vari esperimenti ideali, in cui si assumeva qualcuna delle ipotesi dei modelli di Planck, Einstein, Compton e de Broglie, Heisenberg arriv` o alla conclusione che: cercando di determinare la posizione, o l’impulso, di una particella lungo un fissato asse x, se ne altera l’impulso o, rispettivamente, la posizione, lungo
6.4 Principio di Indeterminazione di Heisenberg
249
lo stesso asse in modo tale che il prodotto della minima larghezza possibile delle due incertezze Δx e Δp con cui, alla fine, risultano essere note le due grandezze soddisfi sempre: ΔxΔp h .
(6.15)
Se la posizione e l’impulso sono valutati lungo assi reciprocamente ortogonali il prodotto delle incertezze pu` o invece essere arbitrariamente piccolo. (6.15) esprime il principio di indeterminazione di Heisenberg per la posizione e l’impulso. Una relazione analoga vale per l’incertezza ΔE con cui `e determinata l’energia E di una particella e l’incertezza Δt con cui si determina il tempo t in cui viene fatta la misura dell’energia4 : ΔEΔt h .
(6.16)
A titolo di esempio consideriamo l’esperimento ideale in cui si cerca di determinare la posizione X di un elettrone di momento inizialmente noto P , illuminandolo con un fascetto di luce monocromatica di lunghezza d’onda λ, che si propaga nella direzione x. Immaginiamo di voler leggere la posizione su uno schermo parallelo all’asse X, tramite una lente interposta tra l’asse X e lo schermo. Un quanto di luce che ha interagito con l’elettrone produrr` a un’immagine X , colpendo schermo dopo avere attraversato la lente. A causa dell’apertura finita della lente, non `e possibile conoscere con esattezza la direzione lungo la quale `e stato diffuso il quanto di luce che produce l’immagine X sullo schermo. Dall’ottica ondulatoria sappiamo che in X si avr`a una figura di diffrazione che permetter` a di raggiungere nella misura della coordinata X una accuratezza non pi` u piccola di: ΔX
λ , sin α
dove α `e il semi angolo sotto il quale da X si vede la lente. Al quanto di luce corrisponde l’impulso h/λ, per cui l’incertezza della componente Px del quanto di luce diffuso sar` a data, approssimativamente, da h(sin α)/λ. L’impulso totale del sistema particella - quanto di luce - microscopio, dovr`a rimanere costante, per cui l’incertezza nella componente x della quantit` a di moto della particella, dopo la diffusione del quanto di luce, dovr` a essere uguale alla corrispondente incertezza per il quanto di luce stesso: ΔPx 4
h sin α . λ
Tale relazione d’indeterminazione ha uno status ed una interpretazione molto pi` u problematici che per le relazioni posizione-impulso e non ne discuteremo qui [CCP82].
250
6 Fenomenologia quantistica
Il prodotto delle due indeterminazioni della particella lungo l’asse x risulta essere dunque, al minimo: ΔXΔPx h . Osservazione 6.7. Il principio di Heisenberg, a questo livello, ha esattamente la stessa (in)consistenza logica dei modelli proto quantistici di Planck, Einstein, Compton... Esso deve essere visto pi` u come una ipotesi di lavoro per costruire una nuova nozione di particella in cui i concetti di posizione ed impulso classici abbiano senso solo entro limiti fissati dal principio stesso: gli stati fisici di una particella quantistica devono essere tali per cui l’impulso o la posizione non siano definite e definibili contemporaneamente. Val la pena di sottolineare che, come vedremo, nella formulazione finale della MQ il principio di Heisenberg diventa un teorema.
6.5 Le grandezze compatibili e incompatibili Indipendentemente dal principio di Heisenberg, la fenomenologia quantistica mostra che ci sono coppie grandezze A e B che risultano essere incompatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a e – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce un risultato a1 generalmente differente da a anche di molto. Lo stesso fenomeno appare scambiando il ruolo di A e B. Coppie di grandezze incompatibili sono in particolare la componente della posizione e dell’impulso lungo un fissato, tali grandezze soddisfano anche il principio di Heisenberg. Questi due fatti sono connessi, ma il legame pu`o essere spiegato chiaramente solo dopo avere costruito il formalismo completo. In generale coppie di grandezze incompatibili non soddisfano il principio di Heisenberg. Risulta che le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e nemmeno che esistono apparati di misura in grado di misurarle contemporaneamente. ` importante sottolineare che la fenomenologia quantistica mostra che esiE stono anche coppie di grandezze A , B compatibili. Questo significa che, se si misura prima la grandezza A sul sistema ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b , una successiva misura di A – vicina temporalmente a piacere a quella di B (in modo da non poter imputare il risultato all’evoluzione temporale) – produce lo stesso risultato a . Lo stesso fenomeno appare scambiando il ruolo di A e B . In particolare ogni grandezza fisica A `e compatibile con se stessa e con ogni funzione di A (per esempio la posizione di una particella lungo una retta ed il quadrato del numero che individua tale posizione.)
6.5 Le grandezze compatibili e incompatibili
251
Un esempio di coppie di grandezze incompatibili che non soddisfano il principio di Heisenberg sono due componenti diverse dello spin di una particella. Lo spin dell’elettrone (e poi di tutte le particelle nucleari e subnucleari) fu introdotto da Goudsmit e Uhlembeck nel 1925 [CCP82] per spiegare alcune propriet` a “anomale”, il cosiddetto effetto Zeeman anomalo, degli spettri energetici (righe spettrali) degli atomi di metalli alcalini. In senso semi classico, lo spin rappresenta il momento angolare intrinseco dell’elettrone che, per certi aspetti, pu`o essere pensato come dovuto ad un incessante moto rotatorio dell’elettrone attorno al proprio centro di massa. Tuttavia questa interpretazione `e fuorviante `e non pu` o essere presa alla lettera. Il significato profondo dello spin pu` o solo essere dato nel contesto della definizione, dovuta a Wigner, di particella elementare quantistica come sistema elementare invariante sotto l’azione del gruppo di Poincar´e. Allo spin `e associato un momento magnetico intrinseco che `e, alla fine, il responsabile dell’effetto Zeeman anomalo osservato. Tuttavia lo spin `e una grandezza vettoriale con caratteristiche peculiari quantistiche, che lo differenziano completamente da un momento angolare classico, e lo fanno rientrare nella categoria dei momenti angolari quantistici. La prima differenza `e nei valori assumibili dal modulo a di misura tali valori sono dello spin. Nell’unit` sempre numeri del tipo s(s + 1) dove s `e un intero fissato dipendente dal tipo di particella, s = 1/2 per l’elettrone. Ciascuna delle tre componenti dello spin, rispetto ad una terna di assi destrorsa ortonormale, pu` o assumere ciascuno dei 2s + 1 valori discreti −s, −s + 1, . . . , s − 1, s. Le tre componenti dello spin risultano essere grandezze fisiche incompatibili nel senso detto sopra: la misurazione alternata, fatta a tempi vicinissimi di due differenti componenti ` dello spin, fornisce valori sempre differenti per tali componenti dello spin. E importante precisare che la stessa incompatibilit`a si ha anche per le componenti del momento angolare orbitale e totale di una particella. Un esempio di coppie di grandezze compatibili per una particella quantistica sono la componente x dell’impulso e la componente y del vettore posizione.
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili Alcuni storici della scienza sostengono che ormai `e molto difficile stabilire il punto di distinzione e connessione fra il livello sperimentale e quello della cosiddetta teoria. In realt` a, la loro relazione include molti elementi arbitrari, le cosiddette approssimazioni. Paul K. Feyerabend
In questo capitolo presenteremo la struttura matematica generale della Meccanica Quantistica. La procedura, essenzialmente dovuta a von Neumann e qui presentata in veste pi` u moderna tenendo conto del teorema di Gleason, sar`a un’estensione della meccanica (hamiltoniana) classica che tenga conto dei risultati sperimentali sulla natura dei sistemi quantistici discussi nel capitolo precedente. Nella prima sezione riassumeremo i risultati presentati nel capitolo precedente, rimarcando alcuni punti fondamentali, che giocheranno un ruolo fondamentale nel seguito. Nella sezione successiva riesamineremo alcuni aspetti della formulazione della meccanica di Hamilton da un punto di vista insiemistico e logicoformale insieme, mostrando che esiste un’interpretazione dei fondamenti della teoria in cui le proposizioni elementari sul sistema fisico sono descritte da una σ-algebra, mentre gli stati sono descrivibili in termini di misure di Borel (eventualmente di Dirac) su tale σ-algebra. Nella terza sezione, mostreremo come si possa modificare la struttura delineata nel caso classico fino ad introdurre una descrizione della fenomenologia quantistica. In questo caso la σ-algebra sar` a sostituita dal reticolo dei proiettori su un opportuno spazio di Hilbert e gli stati da una nozione generalizzata di misura σ-additiva sul reticolo dei proiettori. Nella quarta sezione entreremo nel cuore della struttura mostrando, tramite il teorema di Gleason, che le misure generalizzate di cui sopra non sono altro che operatori di classe traccia, positivi con traccia unitaria. In questo modo introdurremo lo spazio convesso degli stati quantistici, identificando gli stati puri (o raggi) con gli elementi estremali del corpo convesso. Discuteremo inoltre la descrizione formale della nozione di proposizioni compatibili, del processo di misura e l’esistenza di regole di superselezione con la decomposizione dello spazio di Hilbert in settori coerenti. Faremo qualche accenno alle interessanti logiche quantistiche ed ai recenti sviluppi anche in altre direzioni. Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
254
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Nella quinta ed ultima sezione ci dedicheremo alla costruzione euristica della nozione di osservabile, vista come insieme di proposizioni elementari che costituiscono una misura a valori di proiezione (PVM) sullo spazio di Hilbert del sistema fisico. Tale costruzione fornir`a anche una motivazione fisica alla dimostrazione del teorema spettrale, che sar`a provato successivamente.
7.1 Le idee che stanno alla base dell’interpretazione standard della fenomenologia quantistica Riassumeremo di seguito alcuni punti cruciali del comportamento dei sistemi quantistici brevemente descritto nel capitolo precedente. QM1. (i) I risultati delle misure di grandezze fisiche su sistemi quantistici, di cui `e fissato lo stato, hanno esiti probabilistici. Non `e possibile prevedere l’esito della misura, ma solo (per esempio per quanto riguarda la posizione di una particella nell’interpretazione di Born) la probabilit` a di ogni possibile esito. (ii) Tuttavia, se una grandezza `e stata misurata ed ha prodotto un certo risultato, ripetendo la misura della stessa grandezza immediatamente dopo la prima misura (per evitare che nel frattempo lo stato del sistema evolva), il risultato della misura sar` a lo stesso gi`a ottenuto. QM2. (i) Esistono delle grandezze fisiche incompatibili nel senso che segue. Dette A e B due grandezze di tale genere, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b, una successiva misura di A – arbitrariamente vicina temporalmente a quella di B in modo da non poter imputare il risultato all’evoluzione temporale dello stato – produce un risultato a1 = a in generale. Accade lo stesso fenomeno scambiando il ruolo di A e B. Risulta che: (a) le grandezze quantistiche incompatibili non sono mai funzioni una dell’altra e che (b) non esistono apparati sperimentali di misura in grado di misurarle contemporaneamente. (ii) Esistono anche grandezze fisiche compatibili nel senso che segue. Dette A e B due grandezze di tale genere, se si misura prima la grandezza A sul sistema (a stato fissato) ottenendo il risultato a e quindi – immediatamente dopo – si misura B ottenendo il risultato b , una successiva misura di A – arbitrariamente vicina temporalmente a quella di B in modo da non poter imputare il risultato all’evoluzione temporale – produce lo stesso risultato a gi`a ottenuto. Accade lo stesso fenomeno scambiando il ruolo di A e B . Risulta che: (a) ogni grandezza fisica `e compatibile con se stessa e (b) se due grandezze fisiche sono una funzione dell’altra (es. l’energia ed il suo quadrato), allora sono compatibili.
7.1 Interpretazione standard della fenomenologia quantistica
255
Osservazioni 7.1. (1) QM1 e QM2 si riferiscono alle grandezze fisiche “non definitorie” di un sistema fisico. Per grandezze definitorie intendiamo quelle i cui valori non dipendono dallo stato del sistema e che quindi permettono di distinguere un sistema da un altro. Le rimanenti grandezze, quelle a cui si riferiscono QM1 e QM2, assumono valori che, invece, sono dipendenti dallo stato del sistema. ` chiaro che non `e possibile avere la certezza assoluta che i sistemi fisici (2) E quantistici soddisfino (i) di QM1. Si potrebbe infatti sospettare che la stocasticit`a dell’esito delle misure derivi dal fatto che, in realt` a, gli sperimentatori non conoscano completamente lo stato del sistema e, se lo conoscessero completamente, potrebbero prevedere con certezza gli esiti delle misure. In questo senso la probabilit` a quantistica sarebbe semplicemente di natura epistemica. Nell’interpretazione standard della MQ, la cosiddetta interpretazione di Copenaghen, la stocasticit`a degli esiti delle misure `e assunta invece come un fatto fondamentale della natura dei sistemi quantistici. Esistono comunque interessanti tentativi di interpretazione della fenomenologia quantistica basati su formalismi alternativi (le cosiddette formulazioni in termini di variabili nascoste) [Bon97]. In tali approcci la stocasticit` a `e spiegata come dovuta ad una incompleta informazione da parte dello sperimentatore sul reale stato fisico del sistema che `e descritto da pi` u variabili (ed in modo molto diverso) rispetto a quelle usate nella formulazione standard. Nessuno di tali tentativi (malgrado alcuni siano veramente notevoli, come la teoria di Bohm) `e risultato fino ad oggi veramente soddisfacente, tanto da essere un vero competitore dell’interpretazione e della formulazione standard della MQ quando si considerino anche le teorie quantistiche relativistiche e la teoria dei campi quantistica relativistica in particolare. Bisogna anche sottolineare che, non `e comunque possibile costruire una teoria fisica completamente classica (includendo le teorie relativistiche non quantistiche tra le teorie classiche) che possa spiegare completamente la fenomenologia sperimentale dei sistemi quantistici. Per essere in accordo con i dati sperimentali noti, le variabili nascoste devono comunque soddisfare un requisito di contestualit` a piuttosto inusuale nelle teorie classiche e, ogni teoria che spieghi la fenomenologia quantistica, inclusa la stessa MQ, deve essere non locale [Bon97]. In effetti, come discuteremo nella sezione 12.3.2, in seguito all’analisi teorica di Einstein, Podolsky e Rosen prima e Bell poi, gli esperimenti hanno provato l’esistenza di correlazioni tra esiti di misure che avvengono in regioni distinte dello spazio ed in periodi di tempo tanto brevi che non e possibile la trasmissione di informazione, tra i due eventi, tramite qualunque mezzo fisico che si muova ad una velocit` a non superiore a quella della luce nel vuoto. ` implicito in QM1 e QM2 che i sistemi fisici interessanti nella fenomeno(3) E logia e teoria quantistica vengano divisi in due grandi categorie: gli strumenti di misura ed i sistemi quantistici. Nella formulazione di Copenaghen si assume che gli strumenti di misura siano sistemi che soddisfino alle leggi della fisica classica. Queste assunzioni che corrispondono a dati di fatto sperimentali e che sono, a dire il vero, piuttosto rozze dal punto di vista teorico, sono alla
256
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
base dell’interpretazione del formalismo e non si riesce a dire molto altro nel corpus della formulazione standard. Per esempio non `e, per il momento, chiaro dove si situi la linea di confine tra sistemi classici e quantistici, nemmeno come questa linea possa essere descritta all’interno del formalismo e nemmeno se il sistema costituito dall’apparato di misura e dal sistema quantistico possa essere a sua volta considerato come un sistema quantistico pi` u grande e trattato all’interno del formalismo. Infine, il processo fisico dell’interazione tra strumento di misura e sistema quantistico che fornisce l’esito della misura non `e descritto all’interno del formalismo quantistico standard come un processo dinamico. Rimandiamo a [Bon97, Des80], ed anche all’ottima sezione dedicata agli aspetti fondazionali delle teorie quantistiche nella Stanford Encyclopedia of Philosophy1 , per una discussione su tali interessanti e difficili argomenti.
7.2 Stati classici come misure di probabilit` a sulla σ-algebra delle proposizioni elementari Vediamo ora come la nozione di misura (di Borel) di probabilit`a possa essere usata per rappresentare gli stati fisici dei sistemi classici. Un’estensione di tale nozione verr`a impiegata nel seguito per dare una descrizione matematica degli stati dei sistemi quantistici. Simili approcci si trovano in [Mac63] e in [Mar82]. 7.2.1 Misure di probabilit` a, misure di Borel La trattazione formale moderna del calcolo delle probabilit` a, dovuta a Kolmogorov, si traduce nello studio delle misure di probabilit` a. Definizione 7.2. Una misura positiva σ-additiva, μ, sullo spazio misurabile (X, Σ) `e detta misura di probabilit` a se μ(X) = 1. Il caso pi` u semplice di misura di probabilit`a su (X, Σ) `e sicuramente la misura di Dirac δx concentrata in x ∈ X, che `e definita come: δx (E) = 0 se x ∈ E
e
δx (E) = 1 se x ∈ E, per ogni E ∈ Σ.
Nel seguito lavoreremo con misure di Borel. Ricordiamo a tal fine le seguenti nozioni, che risulteranno utili in tutto il resto del libro. Abbiamo gi` a usato queste nozioni in alcuni esempi, ma dato che le useremo esplicitamente per costruire la teoria, enunciamo le relative definizioni formalmente. Definizione 7.3. Sia X uno spazio topologico. (a) La σ-algebra di Borel di di X, B(X), `e la pi` u piccola (nel senso dell’intersezione) σ-algebra che contiene gli aperti di X. (b) Gli elementi di B(X) si dicono boreliani o insiemi di Borel di X. (c) f : X → C `e detta essere Borel misurabile se `e misurabile rispetto a B(X) e B(C), in altre parole, se f −1 (E) ∈ B(X) per ogni E ∈ B(C). 1
http://plato.stanford.edu/
7.2 Stati classici come misure di probabilit` a
257
Ovviamente, in (c), B(C) `e riferita alla topologia standard su C e la definizione include il caso in cui f sia a valori in R. Definizione 7.4. Se X `e uno spazio topologico di Hausdorff e localmente compatto, una misura di Borel su X `e una misura positiva σ-additiva definita su B(X). 7.2.2 Stati come misure Consideriamo un sistema fisico classico con n gradi di libert` a spaziali e quindi 2n gradi di libert` a complessivi, tenendo conto anche dei gradi di libert` a cinetici (le “velocit`a”). La formulazione hamiltoniana [FaMa94, CCP82] della dinamica del sistema, molto sommariamente, si esplicita come segue. (i) Lo spazio ambiente `e lo spaziotempo delle fasi, Hn+1 . Si tratta di una variet` a differenziabile di dimensione 2n + 1 data dall’unione disgiunta2 di sottovariet` a embedded 2n-dimensionali, Ft , etichettate differenziabilmente da t ∈ R: , Hn+1 = Ft , t∈R
(ii) il parametro t ∈ R `e il tempo, ogni Ft `e lo spazio delle fasi al tempo t e ogni punto di Ft rappresenta uno stato del sistema al tempo t, (iii) Hn+1 `e dotato di un atlante di sistemi di coordinate locali dette coordinate simplettiche: t, q 1 , . . . , q n , p1 , . . . , pn (dove le coordinate q 1 , . . . , q n , p1 , . . . , pn sono coordinate sulle Ft ) rispetto alle quali le equazioni differenziali di evoluzione del sistema prendono la forma di Hamilton: dq k ∂H(t, q(t), p(t)) = k = 1, 2, . . ., n , dt ∂pk ∂H(t, q(t), p(t)) dpk =− k = 1, 2, . . . , n , dt ∂q k
(7.1) (7.2)
dove H `e la funzione hamiltoniana del sistema nelle coordinate locali considerate, che `e assegnata quando `e noto il sistema fisico. In questa rappresentazione, l’evoluzione temporale del sistema `e descritta dalle curve integrali delle equazioni differenziali di Hamilton rappresentate sopra. Ogni curva integrale determina, per ogni fissato istante di tempo t ∈ R, un punto (t, s(t)) ∈ Hn+1 con s(t) ∈ Ft , in cui la curva interseca Ft . s(t) `e lo stato del sistema al tempo t. 2
Precisamente Hn+1 `e una variet` a fibrata con base R, l’asse del tempo e fibre Ft , date da variet` a simplettiche 2n dimensionali. Inoltre esiste un atlante su Hn+1 le cui carte locali hanno coordinate, t, q1 , . . . , qn , p1 , . . . , pn , dove t `e la coordinata naturale sulla base R e le rimanenti 2n coordinate definiscono una carta locale simplettica sulle Ft .
258
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
In taluni casi fisicamente importantissimi, per esempio in meccanica statistica o termodinamica statistica, lo stato del sistema non `e noto con certezza e quindi non `e nota con certezza l’evoluzione del sistema. In tali situazioni si adoperano descrizioni in termini di insiemi statistici [CCP82, FaMa94]: non si considera un unica copia del sistema fisico, ma un insieme statistico di copie identiche ed indipendenti di esso, con stati distribuiti su ogni Ft secondo una certa densit`a di probabilit` a, localmente rappresentabile come una funzione ρ = ρ(t, q, p) di classe C 1 . L’evoluzione temporale di tale densit`a `e fissata dalla richiesta che essa soddisfi l’equazione di Liouville: ∂ρ + ∂t n
i=1
∂ρ ∂H ∂H ∂ρ − i ∂q i ∂pi ∂q ∂pi
=0.
(7.3)
ρ(t, s), con s ∈ Ft , rappresenta dunque la densit` a probabilit` a che il sistema fisico si trovi nello stato s al tempo t. L’interpretazione di ρ richiede che, per ogni t: ρ(t, s) ≥ 0 e
Ft
ρ dμt = 1 ,
(7.4)
dove la misura μt su B(Ft ), `e definita richiedendo che, su ogni carta locale simplettica di Ft , sia la misura di Lebesgue dq 1 · · · dq n dp1 · · · dpn (estesa ` un fatto noto come teorema di con una partizione dell’unit` a a tutto Ft ). E Liouville che, con tale scelta di μt in ogni spazio delle fasi, il valore dell’integrale in (7.4) non dipende da t ∈ R, quando ρ soddisfa (7.3) [FaMa94, CCP82]. Nel caso in cui si lavori con insiemi statistici, la densit`a ρt `e comunque pensata come lo stato del sistema al tempo t, anche se questa accezione di stato `e un’estensione della precedente. Noi seguiremo questa convenzione, distinguendo tra stato sharp individuato da punti r(t) ∈ Ft e stato probabilistico individuato da una densit` a di Liouville ρt su Ft . In entrambi i casi lo stato al tempo t `e pensabile come una misura di Borel di probabilit` a {νt }t∈R definita sullo spazio delle fasi Ft . Precisamente: (i) per uno stato probabilistico3 νt (E) := E ρ(t, s)dμt se E ∈ B(Ft ), (ii) per uno stato sharp νt := δr(t) . Osservazione 7.5. Per rappresentare gli stati del sistema al tempo t in modo del tutto generale, tralasciando il problema dell’evoluzione dello stato ed abbandonando la formulazione hamiltoniana standard, si potrebbe lavorare su variet`a topologiche Ft invece che differenziabili. Gli stati (al tempo t) potrebbero comunque essere rappresentati in termini di misure di probabilit`a rispetto alla σ-algebra di Borel. La richiesta dell’esistenza di una topologia su Ft `e intrinsecamente connessa con l’esistenza di “intorni” dei punti di tale 3
Ft `e una variet` a differenziabile e quindi `e uno spazio di Hausdorff localmente compatto (in quanto localmente omeomorfo a Rn ). Essendo μt definita su B(Ft) ed essendo ρt continua, νt `e ben definita su B(Ft).
7.2 Stati classici come misure di probabilit` a
259
insieme, dovuti alla presenza di errori di misura sperimentali, rimpicciolibili a piacere, ma non annullabili. Pi` u precisamente, la richiesta di poter distinguere i punti di Ft malgrado l’esistenza di errori di misura, viene tradotta matematicamente con la richiesta che la topologia di Ft sia di Hausdorff (come d’altronde `e richiesto per definizione nelle variet` a differenziabili). 7.2.3 Proposizioni, insiemi e stati come misure su di esse Se ammettiamo che la descrizione hamiltoniana del nostro sistema fisico contenga tutte le propriet` a fisiche del sistema, tutte le proposizioni sul sistema che al tempo t sono vere o false, o sono vere con una certa probabilit` a, devono poter essere descritte nello spazio delle fasi al tempo t, Ft , in qualche modo. Inoltre, il valore di verit` a di tali proposizioni, ovvero la probabilit` a che siano vere, devono potersi ottenere dallo stato νt del sistema. Un modo naturale di fare tutto ci`o `e il seguente. Prima di tutto osserviamo che ogni proposizione P individua un insieme di Ft , che contiene tutti e soli i punti di Ft (pensati come stati sharp sistema) che la rendono vera (al tempo t). Indicheremo tale insieme ancora con P ⊂ Ft . Poi mettiamoci nel caso in cui si lavora con uno stato sharp e quindi νt sia una misura di Dirac. In questo caso, la proposizione P sar`a vera al tempo t se e solo se il punto r(t) che descrive lo stato al tempo t appartiene all’insieme P . L’osservazione cruciale `e ora che, se assegniamo convenzionalmente il valore 0 ad una proposizione falsa al tempo t e 1 ad una vera allo stesso tempo, tutto riferito allo stato νt = δr(t) , il valore di verit` a della proposizione P , quando lo stato `e νt , `e calcolabile come νt (P ), pensato come misura dell’insieme P ⊂ Ft secondo la misura (di Dirac) νt . Questo fatto chiarisce il significato operativo della misura di Dirac νt pensata come stato del sistema al tempo t. Ulteriormente, la stessa interpretazione pu` o essere usata quando lo stato sia probabilistico: νt (P ) rappresenta la probabilit` a che la proposizione P ⊂ Ft sia vera al tempo t quando lo stato `e lo stato probabilistico νt . Osservazioni 7.6. ` chiaro che tutto quanto detto ha senso se gli insiemi P appartengono (1) E alla σ-algebra su cui sono definite le misure νt . Tale σ-algebra `e quella di Borel ed `e pertanto ragionevolmente grande. (2) Una stessa proposizione pu`o essere formulata in modi differenti ma equivalenti. Nell’identificare proposizioni con insiemi di Ft noi stiamo esplicitamente assumendo che: se due proposizioni individuano lo stesso sottoinsieme di Ft si devono considerare come la stessa proposizione. 7.2.4 Interpretazione insiemistica dei connettivi logici Prese due proposizioni P e Q, possiamo comporle con connettivi logici per costruire altre proposizioni. In particolare possiamo considerare la proposizione costruita con la disgiunzione, P OQ, e la proposizione costruita con
260
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
la congiunzione, P EQ. Con una sola proposizione possiamo costruirne la negazione P . Possiamo interpretare queste proposizioni in termini di insiemi della σalgebra di Borel su Ft : (i) la disgiunzione P O Q corrisponde a P ∪ Q, (ii) la congiunzione P E Q corrisponde a P ∩ Q, (iii) la negazione P corrisponde a Ft \ P . ` possibile mettere un ordinamento parziale in ogni classe di sottoinsiemi di E Ft usando l’inclusione insiemistica: P ≤ Q se e solo se P ⊂ Q. L’interpretazione pi` u naturale a livello di proposizioni del fatto che P ⊂ Q `e semplicemente che Q `e conseguenza logica di P , ossia P ⇒ Q . Osservazioni 7.7. (1) La probabilt` a che siano vere queste proposizioni composte pu`o essere calcolata usando la misura νt in quanto le operazioni insiemistiche che corrispondono a O, E, sono operazioni rispetto alle quali ogni σ-algebra `e chiusa. (2) Si verifica facilmente che se νt `e una misura di Dirac, il valore di probabilit` a (che ricordiamo essere solo 0 o 1 in questo caso) assegnato a ciascuna delle espressioni composte di sopra, coincide con il valore di verit`a calcolato tramite le tavole di verit` a del connettivo logico usato. Per esempio, P OQ `e vera (cio`e νt (P ∪ Q) = 1) se e solo se almeno una delle due proposizioni costituenti `e vera (cio`e se e solo se νt (P ) = 1 o νt (Q) = 1); infatti il punto p su cui `e concentrata la misura di Dirac δx = νt cade in P ∪ Q se e solo se x cade in almeno uno dei due insiemi P e Q. 7.2.5 Proposizioni “infinite” e grandezze fisiche Solitamente nel calcolo proposizionale non si considerano delle proposizioni composte contenenti infinite proposizioni ed infiniti connettivi logici come P1 O P2 O . . .. L’interpretazione delle proposizioni e dei connettivi in termini di elementi e operazioni in una σ-algebra permette per`o di “maneggiare” tali proposizioni infinite. Possiamo legare, almeno alcune, di tali proposizioni a grandezze fisiche misurabili sul sistema. In via del tutto generale, possiamo considerare le grandezze fisiche definite sul nostro sistema hamiltoniano come qualche classe di funzioni regolari in qualche senso, definite sullo spaziotempo delle fasi ed a valori reali: f : Hn+1 → R. Una scelta molto generale per il requisito di regolarit` a si ha prendendo tutta la classe delle funzioni le cui restrizioni ad ogni Ft siano Borel-misurabili. Si possono fare delle scelte meno radicali, considerando, per esempio, solo la classe delle funzioni continue, oppure di classe C 1 oppure, addirittura, solamente di classe C ∞ . Dal punto di vista fisico sembrerebbe naturale richiedere che le grandezze fisiche siano descritte da funzioni almeno continue, per il fatto che le misure sono sempre affette da errori sperimentali nel determinare il punto di Ft che rappresenta lo stato del sistema al tempo t: se le funzioni non sono continue, piccoli errori di misura possono provoca-
7.2 Stati classici come misure di probabilit` a
261
re grandi variazioni sui valori delle grandezze. Tuttavia bisogna tenere anche conto del fatto che vi possono essere grandezze che assumono valori discreti, per le quali la critica di sopra non si applica (i valori si possono distinguere usando strumenti sufficientemente, ma non infinitamente, precisi). Dato che siamo interessati al passaggio al caso quantistico piuttosto che ad un’analisi del caso classico, non faremo un’analisi accurata di questa problematica. Ci restringiamo ora a lavorare ad un tempo fissato t, per cui le grandezze fisiche che considereremo saranno funzioni f : Ft → R Borel-misurabili. Se f : Ft → R `e una grandezza fisica valutabile sul sistema fisico (al tempo t), possiamo costruire con essa delle proposizioni del tipo: (f)
PE = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel E ⊂ R” . Il fatto di considerare insiemi di Borel E e non solo, per esempio, intervalli aperti oppure singoli punti, consente di trattare sullo stesso piano grandezze che assumono valori continui e grandezze che assumo valori discreti e tenere anche conto del fatto che gli esiti degli strumenti di misura sono di fatto insiemi e non singoli punti, a causa della precisione finita dello strumento. In effetti, in B(R) cadono gli insiemi chiusi, insiemi contenenti quantit`a finite e numerabili di punti, ecc. In termini insiemistici, la proposizione sar` a associata ad un insieme boreliano di Ft , che indicheremo ancora con lo stesso simbolo della proposizione: (f) PE = f −1 (E) ⊂ Ft . (Come precisato sopra, con questa convenzione, una volta noto lo stato νt , la (f) (f) probabilit` a che PE sia vera al tempo t per il sistema `e νt (PE ).) Consideriamo un intervallo [a, b) con b ≤ +∞. Possiamo decomporre tale intervallo nell’unione disgiunta di una infinit` a di sotto intervalli: [a, b) = ∪∞ [a , a ) dove a := a ed inoltre a < a i i+1 1 i i+1 ed infine ai → b i=1 ` chiaro allora che la proposizione: per i → ∞. E (f)
P[a,b) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [a, b)” , pu` o essere decomposta in una disgiunzione infinita di proposizioni ciascuna della forma: (f) P[ai ,ai+1 ) = “Il valore di f valutato sullo stato del sistema cade nell’insieme di Borel [ai , ai+1 )” .
262
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili (f)
(f)
+∞ P[a,b) = Oi=1 P[ai ,ai+1 ) , (f)
che corrisponde alla decomposizione dell’insieme P[a,b) nell’unione disgiunta: (f)
(f)
P[a,b) = ∪+∞ i=1 P[ai ,ai+1 ) . Quindi vediamo che ha senso fisico assumere l’esistenza di, almeno alcune, proposizioni sul sistema costruite con infiniti connettivi logici ed infinite sotto proposizioni. Per dualit` a rispetto alla negazione, che trasforma la disgiunzione O in congiunzione E, se assumiamo che l’insieme delle proposizioni ammissibili sia chiuso rispetto alla negazione , dobbiamo assumere come fisicamente sensate anche proposizioni infinite costruite con il connettivo E. Il fatto di poter rappresentare le proposizioni come insiemi di una σ-algebra e quindi poterne calcolare la probabilit` a che siano vere su uno stato del sistema tramite la misura corrispondente, suggerisce di assumere che abbiano senso fisico proposizioni costruite con un’infinit` a numerabile connettivi logici di tipo O oppure un’infinit` a numerabile di connettivi logici di tipo E, perch´e gli insiemi corrispondenti sono ancora elementi della σ-algebra, che appunto `e chiusa rispetto all’unione ed all’intersezione numerabile di insiemi. Per avere una struttura “isomorfa” a quella di σ-algebra costituita da proposizioni insieme ai connettivi logici O, E, , dobbiamo includere tra le proposizioni fisiche ancora due proposizioni che corrispondono agli insiemi ∅ e Ft rispettivamente. Tali proposizioni evidentemente sono quella sempre falsa (ovvero con probabilit` a 0 di essere vera per qualsivoglia stato) che indicheremo con 0 e quella sempre vera (ovvero con probabilit`a 1 di essere vera per qualsivoglia stato) che indicheremo con 1. Una volta identificate le proposizioni con insiemi, la struttura di σ-algebra ci permette di dichiarare che: l’insieme delle proposizioni elementari P relative al sistema fisico considerato, insieme ai connettivi logici O, E, , costituiscano una struttura “isomorfa” ad una σ-algebra. Il valore di verit` a, per stati sharp, oppure la probabilit` a che una proposizione P sia vera, per stati probabilistici, per un fissato stato del sistema al tempo t `e νt (P ) dove ora P ⊂ Ft `e l’insieme associato alla proposizione. (Tutto ci` o `e indipendente dal fatto che una proposizione sia “normale” o costituita con infiniti connettivi logici.) Osservazione 7.8. Ci si pu` o chiedere se la σ-algebra associata all’insieme di tutte le proposizioni sul sistema corrisponda alla σ-algebra di Borel di Ft o ` chiaro che, se si assume che ogni funzione reale misurabile sia pi` u piccola. E limitata definita su Ft sia una grandezza fisica, allora la risposta `e positiva, perch´e tra queste funzioni ci sono le funzioni caratteristiche di ogni insieme misurabile di Ft .
7.2 Stati classici come misure di probabilit` a
263
7.2.6 Il reticolo distributivo, limitato, ortocomplementato e σ-completo delle proposizioni elementari Useremo nel seguito alcune nozioni elementari relative alla teoria degli insiemi parzialmente ordinati che supporremo nota al lettore. Tali nozioni sono comunque richiamate in appendice al libro. Nel caso di sistemi fisici classici possiamo identificare proposizioni con insiemi e pensare gli stati come misure su tali insiemi. Per il passaggio al caso quantistico in cui non esiste lo spazio delle fasi, `e importante farsi la domanda che segue. Esistono strutture matematica in qualche senso “isomorfe” ad una σ-algebra che non siano σ-algebre di insiemi? La risposta `e positiva e si ricava dalla teoria dei reticoli. Definizione 7.9. Un insieme parzialmente ordinato (X, ≥) `e detto reticolo quando soddisfa i due seguenti requisiti: (a) per ogni coppia x, y ∈ X esiste sup{a, b}, (b) per ogni coppia x, y ∈ X esiste inf{a, b}. Osservazioni 7.10. (1) Nella teoria dei reticoli sup{a, b} si indica con a∨ b e inf{a, b} si indica con ` importante notare che in un reticolo esistono inf{a, b} e sup{a, b} con a ∧ b. E anche se a e b non sono confrontabili, cio`e non vale a ≤ b oppure b ≤ a. Si prova facilmente che i seguenti tre fatti sono equivalenti: a ∧ b = a , a ∨ b = b , a ≤ b. (2) Si osservi che per ogni reticolo X, dalla definizione di inf e sup, seguono le propriet` a associative: per ogni terna a, b, c ∈ X, (a ∧ b) ∧ c = a ∧ (b ∧ c) , (a ∨ b) ∨ c = a ∨ (b ∨ c) , per cui, per esempio, si pu` o scrivere a ∨ b ∨ c ∨ d e a ∧ b ∧ c ∧ d senza ambiguit`a. (3) Valgono anche le propriet` a di simmetria: a∨b = b∨a, a∧b = b∧a, per ogni coppia a, b ∈ X. Di conseguenza, per esempio a ∨ b ∨ c = c ∨ a ∨ b ∨ a. Esistono diversi tipi di reticoli, la seguente definizione ne classifica alcuni. Definizione 7.11. Un reticolo (X, ≥) si dice: (a) distributivo se valgono le leggi distributive tra ∨ e ∧, per ogni terna a, b, c ∈ X: a ∨ (b ∧ c) = (a ∨ b) ∧ (a ∨ b) , a ∧ (b ∨ c) = (a ∧ b) ∨ (a ∧ b) ;
264
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(b) limitato se ammette minimo e massimo, indicati con 0 e 1 rispettivamente; (c) ortocomplementato se `e limitato ed `e dotato di un’applicazione X a → ¬a, dove ¬a `e detto ortocomplemento di a, che soddisfa: (i) a ∨ ¬a = 1 per ogni a ∈ X, (ii) a ∧ ¬a = 0 per ogni a ∈ X, (iii) ¬(¬a) = a per ogni a ∈ X, (iv) se a ≥ b allora ¬b ≥ ¬a per ogni coppia a, b ∈ X. (d) σ-completo, se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo superiore che viene denotato con ∨n∈N an . Un reticolo che soddisfi (a), (b) e (c) `e detto algebra di Boole. Un’algebra di Boole che soddisfi (d) `e detta algebra di Boole σ-completa ovvero, equivalentemente, σ-algebra di Boole. Definizione 7.12. Se X e Y sono algebre di Boole, un’applicazione h : X → Y `e detta omomorfismo di algebre di Boole se soddisfa: h(a ∨ b) = h(a) ∨ h(b) , per ogni coppia a, b ∈ X h(¬a) = ¬h(a) , per ogni a ∈ X . Se X e Y sono σ-algebre di Boole, un omomorfismo di algebre di Boole h : X → Y `e detto omomorfismo di σ-algebre di Boole se soddisfa: h(∨n∈N an ) = ∨n∈Nh(an )
per ogni insieme numerabile {an }n∈N ⊂ X .
Un omomorfismo biettivo di algebre di Boole (σ-algebre di Boole) `e detto isomorfismo di algebre di Boole (rispettivamente di σ-algebre di Boole). Le nozioni di sotto reticolo, sotto algebra di Boole, sotto σ-algebra di Boole sono definite nel solito modo, cio`e come un sottoinsieme della struttura di partenza che continui ad avere la stessa struttura se dotato della restrizione della relazione d’ordine e, se `e il caso, dello stesso massimo 1 e minimo 0 della struttura iniziale. Osservazioni 7.13. (1) Si verifica che per ogni algebra di Boole X, se a ∈ X allora ¬a `e l’unico elemento a soddisfare (i) e (ii) di (c) nella definizione 7.11. Da questo risultato si prova che valgono le identit` a di De Morgan: per ogni a, b ∈ X, ¬(a ∨ b) = ¬a ∧ ¬b ,
(7.5)
¬(a ∧ b) = ¬a ∨ ¬b .
(7.6)
(2) Dalla stessa definizione di inf e sup si verifica che un’algebra di Boole `e σ-completa se e solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. Tale estremo inferiore viene denotato con ∧n∈N an e vale ∧n∈Nan = ¬(∨n∈N¬an ) da cui anche ∨n∈Nan = ¬(∧n∈N ¬an ).
7.2 Stati classici come misure di probabilit` a
265
(3) Se h : X → Y `e un omomorfismo di algebre di Boole, dalle identit` a di De Morgan si prova subito che: h(a ∧ b) = h(a) ∧ h(b) ,
per ogni coppia a, b ∈ X .
Nello stesso modo si ha subito che h(1) = 1 e h(0) = 0. (Per esempio h(1) = h(a ∨ ¬a) = h(a) ∨ ¬h(a) = 1.) (4) Usando il fatto che a ∨ b = b se e solo se a ≤ b, si ha che un omomorfismo di algebre di Boole h : X → Y preserva l’ordinamento: se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b) . (5) Usando (2) si ha facilmente che, se h : X → Y `e un omomorfismo di σ-algebre di Boole, allora: h(∧n∈N an ) = ∧n∈N h(an )
per ogni insieme numerabile {an }n∈N ⊂ X . (7.7)
(6) Si prova facilmente che, se h : X → Y `e un isomorfismo di (σ-)algebre di Boole, allora h−1 : Y → X `e un isomorfismo di (σ-)algebre di Boole. In base alle definizioni date risulta ovvio che valgono le seguenti proposizioni. Proposizione 7.14. Ogni σ-algebra su un insieme X `e un’algebra di Boole (ossia un reticolo distributivo, limitato, ortocomplementato), σ-completa in cui: (i) la relazione d’ordine `e l’inclusione insiemistica (e quindi ∨ corrisponde a ∪ e ∧ corrisponde a ∩), (ii) il massimo ed il minimo dell’algebra di Boole sono X e ∅, (iii) l’operazione di ortocomplemento corrisponde al complemento insiemistico rispetto allo spazio X. Proposizione 7.15. Siano Σ, Σ due σ-algebre su X e X rispettivamente e f : X → X una funzione misurabile. Valgono i due seguenti fatti. (f) (a) Gli insiemi PE := f −1 (E) , con E ∈ Σ , definiscono una σ-algebra di Boole che `e sotto σ-algebra di Boole di quella definita su X secondo la proposizione 7.14. (f) (b) L’applicazione Σ E → PE `e un omomorfismo di σ-algebre di Boole. Dobbiamo concludere le stesse cose per l’insieme delle proposizioni relative ad un sistema fisico. Proposizione 7.16. Le proposizioni relative ad un sistema fisico costituiscono un reticolo distributivo, limitato, ortocomplementato e σ-completo, cio`e una σ-algebra di Boole, in cui: (i) la relazione d’ordine corrisponde alla relazione di conseguenza logica, (ii) il massimo ed il minimo sono la proposizione sempre vera 1 e quella sempre falsa 0, (iii) l’operazione di ortocomplemento corrisponde alla negazione. Se f : Ft → R `e una grandezza fisica rappresentata da una funzione Borel misurabile, allora valgono i seguenti fatti.
266
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(a) Al variare di E nella σ-algebra di Borel di R, le proposizioni: (f)
PE = “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , definiscono una σ-algebra di Boole. (f) (b) L’applicazione che associa ad ogni boreliano E ⊂ R la proposizione PE definisce un omomorfismo di σ-algebre di Boole. Osservazione 7.17. Si osservi che da (i) e (iii) segue che la congiunzione deve corrispondere all’intersezione e la disgiunzione all’unione.
7.3 Le proposizioni relative a sistemi quantistici come insiemi di proiettori ortogonali Passiamo finalmente a considerare sistemi quantistici. Cercando di seguire un approccio per quanto possibile vicino al caso classico, vogliamo prima di tutto cercare di dare un modello matematico per la classe delle proposizioni elementari relative ad un sistema quantistico e che possiamo valutare al tempo t eseguendo esperimenti sul sistema con opportuni strumenti di misura, il cui risultato `e un semplice 0 (= proposizione falsa) oppure 1 (= proposizione vera). Non sappiamo ancora come descrivere lo stato quantistico, ma sappiamo qualcosa, QM1 e QM2, riguardo alle grandezze quantistiche misurabili sul sistema quando ne `e assegnato lo stato. Per il momento ci concentreremo su QM2. Sappiamo che esistono gran` immediato concludere che esistono proposizioni incomdezze incompatibili. E patibili: se A e B sono grandezze incompatibili (A)
PJ
=
“Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel J ⊂ R” , (B)
PK
=
“Il valore di B valutata sullo stato del sistema cade nell’insieme di Borel K ⊂ R” , sono in generale proposizioni incompatibili: i valori di verit` a di tali proposizioni si disturbano a vicenda eseguendo la verifica di esse ripetutamente in successione con intervalli di tempo piccoli a piacere (in modo da non imputare il fenomeno all’evoluzione dello stato del sistema). Sappiamo che non esistono apparati di misura in grado di misurare contemporaneamente due
7.3 Proposizioni quantistiche come proiettori ortogonali
267
grandezze incompatibili. Non ha quindi alcun senso fisico, in questa situazione, affermare che le due proposizioni considerate sopra, associate a grandezze fisiche incompatibili, possano assumere sul sistema un valore di verit`a contem(A) (B) poraneamente. Le due proposizioni PJ e PK , in questo senso, sono dette incompatibili. Osservazione importante. Deve essere ben chiaro che quindi incompatibili (A) (B) non significa qui che le due proposizioni PJ e PK non possono essere vere contemporaneamente, per cui, per esempio, la loro congiunzione `e sempre falsa. Significa molto pi` u fortemente, che non ha senso (fisico) attribuire ad esse qualsiasi valore di verit` a contemporaneamente. Tale valore di verit` a non pu` o nemmeno essere definito con una procedura di limite misurando successivamente in sequenza le due proposizioni, perch´e esse “si disturbano reciprocamente” nel senso precisato. (A) (B) Infine non p `ossibile dare significato fisico a proposizioni del tipo PJ O PK (A) (B) oppure PJ E PK perch´e non esiste alcun modo sperimentale per attribuire valori di verit` a a tali proposizioni. In virt` u di quanto appena osservato, non possiamo assumere, come modello dell’insieme delle proposizioni elementari testabili sul nostro sistema quantistico, un qualche reticolo (o σ-algebra) di insiemi in cui la disgiunzione e la congiunzione sono sempre possibili. Dovremmo imporre degli ulteriori vincoli su tale modello, vietando certe combinazioni. Un’idea alternativa dovuta a von Neumann, che si `e rivelata vincente, `e quella di modellizzare le proposizioni elementari tramite i proiettori ortogonali di uno spazio di Hilbert. 7.3.1 Reticoli di proiettori ortogonali su spazi di Hilbert L’insieme dei proiettori ortogonali su uno spazio di Hilbert gode di alcune interessantissime propriet`a, molto vicine a quelle dei reticoli booleani, ma con alcune importanti differenze che consentono di modellizzare le proposizioni incompatibili di sistemi quantistici. Non esamineremo la questione a fondo, ma discuteremo solo alcune propriet`a importanti. Prima di tutto notiamo alcune propriet` a molto interessanti che riguardano coppie di proiettori che commutano tra di loro. Proposizione 7.18. Sia (H, ( | )) uno spazio di Hilbert e sia P(H) l’insieme dei proiettori ortogonali su H. Valgono le propriet` a che seguono per ogni coppia P, Q ∈ P(H). (a) I seguenti fatti sono equivalenti: (i) P ≤ Q, (ii) P (H) `e sottospazio di Q(H), (iii) P Q = P , (iv) QP = P .
268
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(b) I seguenti fatti sono equivalenti: (i) P Q = 0, (ii) QP = 0, (iii) P (H) e Q(H) sono ortogonali. Se valgono (i), (ii) e (iii), P + Q `e proiettore ortogonale e proietta su P (H) ⊕ Q(H). (c) Se P Q = QP allora P Q `e proiettore ortogonale e proietta su P (H)∩Q(H). (d) Se P Q = QP allora P + Q − P Q `e proiettore ortogonale e proietta sul sottospazio chiuso < P (H), Q(H) >. Dimostrazione. (a) Prima di tutto notiamo che se P `e un proiettore che proietta su M, allora P u = 0 se e solo e u ∈ M⊥ a causa della decomposizione diretta ortogonale H = M ⊕ M⊥ ((d) in teorema 3.14) e tenendo conto che il componente di u in M `e proprio P u. (i) ⇒ (ii). Se P ≤ Q allora (u|Qu) ≥ (u|P u) ovvero essendo i proiettori idempotenti ed autoaggiunti: (Qu|Qu) ≥ (P u|P u) che si pu`o anche scrivere come ||Qu|| ≥ ||P u||. Quindi in particolare Qu = 0 implica P u = 0 ovvero Q(H)⊥ ⊂ P (H)⊥ . Usando (e) di teorema 3.14 e notando che Q(H) e P (H) sono chiusi, troviamo infine che P (H) ⊂ Q(H). (ii) ⇒ (iii). Se S `e una base hilbertiana per P (H) la si completi a base per Q(H) aggiungendo l’insieme S di vettori ora conto ortogonali a S. Si tenga che, per (d) di proposizione 3.53, P = s- u∈S u(u| ) e Q = s- u∈S∪S u(u| ). Dall’ortogonalit` a di S e S , dal fatto che ciascuno di essi `e insieme ortonormale e infine dalla continuit` a del prodotto scalare segue immediatamente la tesi per controllo diretto. (iii) ⇔ (iv). Si ottengono una dall’altra prendendo l’aggiunto ad ambo membri. (iii) e (iv) ⇒ (i). Se u ∈ H, (u|Qu) = ((P + P ⊥)u|Q(P + P ⊥)u) dove P ⊥ = I − P . Notiamo che P e P ⊥ commutano con Q per (iii) e (iv) inoltre P P ⊥ = P ⊥ P = 0. Sviluppando il secondo membro di (u|Qu) = (u|(P + P ⊥ )Q(P + P ⊥ )u) si ha, tenendo conto che alcuni termini sono nulli per quanto appena detto: (u|Qu) = (u|P QP u) + (u|P ⊥QP ⊥u) . D’altra parte, per (iii) e (iv): (u|P QP u) = (u|P P u) = (u|P u). Concludiamo che: (u|Qu) = (u|P u) + (u|P ⊥QP ⊥u) , e quindi (u|Qu) ≥ (u|P u). (b) Supponiamo P Q = 0, prendendo l’aggiunto si ha che QP = 0, quindi si verifica immediatamente che P (H) e Q(H) sono ortogonali essendo P Q = QP = 0. Se P (H) e Q(H) sono ortogonali, prendiamo in ciascuno di tali spazi una base hilbertiana N e N rispettivamente, scrivendo i pro iettoriP e Q come indicato in (d) di proposizione 3.53: P = u∈N (u| )u, Q = u∈N (u| )u, si ricava immediatamente che P Q = QP = 0. Usando le
7.3 Proposizioni quantistiche come proiettori ortogonali
269
espressioni di P e Q scritte sopra, tenendo conto che N ∪ N `e una base hilbertiana per P (H) ⊕ Q(H) ed usando ancora (d) di proposizione 3.53 si ricava che P + Q `e il proiettore ortogonale che proietta su P (H) ⊕ Q(H). (c) Il fatto che P Q sia proiettore ortogonale (cio`e autoaggiunto ed idempotente) se P Q = QP dove P e Q sono proiettori ortogonali `e di immediata verifica. Se u ∈ H, P Qu ∈ P (H), ma anche P Qu = QP u ∈ Q(H) e quindi P Qu ∈ P (H) ∩ Q(H). Abbiamo provato che P Q(H) ⊂ P (H) ∩ Q(H), per concludere basta provare che P (H) ∩ Q(H) ⊂ P Q(H). Se u ∈ P (H) ∩ Q(H) allora P u = u e Qu = u e quindi vale anche P u = P Qu = u ossia u ∈ P Q(H). Questo significa che se P (H) ∩ Q(H) ⊂ P Q(H). (d) Il fatto che R := P + Q − P Q sia proiettore ortogonale `e di immediata verifica. Consideriamo lo spazio < P (H), Q(H) >. Possiamo costruire una base hilbertiana per tale spazio come segue. Per prima cosa costruiamo una base hilbertiana N per il sottospazio chiuso P (H) ∩ Q(H). Quindi aggiungiamo a questa una seconda base hilbertiana per lo spazio che “rimane in P (H) una volta tolto P (H) ∩ Q(H)”, cio`e costruiamo una base hilbertiana N per lo spazio chiuso ortogonale in P (H) a P (H) ∩ Q(H): P (H) ∩ (P (H) ∩ Q(H))⊥ . Infine costruiamo, con lo stesso criterio, una terza base hilbertiana N per ` facile convincersi che le tre basi sono a due a due Q(H) ∩ (P (H) ∩ Q(H))⊥ . E ortogonali e insieme costituiscono una base per < P (H), Q(H) >. Tutto ci` o mostra che vale la decomposizione diretta ed ortogonale < P (H), Q(H) > = (P (H) ∩ Q(H)) ⊕ (P (H) ∩ (P (H) ∩ Q(H))⊥ ) ⊕ (Q(H) ∩ (P (H) ∩ Q(H))⊥ ) . Nelle nostre ipotesi, il proiettore sul primo spazio della decomposizione `e P Q per (c). Il proiettore su (P (H) ∩ Q(H))⊥ `e quindi I − P Q. Quindi, applicando nuovamente (c), il proiettore ortogonale sul secondo addendo della decomposizione `e P (I − P Q) = P − P Q. Similmente, il proiettore sul terzo addendo della decomposizione `e: Q(I − P Q) = Q − P Q . Applicando (b), il proiettore sulla somma diretta ortogonale dei tre spazi detti, cio`e su < P (H), Q(H) > sar`a: P Q + (P − P Q) + (Q − P Q) = P + Q − P Q . Questo conclude la dimostrazione.
In base a quanto dimostrato, consideriamo due proiettori ortogonali P, Q ∈ P(H) che commutano e assumiamo di associare a tali proiettori delle proposizioni sul sistema fisico indicate con le stesse lettere. Se facciamo le associazioni P E Q ←→ P Q , P O Q ←→ P + Q − P Q , P ←→ I − P ,
270
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
i secondi membri delle associazioni scritte sopra sono ancora proiettori ortogonali. Inoltre questi proiettori soddisfano propriet` a formalmente identiche a quelle delle proposizioni costruite con connettivi logici. Per esempio, risulta subito che (P E Q) =P O Q. Infatti: P O Q ←→ (I −P )+(I −Q)−(I −P )(I −Q) = 2I −P −Q−I +P Q+P +Q = I − P Q ←→ (P E Q) ed in tal modo si possono verificare tutte le relazioni che abbiamo scritto precedentemente, quando si lavora con proiettori commutanti. Si osservi ancora che se P e Q commutano e P ≤ Q allora P Q = QP = P e P + Q − P Q = Q. Se pensiamo queste identit`a come identit`a di valori di verit` a, abbiamo una situazione analoga, tenendo conto delle associazioni di sopra, a quanto accade a P E Q e P O Q nelle situazioni in cui Q `e conseguenza logica di P . Per cui possiamo dire che P ≤ Q corrisponde alla situazione in cui Q `e conseguenza logica di P . La differenza sostanziale tra i proiettori ortogonali e le proposizioni di un sistema classico `e per` o la seguente. Se i proiettori P e Q non commutano, allora P Q e P + Q − P Q non sono nemmeno proiettori in generale, per cui le corrispondenze sopra proposte non hanno significato. Tutto ci` o sembra molto interessante per il nostro fine di cercare un modello per le proposizioni dei sistemi quantistici tenendo conto di QM2. L’idea `e che: le proposizioni dei sistemi quantistici siano in corrispondenza biunivoca con proiettori ortogonali in uno spazio di Hilbert in modo tale che: (i) la relazione di conseguenza logica tra proposizioni P e Q (ossia che P ⇒ Q) corrisponda alla relazione P ≤ Q tra i corrispondenti proiettori, (ii) due proposizioni sono compatibili se e solo se i rispettivi proiettori commutano. Osservazione 7.19. Prima di procedere ulteriormente chiariamo un punto sulla natura dei proiettori ortogonali commutanti. Dai punti (a) e (b) della proposizione 7.18 si potrebbe sospettare che gli unici casi in cui due proiettori ortogonali P e Q commutino siano quando: (a) gli spazi su cui proiettano sono uno incluso nell’altro, oppure, (b) gli spazi su cui proiettano sono reciprocamente ortogonali. Mostriamo con un esempio concreto che ci sono altre possibilit` a. Consideriamo lo spazio L2 (R2 , dx ⊗ dy) dove dx e dy sono la misura di Lebesgue sulla retta reale. Consideriamo gli insiemi del piano: A = {(x, y) ∈ R2 | a ≤ x ≤ b}, con a < b fissati, e B = {(x, y) ∈ R2 | c ≤ y ≤ d}, con c < d fissati. Se G ⊂ R2 `e misurabile, definiamo l’operatore lineare: PG : L2 (R2 , dx ⊗ dy) → L2 (R2 , dx ⊗ dy) definito da PG f = χG · f per ogni f ∈ L2 (R2 , dx ⊗ dy), dove χG `e, al solito, la funzione caratteristica di G e · indica il prodotto di funzioni punto per punto.
7.3 Proposizioni quantistiche come proiettori ortogonali
271
L’operatore PG `e un proiettore ortogonale come `e facile provare. Inoltre si verifica subito che: PG(L2 (R2 , dx ⊗ dy)) = {f ∈ L2 (R2 , dx ⊗ dy) | ess supp f ⊂ G} . ` allora immediato verificare che vale PA PB = PB PA = PA∩B , ma: E (a) nessuno dei due spazi di proiezione PA (L2 (R2 , dx ⊗ dy)) e PB 2 (L (R2 , dx ⊗ dy)) `e incluso nell’altro e (b) due spazi di proiezione non sono ortogonali. Se l’idea della corrispondenza tra proposizioni di sistemi quantistici e proiettori ortogonali su un opportuno spazio di Hilbert `e sensata, le similitudini strutturali tra i costrutti con i proiettori ortogonali e quelli dell’algebra di Boole σ-completa delle proposizioni deve valere anche quando si considerino pi` u di due proposizioni. In particolare, ci si aspetta di trovare una struttura di reticolo distributivo, limitato, ortocomplementato (ed eventualmente σ-completo) in qualche insieme opportunamente scelto di proiettori rappresentante propriet` a compatibili a due a due. Il teorema seguente, oltre ad asserire che lo spazio di tutti i proiettori ortogonali `e un reticolo (non distributivo in generale), mostra che `e davvero cos`ı. di proiettori ortogonali a due a due comSe abbiamo un insieme, P(H), mutanti, `e facile provare con il Lemma di Zorn (vedi Appendice A) che esiste e anche un insieme P0 (H) di proiettori ortogonali che include l’insieme P(H) che `e massimale rispetto alla condizione di commutativit`a (cio`e ogni proiettore ortogonale che commuta con gli elementi di P0 (H) `e contenuto in P0 (H)). Teorema 7.20. Sia H spazio di Hilbert. (a) La classe, P(H), dei proiettori ortogonali su H `e un reticolo limitato, ortocomplementato, σ-completo e, in generale, non distributivo. Pi` u precisamente: (i) la relazione d’ordine `e la relazione d’ordine ≥ tra proiettori, (ii) il massimo ed il minimo di P(H) sono: I (operatore identit` a) e 0 (operatore nullo) rispettivamente, (iii) l’operazione di ortocomplemento del proiettore ortogonale P corrisponde a ¬P = I − P . (7.8) (iv) P(H) non `e distributivo se dimH ≥ 2. (b) In P(H) valgono i seguenti ulteriori fatti: (i) se P, Q ∈ P(H) commutano, allora: P ∧ Q = PQ, P ∨ Q = P + Q − PQ,
(7.9) (7.10)
(ii) se {Qn }n∈N ⊂ P(H) `e costituito da elementi a due a due commutanti, allora: ∨n∈N Qn = s- lim Q0 ∨ · · · ∨ Qn , (7.11) n→+∞
∧n∈N Qn = s- lim Q0 ∧ · · · ∧ Qn , n→+∞
indipendentemente dall’ordine con cui si etichettano i Qn .
(7.12)
272
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(c) Sia P0 (H) ⊂ P(H) un insieme di proiettori ortogonali a due a due commutanti e sia P0 (H) massimale rispetto alla condizione di commutativit` a, allora vale quanto segue: (i) P0 (H) `e un reticolo limitato, ortocomplementato, σ-completo e distributivo – ossia una σ-algebra di Boole – rispetto alla relazione d’ordine ≥, (ii) il minimo, il massimo di P0 (H), l’ortocomplemento di elementi di P0 (H), l’estremo inferiore e quello superiore di insiemi al pi` u numerabili di P0 (H), esistono in P0 (H) e coincidono con i corrispondenti elementi calcolati rispetto P(H). (d) Pi` u in generale se P0 (H) ⊂ P(H) `e un insieme di proiettori ortogonali a due a due commutanti, ma non necessariamente massimale, soddisfacente la propriet` a (ii) in (c), allora P0 (H) `e una σ-algebra di Boole rispetto alla relazione d’ordine ≥. Dimostrazione. (a) Ricordiamo che ≥ `e una relazione d’ordine parziale in P0 (H) per (f) di proposizione 3.49. Si tenga quindi conto di (a) di proposizione 7.18, per cui: P ≤ Q se e solo se P (H) ⊂ Q(H) .
(7.13)
In tal modo la relazione d’ordine parziale sui proiettori ortogonali corrisponde biunivocamente a quella dei relativi sottospazi di proiezione. La classe dei sottospazi chiusi di H `e un reticolo: se M, N sono sottospazi chiusi, l’estremo superiore ed inferiore di tale coppia sono rispettivamente M ∨ N = < M, N > e M ∧ N = M ∩ N. Proviamolo. < M, N > `e un sopraspazio chiuso di M ed N per costruzione, inoltre, se L `e un sopraspazio chiuso di M e di N, deve contenerli entrambi e quindi contiene < M, N >, quindi M∨N = < M, N >. M∩N `e un sottospazio chiuso di M ed N per costruzione, inoltre, se L `e un sottospazio chiuso contenuto in M ed N, deve essere contenuto in M ∩ N, quindi M ∧ N = M ∩ N. Passando ai proiettori ed usando (7.13), avremo che se P, Q ∈ P(H), P ∨ Q `e il proiettore ortogonale che proietta su < P (H), Q(H) >, mentre P ∧ Q `e il proiettore ortogonale che proietta su P (H)∩ Q(H). Si osservi che la dimostrazione con le stesse argomentazioni, pu`o essere estesa immediatamente al caso di una famiglia di cardinalit` a qualsiasi di proiettori ortogonali {Pi }i∈I . In tal caso: ∨i∈I Pi `e il proiettore ortogonale che proietta su < {Pi (H)}i∈I > e ∧i∈I Pi `e il proiettore ortogonale che proietta su ∩i∈I Pi (H) per cui il reticolo dei pro` iettori ortogonali e quello dei sottospazi chiusi sono entrambi σ-completi. E chiaro che, nel reticolo dei sottospazi chiusi, il minimo ed il massimo sono, rispettivamente {0} e H. Passando al reticolo dei proiettori ortogonali tramite (7.13), si ha che il minimo ed il massimo sono, rispettivamente, il proiettore ortogonale che proietta su {0}, cio`e l’operatore nullo, ed il proiettore su H che coincide con l’operatore identit`a. L’ortocomplementazione di proiettori ¬P := I − P , corrisponde all’ortocomplementazione di sottospazi chiusi per (b) di proposizione 3.53: ¬P (M) := P (M)⊥ . La verifica delle propriet`a dell’operazione di ortocomplementazione per sottospazi (e quindi per proiettori) `e allora immediata tenendo conto di (b), (d) ed (e) nel teorema 3.14.
7.3 Proposizioni quantistiche come proiettori ortogonali
273
Diamo infine un controesempio per provare che il reticolo dei sottospazi chiusi, e quindi anche quello dei proiettori ortogonali, non `e distributivo. Consideriamo un sottospazio bidimensionale S di uno spazio di Hilbert H con dimensione ≥ 2. Possiamo identificare con C2 tale sottospazio scegliendo in esso una base ortonormale {e1 , e2 }. Si considerino quindi i tre sottospazi di S: H1 :=< e1 >, H2 :=< e2 >, H3 :=< e1 + e2 >. Vale H1 ∧(H2 ∨H3 ) = H1 ∧S = H1 , ma (H1 ∧H2 )∨(H1 ∧H3 ) = {0}∨{0} = {0}. Per cui: H1 ∧ (H2 ∨ H3 ) = (H1 ∧ H2 ) ∨ (H1 ∧ H3 ) . (b) e (c). Se i proiettori ortogonali P e Q commutano, oppure se i proiettori ortogonali {Qn }n∈N commutano a due a due, per il Lemma di Zorn, esiste sempre un insieme massimale di proiettori ortogonali commutanti a due a due P0 (H) che contiene P e Q oppure, rispettivamente, {Qn }n∈N . Con tale precisazione possiamo provare (b) e (c) contemporaneamente, scegliendo un tale P0 (H) arbitrariamente nella prova di (b). ` chiaro che 0 e I appartengono a P0 (H) dato che commutano con tutti gli E elementi di P0 (H). La stessa cosa accade per ¬P = I − P se P ∈ P0 (H). Bisogna ora provare che, per ogni coppia di proiettori P, Q ∈ P0 (H), esistono l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P0 (H), che questi si calcolano come detto in (b) e che, infine, tali proiettori coincidono con l’estremo superiore e quello inferiore per l’insieme {P, Q} nello spazio P(H). Le propriet` a di distributivit` a di ∨ e ∧ seguono facilmente dalle formule (7.10) e (7.9), dalle propriet` a di commutativit` a dei proiettori e dal fatto che i proiettori ortogonali soddisfano la propriet` a di idempotenza P P = P . Tenendo conto di (c) di proposizione 7.18, il proiettore su M ∩ N , che corrisponde a P ∧ Q in P(H), `e proprio P Q che appartiene a P0 (H) perch´e, per costruzione, commuta con tutti i proiettori di P0 (H) e tale insieme `e massimale. Concludiamo che: P ∧ Q := inf {P, Q} = inf {P, Q} = P Q . P0(H)
P(H)
Dato che P e Q commutano per ipotesi, il proiettore su < M, N >, che corrisponde a P ∨ Q calcolato in P(H), `e P + Q − P Q per (d) di proposizione 7.15 e tale proiettore appartiene a P0 (H) perch´e commuta con tutti i proiettori di P0 (H). Concludiamo, come sopra, che: P ∨ Q := sup {P, Q} = sup {P, Q} = P + Q − P Q . P0 (H)
P(H)
Quindi P0 (H) `e un’algebra di Boole. Mostriamo per concludere che P0 (H) `e σ-completo. Consideriamo una famiglia numerabile di proiettori {Qn }n∈N ed associamo a ciascuno dei Qn il nuovo proiettore Pn definito induttivamente come P0 := Q0 e, per n = 1, 2, . . .: Pn := Qn (I − P1 − . . . − Pn−1 ) .
274
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Si verifica facilmente per induzione che: (i) Pn Pm = 0 se n = m, (ii) Q1 ∨ · · · ∨ Qn = P1 ∨ · · · ∨ Pn = P1 + · · · + Pn per n = 0, 1, . . .. Si osservi che allora, se definiamo gli operatori limitati: An := P1 + · · · + Pn , risulta subito che: (iii) An = A∗n e An An = An per ogni n = 0, 1, . . ., cio`e gli An sono proiettori ortogonali per cui in particolare An ≤ I, per ogni n = 0, 1, . . . per (e) di proposizione 3.53, (iv) An ≤ An+1 per ogni n = 0, 1, . . . . Per la proposizione 3.56 esiste l’operatore limitato autoaggiunto Q dato dal limite forte: A = s- lim Pn = s- lim Q0 ∨ · · · ∨ Qn . n→+∞
n→+∞
` immediato verificare dall’espressione di sopra che AA = A, per cui A `e E ancora un proiettore ortogonale che appartiene a P0 (H) in quanto `e limite (forte) di operatori che commutano con tutti gli elementi di P0 (H). Vale, sempre per la proposizione 3.56, An ≤ A e quindi in particolare Qn ≤ Q1 ∨ · · ·∨Qn ≤ A per ogni n ∈ N. Mostriamo che A `e l’estremo superiore della classe dei Qn , sia in P(H) che in P0 (H). Supponiamo che il proiettore ortogonale K ∈ P(H) soddisfi K ≥ Qn per ogni n ∈ N. Questo significa che KQn = Qn per (a) di proposizione 7.18. Allora, dalla definizione degli operatori Pn , vale anche KPn = Pn e quindi KAn = An , per cui K ≥ An per ogni naturale n per (a) di proposizione 7.18. La proposizione 3.56 assicura allora che K ≥ A. In altre parole A ∈ P0 (H) `e un maggiorante della classe dei Qn ed ogni altro maggiorante K ∈ P(H) maggiora A. Per definizione di estremo superiore A = supP(H) {Qn }n∈N =: ∨n∈NQn . Dato che A ∈ P0 (H), A sar`a anche estremo ` chiaro che nell’identit` superiore in P0 (H). E a provata sopra: ∨n∈NQn = s- lim Q0 ∨ · · · ∨ Qn n→+∞
`e irrilevante l’ordine con cui sono stati etichettati i Qn dato che il primo membro, cio`e l’estremo superiore dell’insieme {Qn }n∈N, non dipende dall’ordine con cui si etichettano gli elementi dell’insieme per definizione. La formula (7.12) si dimostra facilmente usando ¬ e formula (7.11) per l’estremo superiore. La prova di (d) `e immediata tenendo semplicemente conto che la commutativit` a implica la distributivit`a del reticolo direttamente da (i) e (ii) di (b). Questa proposizione conclude la nostra brevissima introduzione alla teoria dei reticoli ed alle sue relazioni con la formulazione della Meccanica Quantistica. Essa mostra che ha o pu`o avere senso pensare di associare proiettori ortogonali a proposizioni relative a sistemi quantistici, descrivendo l’incompatibilit`a tra
7.3 Proposizioni quantistiche come proiettori ortogonali
275
proposizioni in termini di non commutativit` a dei proiettori associati. In questo contesto si ritrova anche la struttura classica, restringendosi a lavorare in insiemi di proiettori commutanti massimali (oppure, pi` u generalmente, che soddisfino la richiesta (ii) in (c) nella tesi del teorema dimostrato per ultimo). Ci si pu` o chiedere se sia possibile dare delle motivazioni pi` u profonde per la scelta di descrivere le propriet`a dei sistemi fisici quantistici tramite un reticolo di proiettori ortogonali che non siano la semplice risposta “perch´e funziona”. Importanti, sebbene parziali, risultati in questa direzione sono stati ottenuti da diversi autori (tra cui G. Mackey) a partire dal celebre lavoro di C. Piron Axiomatique Quantique Helv. Phys. Acta 37 439-468 (1964). ` importante precisare che quanto visto in questo capitolo `e solo un picE colo ed informale passo verso le diverse formulazione della Logica Quantistica (o logiche quantistiche) della quale non ci occuperemo. Si vedano a tal proposito [DCGi02, EGL09] oltre che [Bon97]. L’unica cosa che possiamo dire `e che per costruire le logiche quantistiche si preferisce considerare i sottospazi su cui proiettano i proiettori ortogonali piuttosto che i proiettori stessi. La struttura di reticolo nell’insieme dei sottospazi chiusi indotta dall’inclusione insiemistica non `e altro che quella dei proiettori di P(H) rispetto alla relazione d’ordine parziale tra operatori limitati ≥, come visto nella dimostrazione del teorema precedente. Il reticolo che si viene a costruire in questo modo, come accade per il corrispondente reticolo di proiettori ortogonali, soddisfa tutte le ipotesi che definiscono una σ-algebra di Boole eccetto la propriet` a distributiva. Soddisfa invece una propriet` a differente che produce la struttura di reticolo ortomodulare, limitato e σ-completo. Un punto importante `e il seguente. Per noi R := P ∧ Q indica solo il proiettore che proietta sull’intersezione dei sottospazi associati a P e Q. R pu` o avere o meno senso fisico come proposizione sul sistema, ma non corrisponde alla proposizione P E Q quando P e Q sono associati a proposizioni mutuamente incompatibili. Viceversa, nell’approccio dovuto a von Neumann e Birkhoff, che corrisponde alla cosiddetta logica quantistica standard, ∨ e ∧ vengono usati come veri e propri connettivi (soddisfacenti un’altra algebra rispetto ai connettivi usuali), anche quando connettono proiettori che corrispondono a proposizioni incompatibili per cui non esistono sistemi di misura in grado di assegnare a P e Q un valore di verit` a contemporaneamente. Il significato fisico di tali connettivi `e pertanto poco chiaro. Per questa ragione il punto di vista della Logica Quantistica standard `e stato criticato dai fisici (vedi il capitolo 5 di [Bon97] per una discussione approfondita). In realt` a vi sono almeno tre questioni che hanno portato allo stallo se non al fallimento del programma di Birkhoff e von Neumann di trovare l’impostazione fisica pi` u profonda della Meccanica Quantistica in una Logica Quantistica basata sulla teoria dei reticoli ortomodulari. (a) La mancanza di distributivit` a della Logica Quantistica rende difficile l’interpretazione del formalismo in termini di una struttura logica. (b) A dispetto di grandi sforzi, non sembra possibile una ragionevole generalizzazione dell’operatore implicazione e quindi non c’`e un vero sistema deduttivo nella Logica Quantistica.
276
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(c) La Logica Quantistica `e rimasta un linguaggio proposizionale, dato che non `e stato possibile trovare una estensione alla logica dei predicati. Negli ultimi anni, diversi autori hanno introdotto nuovi approcci formali, in un certo senso pi` u profondi, della Logica Quantistica `a la Birkhoff e von Neumann, in particolare impiegando la teoria dei topos [DI08, HLS09].
7.4 Le proposizioni e gli stati relativi a sistemi quantistici In questa sezione daremo i primi due assiomi della formulazione generale della Meccanica Quantistica, precisando come sono descritte matematicamente le proposizioni dei sistemi quantistici e gli stati dei sistemi quantistici, facendo uso di un opportuno spazio di Hilbert. Caratterizzeremo tali stati attraverso un importante teorema dovuto a Gleason. Infine mostreremo che gli stati quantistici formano un insieme convesso e possono essere costruiti come combinazioni lineari di stati estremali detti stati puri, che sono in corrispondenza biunivoca con gli elementi (raggi) dello spazio proiettivo associato allo spazio di Hilbert del sistema fisico. 7.4.1 Assiomi A1 e A2: proposizioni, stati di sistemi quantistici e il teorema di Gleason In base a quanto visto nella sezione precedente, assumeremo il seguente assioma della Meccanica Quantistica dove, come gi`a fatto precedentemente, indichiamo con la stessa lettera proposizioni e proiettori corrispondenti. A1. Le proposizioni riguardanti un sistema quantistico S sono in corrispondenza biunivoca con (un sottoinsieme de) il reticolo (rispetto all’inclusione di sottospazi) P(HS ) dei proiettori ortogonali di uno spazio di Hilbert (complesso) e separabile HS , detto spazio di Hilbert associato ad S. Inoltre: (1) La compatibilit` a tra proposizioni corrisponde alla commutativit` a dei rispettivamente associati proiettori ortogonali; (2) l’implicazione logica tra due proposizioni compatibili P ⇒ Q corrisponde alla relazione P ≤ Q per i proiettori associati; (3) I (operatore identit` a) e 0 (operatore nullo) corrispondono rispettivamente alla proposizione sempre vera ed a quella sempre falsa; (4) la negazione di una proposizione P , ¬P corrisponde al proiettore ortogonale ¬P = I − P ; (5) solo quando le proposizioni P e Q sono compatibili le proposizioni P O Q e P E Q hanno senso fisico e corrispondono rispettivamente ai proiettori ortogonali P ∨ Q e P ∧ Q; (6) se {Qn }n∈N `e un insieme numerabile di proposizioni a due a due compatibili, hanno senso fisico le proposizioni corrispondenti a ∨n∈N Qn e ∧n∈N Qn .
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
277
Osservazione 7.21. La richiesta che lo spazio HS sia separabile verr` a chiarita pi` u avanti quando considereremo sistemi quantistici concreti e daremo una rappresentazione esplicita di HS . Malgrado la questione sia alquanto sottile, d’ora in poi assumeremo che il sottoinsieme di P(HS ) che descrive le proposizioni del sistema sia tutto P(HS ) Possiamo anche dare un secondo assioma che riguarda gli stati quantistici. L’idea, basata su QM1 e QM2 (e sulle successive osservazioni) `e che uno stato quantistico al tempo t assegni la “probabilit` a” che sia vera ogni proposizione del sistema. L’idea `e quella di generalizzare il concetto di misura σ-additiva di probabilit` a. Invece di definirla su una σ-algebra, la dobbiamo pensare come definita sull’insieme dei proiettori associati alle proposizioni sul sistema. Sappiamo che ogni insieme massimale di proposizioni compatibili definisce un’algebra di Boole σ-finita, che `e una generalizzazione di una σ-algebra su cui si definiscono le misure. La richiesta naturale `e quindi la seguente. A2 (forma provvisoria). Uno stato ρ al tempo t su un sistema quantistico S `e un’applicazione ρ : P(HS ) → [0, 1] tale che: (1) ρ(I) = 1; (2) se {Pi }i∈N ⊂ P(HS ) soddisfa: Pi Pj = 0 per i = j, allora ρ s-
+∞
Pi
=
i=0
+∞
ρ(Pi ) .
i=0
Osservazioni 7.22. (1) La richiesta (1) dice semplicemente che la proposizione sempre vera ha probabilit` a certa di essere vera su ogni stato. (2) La richiesta (2) vale evidentemente anche per proposizioni in numero finito: `e sufficiente che definitivamente Pi = 0. (3) La richiesta (2) pu` o essere riscritta come: ρ (∨i∈N Pi ) =
+∞
ρ(Pi ) ,
i=1
per ogni classe di proposizioni {Pi }i∈N ⊂ P(HS ) compatibili e che si esclu+∞ dono a vicenda a due a due, per cui i=0 Pi = ∨i∈N Pi esiste sempre per la teorema 7.20. +∞ La prova dell’esistenza di i=0 Pi `e comunque la seguente. Nelle ipotesi fatte, le ridotte della serie definiscono operatori autoaggiunti idempotenti e quindi N proiettori ortogonali. Quindi Pi ≤ I per (e) della proposizione 3.53. i=0 N+1 N Inoltre i=0 Pi ≥ i=0 Pi come `e immediato provare. Quindi per la pro` posizione 3.56 esiste il limite in senso forte della successione delle ridotte. E
278
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
immediato provare che tale limite `e ancora idempotente ed autoaggiunto per cui `e un proiettore ortogonale. ` chiaro che ogni stato ρ determina l’equivalente di una misura positiva (4) E σ-additiva di probabilit` a in ogni insieme massimale di proiettori commutanti P0 (Hs ) che, come visto, `e una diretta generalizzazione del concetto di σalgebra. In questo senso abbiamo definito un’estensione del concetto di misura di probabilit` a. (5) Il lettore deve essere messo in guardia dall’idea di identificare la “misura di probabilit` a” ρ con una vera misura di probabilit` a su una σ-algebra: Il fatto che ora consideriamo anche proposizioni incompatibili in senso quantistico, cambia completamente le regole della probabilit` a condizionata. La probabilit` a che “sia vera P quando `e verificata Q” segue delle regole diverse da quelle in teoria della probabilit` a classica se P e Q sono incompatibili nel senso quantistico. Osservazione importante. Quando assegniamo uno stato ci saranno dunque delle proposizioni con probabilit` a 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni, e proposizioni con probabilit` a inferiore a 1 di essere verificate se il sistema viene sottoposto a processo di misura rispetto a tali proposizioni. Riguardo alla prima classe di proposizioni, possiamo pensare che esse corrispondano a propriet` a che il sistema effettivamente abbia nello stato considerato. Assumendo l’interpretazione standard della Meccanica Quantistica, in cui la probabilit` a non ha significato epistemico, dobbiamo concludere che le propriet` a relative alla seconda classe di proposizioni non sono definite nello stato considerato. Un esempio importante dal punto di vista fisico `e il seguente. Consideriamo le proposizioni PE che corrispondono alla propriet` a di un sistema fisico dato da una particella quantistica descritta sulla retta reale: “la particella ha posizione nel boreliano E ∈ B(R)”. Se lo stato ρ del sistema assegna ad ogni PE , con E limitato, probabilit` a inferiore a 1 (ed `e facile esibire uno di questi stati come vedremo pi` u avanti trattando il principio di indeterminazione di Heisenberg che come vedremo `e un teorema) dobbiamo concludere che: la posizione della particella, nello stato ρ, non `e definita. Da questo punto di vista risulta chiaro che la descrizione spaziale delle particelle come punti di una variet` a (in questo caso R) che rappresenta “lo spazio fisico di quiete” di un sistema di riferimento, non gioca pi` u un ruolo centrale a differenza di quanto accade in fisica classica. In un certo senso tutte le propriet` a (che possono assumere valori diversi a seconda dello stato) di un sistema fisico sono messe sullo stesso piano e lo “spazio” in cui descrivere il sistema ed i suoi stati `e uno spazio di Hilbert. Dal punto di vista matematico, la domanda che dobbiamo porci immediatamente `e se esistano davvero applicazioni ρ che godano delle propriet` a enunciate in A2.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
279
Dato uno spazio di Hilbert separabile H, mostriamo che esistono effettivamente applicazioni del tipo detto. Ovviamente la dimostrazione funziona anche, e diventa banale, nel caso in cui H abbia dimensione finita. Ricordiamo che B1 (H) indica lo spazio degli operatori di classe traccia su H (vedi il capitolo 4). Proposizione 7.23. Sia H spazio di Hilbert separabile e T ∈ B1 (H) un operatore positivo (e quindi autoaggiunto) con traccia di valore 1. Se definiamo ρT : P(H) → R come ρT (P ) := tr(T P ) per ogni P ∈ P(H) allora: (a) ρT (P ) ∈ [0, 1] per ogni P ∈ P(H), (b) ρT (I) = 1, (c) se {Pi }i∈N ⊂ P(H) soddisfa: Pi Pj = 0 per i = j, allora +∞ +∞ ρT sPi = ρT (Pi ) . i=0
i=1
Dimostrazione. Notiamo che T P `e di classe traccia per ogni P ∈ P(H) per (b) del teorema 4.30 essendo P limitato, per cui ha senso calcolare tr(T P ). La positivit` a di T assicura che gli autovalori di T sono tutti reali non negativi ((c) in proposizione 3.49). Mostriamo che in realt` a gli autovalori cadono tutti in [0, 1]. T `e un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.21, tenendo conto che |A| = A (perch´e A ≥ 0), e che quindi, nella decomposizione polare di A = U |A|, vale U = I, troviamo: mλ T = λ (uλ,i | ) uλ,i . (7.14) λ∈σp (A) i=1
Sopra σp (A) `e l’insieme degli autovalori di A e, se λ > 0, {uλ,i }i=1,...,mλ `e una base dell’autospazio associato a λ ∈ σp (A). Infine, la convergenza `e nella topologia uniforme. Possiamo riscrivere lo sviluppo di sopra come: T = λj (uj | )uj , (7.15) j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli autovettori detti, aggiungendo una base per il nucleo di T (la base complessiva `e comunque al pi` u numerabile perch´e H `e separabile). Calcolando la traccia di T sulla base degli uj , nelle nostre ipotesi abbiamo λj , 1 = tr(T ) = j
per cui λj ∈ [0, 1]. Si osservi che l’identit`a di sopra prova anche (b) essendo T I = I. Sia ora P ∈ P(H), Calcolando la traccia di T P sulla base detta: tr(T P ) = λj (uj |P uj ) . j
280
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Dato che (uj |P uj ) = (P uj |P uj ), abbiamo che 0 ≤ (uj |P uj ) ≤ ||P ||2||uj ||2 ≤ 1. dove abbiamo tenuto conto del fatto che ||uj || = 1 e che ||P || ≤ 1 ((e) in proposizione 3.53). In definitiva: 0≤ λj (uj |P uj ) ≤ λj = 1 j
j
per cui vale (a). Proviamo (c). Scegliamo una base hilbertiana {ui,j }j∈Ii in ogni spazio Pi (H). Lasciamo al lettore la verifica del fatto che, nelle nostre ipotesi, B := {ui,j }j∈Ii ,i∈N `e una base hilbertiana per il sottospazio chiuso su cui proietta il +∞ proiettore ortogonale P = s- i=0 Pi . Possiamo quindi completare B a base hilbertiana di H unendola con una base hilbertiana B di P (H)⊥ . Usando la continuit` a di T e (d) di proposizione 3.53: " # ρT (P ) = tr T s(u| )u = tr s(u| )T u . u∈B
u∈B
Ora calcoliamo la traccia usando la base hilbertiana B ∪ B :
v (u|v)T u = (u |T u ) , ρT (P ) =
v∈B∪B
u∈B
(7.16)
u∈B
dove si `e tenuto conto del fatto che, se u, v ∈ B ∪ U , (v|u) = δuv ed inoltre gli elementi di B sono ortogonali a quelli di B . Con una analoga procedura troviamo che: Ii +∞ +∞ ρT (Pi ) = (ui,j |T ui,j ) . i=1
i=1 j=1
Possiamo sempre ingrandire ogni insieme Ii fino a N definendo ui,j := 0 se j > sup Ii . In tal caso possiamo scrivere: +∞ i=1
ρT (Pi ) =
∞ +∞
(ui,j |T ui,j ) =
i=1 j=1
dμ(i) N
N
(ui,j |T ui,j )dμ(j) .
dove μ `e la misura che conta i punti in N e si `e tenuto conto di (c) di proposizione 3.22, notando che (ui,j |T ui,j ) ≥ 0 per ogni coppia i, j e quindi anche: N
(ui,j |T ui,j )dμ(j) ≥ 0
per ogni i ∈ N.
Con la stessa interpretazione l’ultima somma in (7.16) pu`o essere vista come: ρT (P ) = (u |T u ) = (ui,j |T ui,j ) dμ(i) ⊗ dμ(j) . u∈B
N×N
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
281
Dato che i numeri (ui,j |T ui,j ) sono non negativi e che l’integrale di sopra `e convergente, il teorema di Fubini-Tonelli, assicura che: +∞
ρT (Pi ) =
i=1
dμ(i)
N
N
(ui,j |T ui,j )dμ(j)
= N×N
(ui,j |T ui,j ) dμ(i) ⊗ dμ(j) = ρT (P ) ,
che `e l’enunciato nel punto (c).
Il seguente notevolissimo teorema (di cui daremo solo una traccia della sua complessa dimostrazione) dovuto a Gleason [Gle57] porta ad una caratterizzazione completa delle funzioni che soddisfano l’assioma A2. Teorema 7.24. (Di Gleason.) Sia H uno spazio di Hilbert, di dimensione finita ≥ 3, oppure di dimensione infinita e separabile. Per ogni funzione μ : P(H) → [0, +∞) con μ(I) < +∞ e tale che soddisfi (2) in A2, esiste un operatore T ∈ B1 (H) positivo tale che: μ(P ) = tr(T P )
per ogni P ∈ P(H).
Dimostrazione. Definiamo una frame function (non negativa) su uno spazio, H, di Hilbert infinitodimensionale separabile oppure di dimensione finita, come una funzione f : SH → [0, +∞), dove SH := {x ∈ H | ||x|| = 1}, tale che, per ogni base hilbertiana {xi }i∈K ⊂ H: f(xi ) < +∞ . i∈K
Usando risultati di von Neumann (vedi l’articolo di Gleason citato), si prova il seguente lemma. Lemma 7.25. Su uno spazio di Hilbert separabile o di dimensione finita ≥ 3, per ogni frame function f esiste un operatore limitato ed autoaggiunto T tale che f(x) = (x|T x) per ogni x ∈ SH . ` Consideriamo allora i proiettori ortogonali Px := (x| ) x per ogni x ∈ SH . E immediato verificare che, nelle nostre ipotesi su μ, f(x) := μ(Px ) definisce una frame function al variare di x, dato che: μ ≥ 0 ed inoltre risulta: f(xi ) = μ(Pxi ) = μ Pxi = μ (I) < +∞ . i∈K
i∈K
i∈K
Per il lemma di sopra, ci deve essere un operatore autoaggiunto T tale che μ(Px) = (x|T x) per ogni x ∈ SH . Dato che (x|T x) ≥ 0 per ogni x, T `e un operatore positivo e quindi T = |T | (infatti: |T |2 = T ∗ T per il teorema di decomposizione polare, ma T ∗ T = T 2 nelle nostre ipotesi, e valendo l’unicit` a
282
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
delle radici quadrate positive teorema 3.57). Se {xi }i∈K ⊂ H `e una base hilbertiana, deve allora valere: +∞ > μ(I) = f(xi ) = (xi |T xi ) = (xi | |T |xi) . i∈K
i∈K
i∈K
Per definizione di operatore di classe traccia (definizione 4.28), T = |T | `e dunque un operatore di classe traccia. Sia infine P ∈ P(H). Possiamo scegliere una base Hilbertiana di P (H): {xi }i∈J e completarla a base Hilbertiana di H aggiungendo una base hilbertiana {xi }i∈J di P (H)⊥ . In tal caso, J `e numerabile (o finito) per il teorema 3.31, inoltre: P = sP xi i∈J
per (d) di proposizione 3.53, infine: P xi P xj = 0 se i = j sono elementi di J. Allora, dato che P xi = xi se i ∈ J e P xi = 0 se i ∈ J : μ(P ) = μ(Pxi ) = (xi |T xi ) = (xi |T P xi) = tr(T P ) . i∈J
i∈J
i∈J∪J
Osservazioni 7.26. (1) La dimostrazione di Gleason funziona anche per spazi di Hilbert definiti sul campo reale. (2) Si pu` o notare che l’operatore T ha traccia 1 se μ(I) = 1, come nel caso considerato nell’assioma A2. (3) Se il campo dello spazio di Hilbert `e complesso, come in tutti i casi considerati in questo libro e come nell’assioma A2, l’operatore T associato a μ `e unico: ogni altro operatore T di classe traccia che soddisfa μ(P ) = tr(T P ) per ogni P ∈ P(H) deve anche soddisfare: (x|(T − T )x) = 0 per ogni x ∈ H. Infatti, se x = 0 ci` o `e ovvio, mentre se x = 0 possiamo sempre completare a base hilbertiana il vettore x/||x|| e, se Px `e il proiettore su < x >, la condizione tr((T − T )Px) = 0 si scrive, sulla base detta: ||x||−2(x|(T − T )x) = 0. Per l’esercizio 3.10 ci`o implica che T − T = 0. (4) La richiesta di spazio di Hilbert di dimensione > 2 `e irrinunciabile come ora proviamo, esibendo un controesempio. Si verifica subito che, su C2 , i proiettori ortogonali sono 0, I e tutte le matrici della forma: 3 1 I+ Pn := ni σi , con n = (n1 , n2 , n3 ) ∈ R3 t.c. |n| = 1, 2 i=2
dove σ1 , σ2, σ3 sono le matrici di Pauli: + + + * * * 01 0 −i 1 0 , σ2 = , σ3 = . σ1 = 10 i 0 0 −1
(7.17)
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
283
Vi `e corrispondenza biunivoca tra i proiettori Pn ed i punti n ∈ S2 , la sfera in dimensione 2 da raggio 1. Le funzioni μ che soddisfano le richieste in del teorema di Gleason possono quindi pensarsi come funzioni definite su S2 ∪ {0, I}. Le richieste nel teorema di Gleason si riducono a: μ(0) = 0, μ(I) = 1 e μ(n) = 1 − μ(−n). Gli operatori positivi di classe traccia con traccia unitaria, si verificano essere tutti e soli quelli della forma: 3 1 ρu = I+ con u ∈ R3 t.c. |u| ≤ 1 . ui σi (7.18) 2 i=2
Se · indica l’ordinario prodotto scalare in R3 , vale: tr(ρu Pn ) =
1 (1 + u · n) , 2
come si prova eseguendo esplicitamente il calcolo ed usando la forma data delle matrici di Pauli. L’applicazione μ definita da μ(0) = 0, μ(I) = 1 e, per ogni n ∈ S2 e per un fissato v ∈ S2 : μ(Pn ) =
1 1 + (v · n)3 , 2
soddisfa le ipotesi nel teorema di Gleason. Tuttavia si verifica facilmente che non ci sono operatori ρu di forma (7.18) tali che μ(Pn ) := tr(ρu Pn ) per ogni proiettore ortogonale Pu , cio`e, non ci sono u ∈ R3 con |u| ≤ 1 tali che: (1 + u · n) = 1 + (v · n)3 per ogni n ∈ S2 . Il teorema di Gleason insieme alle considerazioni esposte sopra, unitamente al fatto che tutti i sistemi quantistici noti hanno spazio di Hilbert con dimensione che soddisfa le ipotesi del teorema di Gleason4 , conducono alla seguente riformulazione dell’assioma A2. A2. Uno stato ρ al tempo t su un sistema quantistico S, con spazio di Hilbert associato HS , `e un operatore positivo di classe traccia con traccia unitaria su HS . La probabilit` a che la proposizione P ∈ P(HS ) sia vera sullo stato ρ vale tr(ρP ).
4 Le particelle con spin 1/2 ammettono uno spazio di Hilbert – in cui si definisce l’osservabile spin – di dimensione 2. La stessa cosa accade per lo spazio di Hilbert in cui viene descritta la polarizzazione della luce (elicit`a del fotone). Tuttavia questi sistemi fisici, quando descritti completamente, per esempio includendo i gradi di libert` a posizionali o legati all’impulso, sono rappresentabili in uno spazio di Hilbert infinitodimensionale separabile.
284
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Possiamo quindi dare la seguente definizione. Definizione 7.27. Sia H spazio di Hilbert separabile. Un operatore di classe traccia, positivo e con traccia uguale a 1 si dice stato su H. L’insieme degli stati su H si indica con S(H). Osservazione importante. Il teorema di Gleason ha una conseguenza fisica fondamentale che distingue nettamente gli stati dei sistemi classici da quelli dei sistemi quantistici. I sistemi classici ammettono stati completamente deterministici, descritti da quelli che abbiamo chiamato stati sharp: misure di Dirac con supporto su un punto nello spazio delle fasi al tempo considerato. Tali misure assumono solo i valori 0 e 1 e sono quindi stati in cui ogni proposizione `e certa oppure `e falsa e non ci sono possibilit` a intermedie. Analoghi stati non esistono per sistemi quantistici descritti in spazi di Hilbert infinitodimensionali. La prova `e elementare: se x appartiene all’insieme SH dei vettori di norma unitaria e Px `e il proiettore ortogonale (x|·)x, ogni stato ρ, per il teorema di Gleason, determina una funzione, evidentemente continua, SH x → μ(Px ) = (x|ρx). Dato che SH `e connesso5 e che le funzioni continue mandano connessi in connessi, μ(Px ) deve essere connesso al variare di x. Se μ assume solo valori 0 oppure 1, deve essere (x|ρx) = 0 per ogni x e quindi si averebbe ρ = 0 che violerebbe tr(ρ) = 1, oppure (x|ρx) = 1 per ogni x e quindi si avrebbe ρ = I, che non `e di classe traccia nel caso infinitodimensionale. Questo risultato negativo ha rilevanza nei tentativi di costruire modelli classici della meccanica quantistica introducendo “variabili nascoste”, perch´e pone dei severi vincoli su tali modelli. 7.4.2 Stati puri, stati misti, ampiezze di transizione Passiamo a studiare l’insieme degli stati S(HS ) se HS `e lo spazio di Hilbert associato al sistema quantistico S. Dobbiamo preliminarmente ricordare alcune nozioni. Ricordiamo finita di che in uno spazio vettoriale X, una combinazione lineare vettori i∈F αi xi `e detta convessa se αi ∈ [0, 1] per i ∈ F e i∈F αi = 1. C ⊂ X `e detto convesso se, per ogni coppia x, y ∈ C, λx + (1 − λ)y ∈ C 5
Tale insieme `e infatti connesso per archi continui e dunque connesso. Diamo una traccia della dimostrazione di tale fatto. Se x, y ∈ SH allora ci sono due casi. Nel primo caso x = eiα0 y per qualche α0 > 0 e quindi x `e connesso a y dalla curva, continua rispetto alla topologia dello spazio di Hilbert e tutta inclusa in S, [0, α0 ] α → eiα x. Nel secondo caso x `e combinazione lineare di y e di un vettore y ∈ SH perpendicolare a y, che si ottiene costruendo una base ortonormale nel sottospazio generato da y e x, quando tale base ammetta y come primo vettore. Dato che ||x|| = ||y|| = ||y || = 1 e che y ⊥ y , deve allora essere x = eiα cos βy + eiδ sin βy per una terna di reali α, β, δ. Allora x `e connesso ad y tramite una curva, continua e completamente contenuta in SH , che si ottiene variando questi tre parametri separatamente in tre opportuni intervalli.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
285
per ogni λ ∈ [0, 1] (conseguentemente tutte combinazioni lineari convesse di elementi di C appartengono a C). Se C `e convesso, e ∈ C `e detto estremale se non `e scrivibile come e = λx + (1 − λ)y con λ ∈ (0, 1) e x, y ∈ C \ {e}. Definizione 7.28. Sia X spazio vettoriale sul campo K = C o R e si consideri la relazione di equivalenza su X: u ∼ v se e solo se v = αu per qualche α ∈ K \ {0}. Lo spazio quoziente X/∼ `e detto spazio proiettivo associato a X. Gli elementi di X/∼ diversi da [0] (classe di equivalenza del vettore nullo) sono detti raggi di X. Proposizione 7.29. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) S(H) `e un sottoinsieme convesso di B1 (H). (b) Gli elementi estremali di S(H) sono tutti e soli quelli della forma: ρψ := (ψ| )ψ ,
per ogni vettore ψ ∈ H con ||ψ|| = 1.
Pertanto esiste una corrispondenza biunivoca tra l’insieme degli stati estremali e l’insieme dei raggi di H, che associa allo stato estremale (ψ| )ψ il raggio [ψ]. (c) Ogni stato ρ ∈ S(H) soddisfa: ρ ≥ ρρ ed `e estremale se e solo se soddisfa: ρρ = ρ . (d) Ogni stato ρ ∈ S(H) `e una combinazione lineare di stati estremali, includendo le combinazioni lineari infinite nella convergenza definita dalla topologia uniforme. In particolare esiste sempre una decomposizione: ρ= pφ (φ| )φ φ∈N
dove N `e una base hilbertiana di H fatta di autovettori di ρ, pφ ∈ [0, 1] per ogni φ ∈ N e: pφ = 1 . φ∈N
Dimostrazione. (a). Presi due stati ρ, ρ `e chiaro che λρ+(1−λ)ρ `e ancora un operatore di classe traccia in quanto gli operatori di classe traccia formano un sottospazio di B(H) (teorema 4.30). Dalle propriet` a di linearit` a della traccia (proposizione 4.32): tr[λρ + (1 − λ)ρ ] = λtrρ + (1 − λ)trρ = λ1 + (1 − λ)1 = 1 .
286
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Infine, se f ∈ H e λ ∈ [0, 1], tenendo conto che ρ e ρ sono positivi: (f|(λρ + (1 − λ)ρ )f) = λ(f|ρf) + (1 − λ)(f|ρ f) ≥ 0 . Quindi λρ + (1 − λ)ρ `e uno stato se ρ, ρ sono stati e λ ∈ [0, 1]. (b) e (d). Consideriamo ρ ∈ S(H). ρ `e un operatore compatto autoaggiunto (in quanto positivo). Usando la decomposizione vista nel teorema 4.21, tenendo conto che |ρ| = ρ (perch´e ρ ≥ 0), e che quindi, nella decomposizione polare di ρ = U |ρ|, vale U = I, troviamo: ρ=
mλ
λ (uλ,i | ) uλ,i .
(7.19)
λ∈σp (ρ) i=1
Sopra σp (ρ) `e l’insieme degli autovettori di ρ e, se λ > 0, {uλ,i }i=1,...,mλ `e una base dell’autospazio associato a λ ∈ σp (ρ). Infine, la convergenza `e nella topologia uniforme. Questo sviluppo da solo prova (d). Completando a base hilbertiana ∪λ>0 {uλ,i }i=1,...,mλ aggiungendo una base per Kerρ, dalla proposizione 4.32, otteniamo che deve anche essere: 1 = tr(ρ) = mλ λ . (7.20) λ∈σp (ρ)
` immediato verificare Supponiamo ora che ρψ := (ψ| )ψ , con ||ψ|| = 1. E che ρψ ∈ S(H). Vogliamo provare che ρψ `e estremale in S(H). Assumiamo pertanto che esistano ρ, ρ ∈ S(H) e λ ∈ (0, 1) per cui: ρψ = λρ + (1 − λ)ρ . Mostreremo che ρ = ρ = ρψ . ` chiaro che (completando Consideriamo il proiettore ortogonale Pψ = (ψ| )ψ. E ψ a base Hilbertiana): tr(ρψ Pψ ) = 1. Ne consegue che: 1 = λtr(ρPψ ) + (1 − λ)tr(ρ Pψ ) . Dato che λ ∈ (0, 1) e 0 ≤ tr(ρPψ ) ≤ 1, 0 ≤ tr(ρ Pψ ) ≤ 1, questo `e possibile solo se tr(ρPψ ) = tr(ρ Pψ ) = 1. Proviamo allora che tr(ρPψ ) = 1 e tr(ρ Pψ ) = 1 implicano che ρ = ρ = ρψ . Decomponendo ρ come in (7.19), tr(ρPψ ) = 1 si riscrive:
λj |(uj |ψ)|2 = 1 ,
(7.21)
j
dove abbiamo etichettato su N (o su un suo sottoinsieme finito se dim(H) < +∞) l’insieme degli autovettori uj = uλ,i , con λ > 0, denotando con λj l’autovalore di uj ed abbiamo completato a base hilbertiana di H l’insieme degli
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
287
autovettori detti, aggiungendo una base per il nucleo di ρ (la base complessiva `e comunque al pi` u numerabile perch´e H `e separabile). Per ipotesi: λj = 1 , (7.22)
j
|(uj |ψ)|2 = 1 .
(7.23)
j
Dato che λj ∈ [0, 1] e |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, avremo che valgono anche: λ2j ≤ 1 , (7.24)
j
|(uj |ψ)|4 ≤ 1 .
(7.25)
j
Per cui la successione dei λj e quella dei |(uj |ψ)|2 sono in 2 (N). L’identit`a (7.21) insieme alle (7.24) e (7.25) ed alla disuguaglianza di Cauchy-Schwarz in 2 (N), implicano infine che deve essere: λ2j = 1 , (7.26)
j
|(uj |ψ)|4 = 1 .
(7.27)
j
Dato che λj ∈ [0, 1] per ogni j ∈ N, (7.22) e (7.26) sono compatibili solo se tutti i λi sono nulli eccetto uno, λp , che vale esattamente 1. Nello stesso modo, dato che |(uj |ψ)|2 ∈ [0, 1] per ogni j ∈ N, (7.23) e (7.27) sono compatibili solo se tutti i numeri |(uj |ψ)| sono nulli, eccetto uno, |(uk |ψ)|, che vale 1. Dato che gli ui formano una base hilbertiana e ||ψ|| = 1, deve dunque essere che ` chiaro che deve essere k = p altrimenti tr(ρPψ ) = 0. ψ = αuk , dove |α| = 1. E Essendo: ρ= λj (uj | )uj , j
in base a quanto trovato, abbiamo finalmente che: ρ = λk (uk | )uk = 1 · (uk | )uk = α−1 α−1 (ψ| )ψ = |α|−1(ψ| )ψ = (ψ| )ψ = ρψ . Con la stessa procedura si prova che ρ = ρψ . Se uno stato ρ non `e del tipo (ψ| )ψ, si potr` a comunque decomporre come: ρ= λj (uj | )uj , j
in cui almeno due valori p = q per cui λp = λq sono entrambi non nulli e quindi, in particolare, λp , 1 − λp ∈ (0, 1). In tal caso potremo riscrivere ρ
288
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
come: ρ = λp (up | )up + (1 − λp )
j=p
λj (uj | )uj . (1 − λp )
(up | )up `e uno stato come gi` a detto ed `e immediato verificare che anche: λj ρ := (uj | )uj , (1 − λp ) j=p
`e uno stato di S(H) (ovviamente ρ = (up | )up per costruzione essendo uq ∼ up). Abbiamo quindi provato che ρ non `e estremale. L’applicazione f che associa allo stato estremale (ψ| )ψ il raggio [ψ] `e ben definita. Infatti, cominciamo a notare che, per definizione di stato estremale ||ψ|| = 1, per cui ψ = 0 e quindi [ψ] `e un raggio. Uno stesso stato estremale pu` o essere scritto in vari modi diversi: vale infatti (come `e immediato provare tenendo conto che deve essere ||φ|| = 1) che (ψ| )ψ = (φ| )φ se e solo se ψ = eiα φ per qualche α ∈ R. Ma allora, per definizione di raggio, [ψ] = [φ]. Mostriamo che l’applicazione f `e iniettiva. Se φ e ψ hanno norma unitaria e [ψ] = [φ] allora ψ = eiα φ per qualche α ∈ R e quindi (ψ| )ψ = (φ| )φ. Infine l’applicazione f `e suriettiva, perch´e, se [φ] `e un raggio e quindi ||φ|| = 0, ci sar`a ψ ∈ [φ] con ||ψ|| = 1. In tal caso f((ψ| )ψ) = [φ] perch´e ψ = αφ per qualche α ∈ C non nullo. (c). Dimostriamo prima la seconda affermazione. Se ρ `e estremale, ρρ = ρ come si prova immediatamente usando la forma data in (b) per gli stati estremali. Decomponendo uno stato ρ come (con il significato spiegato sopra): ρ= λj (uj | )uj , j
si ha subito che: ρρ =
λ2j (uj | )uj .
j
Se `e ρρ = ρ, passando alle tracce, dovr` a essere: λ2j = λj = 1 j
j
con λj ∈ [0, 1]. Si prova facilmente che questo `e possibile solo se tutti i λj sono nulli eccetto uno, λk , il cui valore `e 1. Ma allora: ρ= λj (uj | )uj = 1 · (uk | )uk , j
che `e uno stato estremale per (b). Proviamo la prima affermazione. Sia x = j αj uj un vettore arbitrario di H (si ricordi che gli uj definiscono una base hilbertiana di H), allora, dato che λj ∈ [0, 1]: (x|ρρx) = λ2j (x|uj )(uj |x) = λ2j |αj |2 j
j
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
≤
j
λj |αj |2 =
289
λj (uj |x)(uj |x) = (x|ρx) .
j
Quindi ρρ ≤ ρ.
Possiamo dare la seguente definizione. Definizione 7.30. Sia (H, ( | )) uno spazio di Hilbert separabile. (a) gli elementi estremali in S(H) sono detti stati puri ed il loro insieme `e indicato con Sp (H), gli stati non estremali sono detti stati misti o miscele. (b) Se vale: ψ= α i φi , i∈I
con I finito o numerabile (e la convergenza della serie `e nella topologia di H nel secondo caso), dove i vettori φi ∈ H sono tutti non nulli e 0 = αi ∈ C, si dice che lo stato (ψ| )ψ `e sovrapposizione coerente degli stati (φi | )φi /||φi ||2. (c) Se ρ ∈ S(H) soddisfa: ρ= pi ρi i∈I
con I finito, ρi ∈ S(H) e 0 = pi ∈ [0, 1] per ogni i ∈ I ed infine i pi = 1, si dice che lo stato ρ `e sovrapposizione incoerente o miscela degli stati (eventualmente puri) ρi . (d) Se ψ, φ ∈ H soddisfano ||ψ|| = ||φ|| = 1: (i) il numero complesso (ψ|φ) viene detto ampiezza di transizione o ampiezza di probabilit` a dello stato (φ| )φ sullo stato (ψ| )ψ, (ii) il numero reale non negativo |(ψ|φ)|2 viene detto probabilit` a di transizione dello stato (φ| )φ sullo stato (ψ| )ψ. Osservazioni 7.31. (1) I vettori dello spazio di Hilbert di un sistema quantistico associati a stati puri vengono spesso detti, in letteratura fisica, funzioni d’onda. La motivazione di tale terminologia `e dovuta alla prima formulazione della Meccanica Quantistica in termini di Meccanica Ondulatoria (vedi capitolo 6). (2) La possibilit` a di costruire stati puri con vettori non nulli che sono combinazione lineare di vettori associati ad altri stati puri `e quello che, nel gergo della Meccanica Quantistica, si chiama principio di sovrapposizione degli stati (puri). (3) Si osservi che in (c), nel caso in cui ρi = ψi (ψi | ), non `e richiesto che (ψi |ψj ) = 0 se i = j. Tuttavia `e immediato provare che se I `e finito, nel caso di ρi stato misto o puro e pi ∈ [0, 1] per ogni i ∈ I con i pi = 1, allora: ρ= pi ρi i∈I
`e di classe traccia (`e questo `e ovvio perch´e gli operatori di classe traccia formano uno spazio vettoriale e ogni ρi `e di classe traccia), `e positivo (perch´e combinazione lineare con coefficienti positivi di operatori positivi) ed ha traccia
290
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
unitaria perch´e, per le propriet` a di linearit` a della traccia (proposizione 4.32): pi ρi = pi trρi = pi · 1 = 1 . trρ = tr i∈I
i∈I
i∈I
La decomposizione di ρ su una base hilbertiana di suoi autovettori pu` o considerarsi un caso limite della decomposizione di sopra quando I `e infinito numerabile, ρi = ψi (ψi | ) e (ψi |ψj ) = δij . ` importante notare che: in generale, un fissato stato misto ammette pi` E u di una decomposizione incoerente in termini di stati puri e misti. (4) Si consideri lo stato puro ρψ ∈ Sp (H), che quindi si scriver` a come ρψ = (ψ| )ψ per qualche vettore ψ ∈ H con ||ψ|| = 1. Il punto che vogliamo sottolineare qui `e che tale stato puro `e anche un proiettore ortogonale Pψ := (ψ| )ψ e, di conseguenza, deve corrispondere ad una proposizione sul sistema. L’interpretazione naturale ed ingenua6 di tale proposizione `e che essa corrisponda all’affermazione: “lo stato del sistema `e lo stato puro individuato dal vettore ψ”. Tale interpretazione `e dovuta al fatto che, se ρ ∈ S(H), allora tr(ρPψ ) = 1 se e solo se ρ = (ψ| )ψ. Infatti, se ρ = (ψ| )ψ, allora completando a base hilbertiana ψ e facendo la traccia su tale base, risulta immediatamente che tr(ρPψ ) = 1. Supponiamo viceversa che valga tr(ρPψ ) = 1 per lo stato ρ. Sotto tali ipotesi deve essere ρ = (ψ| )ψ come dimostrato nella prova della proposizione 7.29. (5) Il punto (4) consente di dare un’interpretazione al modulo quadro dell’ampiezza di transizione (φ|ψ). Se ||φ|| = ||ψ|| = 1, come richiesto nella definizione di ampiezza di transizione, risulta immediatamente che: tr(ρψ Pφ ) = |(φ|ψ)|2 , dove ρψ := (ψ| )ψ e Pφ = (φ| )φ. Tenendo allora conto di (4), concludiamo che: |(φ|ψ)|2 `e la probabilit` a che, essendo lo stato (al tempo t) individuato dal vettore ψ, diventi lo stato individuato da φ in seguito a processo di misura sul sistema (al tempo t). Si osservi che |(φ|ψ)|2 = |(ψ|φ)|2 , per cui la probabilit` a di transizione dello stato individuato da ψ sullo stato individuato da φ coincide con l’analoga probabilit` a con i ruoli dei due vettori scambiati. Questo fatto non `e, a priori, per nulla fisicamente evidente.
6
Non possiamo fare a meno di notare una certa confusione di livelli semantico/sintattico in questa interpretazione. Tuttavia, per come l’interpretazione viene usata dai fisici, non crea problemi, ma potrebbe crearne in una formulazione rigorosa dal punto di vista logico formale.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
291
7.4.3 Assioma A3: stati successivi ai processi di misura e preparazione degli stati La formulazione standard della Meccanica quantistica assume il seguente assioma su ci`o che succede al sistema fisico S, nello stato ρ ∈ S(HS ) al tempo t, quando viene sottoposto ad un processo di misura riguardante la proposizione P ∈ P(HS ), se la proposizione risulta essere verificata (e quindi in particolare tr(ρP ) > 0 prima della misura). A3. Se il sistema quantistico S si trova nello stato ρ ∈ S(HS ) al tempo t e la proposizione P ∈ P(HS ) risulta essere verificata in seguito al processo di misura allo stesso tempo t, lo stato del sistema immediatamente dopo la misura `e: P ρP ρP := . tr(ρP ) In particolare se ρ `e puro ed `e individuato dal vettore ψ con ||ψ|| = 1, lo stato del sistema immediatamente dopo la misura `e ancora puro ed `e individuato dal vettore: Pψ ψP = . ||P ψ|| ` ovvio che, in entrambi i casi, ρP e ψP definiscono stati. Nel primo caso E infatti ρP `e positivo, di classe traccia con traccia unitaria, nel secondo caso, vale ||ψP || = 1. Osservazioni 7.32. (1) Come gi`a sottolineato precedentemente, la misura di una propriet` a o di una grandezza fisica avviene facendo interagire il sistema con un apparato di misura (supposto macroscopico e soggetto alle leggi della fisica classica). La Meccanica Quantistica nella sua formulazione standard non stabilisce cosa sia un apparato di misura, ma solo che ne esistano, e nemmeno `e in grado di descrivere l’interazione tra strumento di misura e sistema quantistico al di fuori della schematizzazione di A3. Esistono vari punti di vista e congetture su come completare la descrizione fisica del processo di misura, chiamato nel gergo della Meccanica quantistica collasso o riduzione dello stato o della funzione d’onda. Ma per varie ragioni nessuna delle proposte attuali `e completamente soddisfacente [Des80, Bon97, Ghi97, Alb00]. Una proposta molto interessante `e stata fatta nel 1985 da G.C. Girardi, T. Rimini e A. Weber (Physical Review D34, 1985 p.470) in cui si descrive in modo dinamico non lineare il processo di misura della posizione e lo si assume non dovuto ad uno strumento di misura ma ad un processo di autolocalizzazione. Purtroppo l’idea ha ancora diversi problemi, in particolare non ammette in modo ovvio una descrizione relativistica. (2) L’assioma A3 si riferisce a misure non distruttive, anche dette misure indirette [BrKh95], in cui il sistema fisico misurato (tipicamente una particella) non viene assorbito/distrutto dallo strumento di misura.
292
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(3) Gli strumenti di misura si usano comunemente per preparare un sistema in uno stato. Dal punto di vista teorico la preparazione di uno stato puro viene fatta nel modo seguente. Si sceglie un numero finito di proposizioni compatibili P1 , . . . , Pn, in maniera tale che il sottospazio su cui proietta P1 ∧ · · · ∧ Pn = P1 · · · Pn sia unidimensionale. Ossia P1 · · · Pn = (ψ| )ψ per qualche vettore con ||ψ|| = 1. (L’esistenza di tali proposizioni `e nota per praticamente tutti i sistemi fisici quantistici che si usano sperimentalmente.) Quindi si eseguono misure contemporanee delle proposizioni Pi su vari esemplari identici del sistema fisico considerato (es. elettroni) di cui per` o non si conoscono gli stati iniziali. Se, per uno di tali sistemi, tutte le misure di tutte le proposizioni hanno dato esito positivo, immediatamente dopo le misure, lo stato del sistema `e quello individuato dal vettore ψ e si dice che il sistema `e stato preparato in tale stato. Normalmente ad ogni proiettore Pi `e associata una grandezza fisica Ai misurabile sul sistema e Pi definisce la proposizione “la grandezza Ai cade nell’insieme Ei ”. Quindi di fatto, per preparare un sistema (disponibile in un numero arbitrario di copie identiche) nello stato puro ψ, si misurano contemporaneamente una serie di grandezze fisiche Ai compatibili e si selezionano i sistemi in cui gli esisti delle misure di Ai sono caduti in tutti i prefissati insiemi Ei . (4) Vediamo come si possono costruire stati misti miscelando stati puri. Si considerino una quantit` a q1 di copie identiche del sistema S preparate nello stato puro associato a ψ1 , una analoga quantit` a q2 di copie identiche dello stesso sistema S preparate nello stato puro associato a ψ2 e via di seguito fino a ψn . Se si mischiano tali sistemi, dopo la miscela, ciascuno di essi si trover`a nello stato misto: ρ=
n
pi (ψi | )ψi ,
i=1
n dove pi := qi / i=1 qi . Si noti che in generale `e falso che (ψi |ψj ) = 0 se i = j per cui, l’espressione di sopra per ρ non `e la decomposizione su una base hilbertiana di autovettori di ρ stesso. Questa procedura potrebbe fare pensare che esistano due tipi di probabilit` a, una intrinseca dovuta alla natura quantistica degli stati ψi e l’altra epistemica, inglobata nelle probabilit` a pi . In realt` a non `e vero: una volta creato lo stato misto con la procedura detta sopra, non c’`e pi` u alcun modo, all’interno della Meccanica Quantistica, di distinguere gli stati della miscela. Per esempio, si osservi che la stessa miscela ρ si sarebbe potuta ottenere miscelando stati puri diversi da quelli individuati dai vettori ψi . In particolare, si sarebbero potuti usare quelli della decomposizione di ρ in termini di una base hilbertiana di suoi autovettori. Dal punto di vita fisico, facendo misure di qualsiasi genere (assumendo gli assiomi della Meccanica Quantistica fino ad ora enunciati) non sarebbe possibile distinguere le due miscele.
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
293
7.4.4 Regole di superselezione e settori coerenti I sistemi quantistici noti sono tali che non tutti i vettori ψ normalizzati a 1 determinano stati ammissibili fisicamente. Ci sono ragioni teoriche di vario genere (sulle quali non ci soffermiamo ora, ma torneremo in seguito con un importante esempio) che implicano l’esistenza di cosiddette regole di superselezione. In base a tali regole, lo spazio di Hilbert del sistema H risulta essere una somma diretta ortogonale (al pi` u numerabile perch`e lo spazio somma `e numerabile) di sottospazi chiusi detti settori coerenti: H = H1 ⊕ H2 ⊕ · · · e gli unici stati, individuati da singoli vettori, fisicamente ammissibili sono quelli rappresentati da vettori in H1 , oppure H2 , oppure H3 ,, ... Ma non sono fisicamente ammessi stati individuati da combinazioni lineari di vettori appartenenti a spazi coerenti distinti. Dal punto di vista fisico, i settori coerenti sono i sottospazi di H associati ad una classe di proposizioni mutuamente esclusive – cio`e i proiettori ortogonali P1 , P2 , . . . che proiettano su tali spazi mutuamente ortogonali, con i Pi = I (la somma `e in senso forte se `e eseguita su un insieme infinito di termini). La proposizione associata a Pi corrisponde all’asserto che una certa grandezza, quella che determina la regola di superselezione, ha un certo valore. Pi` u in generale la grandezza non `e richiesta assumere un valore preciso in ciascuno di questi sottospazi, ma solo in una precisa classe di valori, dichiarata dalla proposizione stessa. Vediamo due corrispondenti esempi. (1) Come primo esempio citiamo la regola di superselezione della carica elettrica per i sistemi quantistici elettricamente carichi. Essa richiede che: ogni vettore ψ che determina uno stato del sistema, deve verificare una proposizione PQ del tipo: “il valore della carica del sistema vale Q” per qualche valore Q. Matematicamente quindi deve essere tr(PQ (ψ| )ψ) = 1 per qualche valore della carica Q, che equivale a dire PQψ = ψ per qualche valore della carica Q. In altre parole: non sono ammessi stati, individuati da singoli vettori, in cui la carica non ha un valore definito. Questa richiesta `e ovvia in fisica classica, ma non lo `e in meccanica quantistica, dove un sistema elettricamente carico, a priori, potrebbe ammettere stati in cui la carica non `e definita. Si osservi che la richiesta che lo spazio di Hilbert del sistema sia separabile richiede che i valori possibili Q per la carica elettrica, cio`e i settori coerenti a carica definita, siano al pi` u una quantit` a numerabile e quindi la carica elettrica non pu` o variare con continuit` a. (2) Un’altra regola di superselezione riguarda il momento angolare di ogni sistema fisico. Dalla meccanica quantistica `e noto che il modulo del momento angolare al quadrato J 2 , quando `e in uno stato definito, pu` o assumere solo valori interi oppure semi interi (in unit` a i2 = h/2π dove h `e la solita costante di Planck). Esiste allora una decomposizione dello spazio di Hilbert del sistema
294
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
fisico in due sottospazi chiusi ortogonali. Uno in cui J 2 ha valori interi ed uno in cui J 2 ha valori semi interi. La regola di superselezione del momento angolare richiede che i vettori che rappresentano stati del sistema non siano ` importante notare che combinazione lineare di vettori nei due sottospazi. E uno stato puro pu` o quindi essere a momento angolare non definito, in quanto il vettore associato allo stato `e combinazione lineare di vettori corrispondenti a stati puri con diversi valori del momento angolare, tuttavia, a causa della regola di superselezione, tali valori devono essere tutti interi oppure tutti semi interi. Nel caso di presenza di regole di superselezione associate alla decomposizione di H nella somma diretta in settori coerenti: H= Hk , (7.28) k∈K
possiamo definire gli spazi degli stati e degli stati puri di ciascun settore: S(Hk ), Sp (Hk ). Possiamo identificare questi insiemi con sottoinsiemi di S(H) e Sp (H) rispettivamente, in base al seguente ovvio argomento: se M `e un sottospazio chiuso dello spazio di Hilbert H, possiamo identificare A ∈ B(M) con un operatore di B(H), semplicemente estendendolo come l’operatore nullo su M⊥ . Se A `e positivo di classe traccia, la sua estensione rimane tale ed il valore della traccia `e conservata. Se A `e della forma (ψ| )ψ, con ψ ∈ M e ||ψ|| = 1, l’estensione rimane identica. Nel caso in esame possiamo identificare ogni S(Hk ), Sp (Hk ) con un corrispondente sottoinsieme di S(H) e Sp (H) rispettivamente, estendendo ciascuno stato ρ, misto o puro, all’operatore nullo su H⊥ k . Con tale identificazione abbiamo subito che S(Hk ) ∩ S(Hj ) = ∅ e Sp (Hk ) ∩ Sp (Hj ) = ∅ se k = j. Gli stati puri fisicamente ammissibili per il sistema fisico descritto su H, questi saranno tutti e soli quelli dell’insieme: , Sp (H)ammiss := Sp (Hk ) . (7.29) k∈K
` ragionevole assumere che gli stati misti fisicamente ammissibili per il sistema E fisico descritto su H siano quelli che si riescono a costruire come miscele degli stati puri ammissibili. Quindi, gli stati misti fisicamente ammissibili saranno tutte e sole le possibili le combinazioni lineari convesse finite degli elementi dell’insieme: , S(Hk ) . (7.30) k∈K
Possiamo ammettere anche combinazioni convesse infinite, in riferimento a qualche topologia operatoriale, ma non discuteremo ora questo caso. Osservazione 7.33. La richiesta che gli stati puri ammissibili siano quelli nell’insieme (7.29) ovvero, per gli stati misti, che siano dati da combinazioni lineari convesse di stati nell’insieme (7.30), implica immediatamente che
7.4 Le proposizioni e gli stati relativi a sistemi quantistici
295
ciascuno di tali stati ρ (puro o misto) soddisfi i vincoli: ρPk = Pk ρ
per ogni k ∈ K
(7.31)
dove Pk `e il proiettore ortogonale sul settore coerente Hk . In realt` a vale anche il viceversa quando Ran(ρ) ⊂ ⊕k∈F Hk , per qualche F ⊂ K finito, oppure ρ ∈ Sp (H). Infatti, nel caso di ρ misto, tenendo conto del fatto che k∈K Pk = I (nella topologia operatoriale forte), e Pk Ph = 0 se h = k, le richieste (7.31) implicano immediatamente: ρ = s-
Pk ρ s-
k∈K
Ph
= s-
h∈K
=
pk
k∈F∗
Pk ρPk =
k∈K
Pk ρPk
k∈F
Pk ρPk = pk ρk , tr(Pk ρPk ) k∈F∗
dove F∗ ⊂ F `e il sottoinsieme dei k ∈ F per i quali pk := tr(Pk ρPk ) = 0 e Pk ρPk quindi pk > 0. Si noti, che per costruzione ρk := tr(P ∈ S(Hk ) se k ∈ F∗ . k ρPk ) Infine, oltre a pk ≥ 0 vale, usando il fatto che F `e finito (si usa solo in questo punto): 1 = trρ = tr pk ρk = pk trρk = pk . k∈F
k∈F
k∈F
Quindi, se ρ ∈ S(H) soddisfa Ran(ρ) ⊂ ⊕k∈F Hk per un insieme finito F e verifica i vincoli (7.31), allora ρ = k∈F∗ pk ρk `e una combinazione lineare convessa di elementi ρk ∈ S(Hk ) come volevamo. Sia infine ρ = (ψ| )ψ puro. Dalla decomposizione ortogonale di H nei sottospazi coerenti Hk abbiamo subito che: 1 = ||ψ||2 = ||Pk ψ||2 . (7.32) k∈K
La richiesta (7.31) implica immediatamente che: Pk ψ = (ψ|Pk ψ)ψ e quindi, sostituendo sopra, usando Pk Pk = Pk e Pk = Pk∗: 1 = ||ψ||2 =
||Pk ψ||2 =
k∈K
=
k∈K
|(Pk ψ|Pk ψ)|2 =
|(ψ|Pk ψ)|2 1
k∈K
||Pk ψ||4 .
(7.33)
k∈K
Essendo 0 ≤ ||Pk ψ||4 < ||Pk ψ||2 se ||Pk ψ|| < 1, (7.32) e (7.33) sono possibili insieme, solo se ||Pk ψ|| = 0 per k ∈ F \ {k0 } e ||Pk0 ψ|| = 1. Questo significa ρ ∈ Sp (Hk0 ).
296
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
7.5 Le osservabili come Misure a Valori di Proiezione su R Vogliamo ora introdurre la nozione di osservabile come misura a valori di proiezione (PVM). Tale nozione `e il centro della formulazione matematica della meccanica quantistica nelle formulazioni standard. Nei prossimi capitoli estenderemo e preciseremo meglio tale nozione dal punto di vista matematico, fino a formulare e dimostrare il teorema di decomposizione spettrale per operatori autoaggiunti non limitati che usa le PVM, nel suo enunciato. 7.5.1 Assioma A4: la nozione di osservabile In Meccanica Quantistica, le grandezze fisiche valutabili sui sistemi fisici e che hanno comportamento descritto in QM1 e QM2 sono dette osservabili. Ci occupiamo ora di esse. Come discusso nella sezione 7.2.5, `e ragionevole pensare di etichettare gli esiti delle misure di una grandezza fisica con gli insiemi di Borel di R. Dal pun(A) to di vista fisico `e naturale supporre che i proiettori ortogonali PE associati all’osservabile A siano commutanti l’uno con l’altro al variare di E ∈ B(R) (la σ-algebra di Borel di R), in quanto ci si aspetta che le proposizioni del tipo (A) PE := “Il valore di A valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , siano tutte compatibili al variare di E ∈ B(R). Altrimenti non avremmo un’osservabile, ma grandezze incompatibili distinte. Dato che l’esito della misura cade in E ed anche in E se e solo se cade in E ∩ E , assumiamo che (A) (A) (A) (A) PE ∧ PE = PE∩E . Assumiamo che valga anche PR = I, perch´e l’esito (A) della misura cade sicuramente in R, per cui PR `e la proposizione sempre vera, indipendentemente dallo stato sul quale si misura. Infine, per motivi fisicamente evidenti e tenendo conto del significato logico di ∨, `e ragionevole supporre che, per ogni classe finita o numerabile di boreliani di R, {En }n∈N , valga: (A) (A) ∨n∈N PEn = P∪n∈N En . Si potrebbe estendere la richiesta a classi infinite di cardinalit` a arbitaria, ma noi ci fermeremo alla numerabilit` a, come abbiamo fatto nel caso classico. Possiamo allora dare la seguente definizione. Definizione 7.34. Se H `e uno spazio di Hilbert, un’applicazione A, che as(A) socia ad ogni E ∈ B(R) un proiettore ortogonale PE ∈ P(H), `e detta osservabile se valgono le propriet` a che seguono: (A) (A) (A) (A) (a) PE PE = PE PE per ogni coppia E, E ∈ B(R); (A) (A) (A) (b) PE ∧ PE = PE∩E per ogni coppia E, E ⊂ B(R);
7.5 Le osservabili come Misure a Valori di Proiezione su R
297
(A)
(c) PR = I; (d) per ogni famiglia {En }n∈N ⊂ B(R), vale: (A)
(A)
∨n∈N PEn = P∪n∈N En . Osservazioni 7.35. (A) (1) Si dimostra immediatamente che la classe {PE }E∈B(R) `e una σ-algebra di Boole definita rispetto alla solita relazione d’ordine parziale ≤ tra proiettori. (A) (2) In generale {PE }E∈B(R) non `e massimale rispetto alla commutativit`a dei proiettori. ` chiaro che, con la definizione data sopra, ogni osservabile altro non `e (3) E che un omomorfismo di σ-algebre di Boole, dalla σ-algebra di Borel B(R) alla σ-algebra di Boole dei proiettori {PE }E⊂B(R) . La definizione di osservabile pu` o essere riformulata in modo equivalente, ma matematicamente pi` u semplice da maneggiare. Vale la seguente proposizione a tal fine. Proposizione 7.36. Sia H spazio di Hilbert. Un’applicazione P : B(R) → B(H) `e un’osservabile se e solo se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(R); (b) P (B)P (B ) = P (B ∩ B ) per ogni coppia B, B ∈ B(R); (c) P (R) = I; (d) per ogni famiglia {Bn }n∈N ⊂ B(R) con Bn ∩ Bm = ∅ se n = m, vale: s-
+∞
P (Bn ) = P (∪n∈N Bn ) .
n=0
Dimostrazione. Se P : B(R) → B(H) `e un’osservabile le propriet`a (a), (b), (c), (d) della proposizione 7.36 sono banalmente verificate. Dobbiamo mostrare che se P : B(R) → B(H) soddisfa tali propriet` a allora `e un’osservabile. Includiamo tutti gli operatori P (B) con B ∈ B(R) in un insieme massimale di proiettori commutanti (che esiste per il lemma di Zorn), P0 (H) e d’ora in poi lavoreremo in tale insieme senza perdere generalit`a. (a) implica che ogni P (B) `e autoaggiunto per (f) in proposizione 3.49, (b) implica che P (B)P (B) = P (B ∩B) = P (B) per cui tutti gli operatori P (B) sono proiettori ortogonali. Inoltre (b) implica anche che P (B)P (B ) = P (B ∩B ) = P (B ∩B) = P (B )P (B) per cui tutti i proiettori commutano tra di loro. Usando la prima identit` a in (i) di (b) di teorema 7.20, la condizione (b) di sopra si riscrive P (B) ∧ P (B ) = P (B ∩ B ). Per concludere `e sufficiente provare la propriet` a (d) della definizione 7.34. Consideriamo una classe numerabile di insiemi {En }n∈N ⊂ B(R) in generale non disgiunti a due a due. Vogliamo provare che esiste ∨n∈N P (En ) e vale ∨n∈N P (En ) = P (∪n∈NEn ) .
298
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Per fare ci` o definiamo la classe di insiemi boreliani a due a due disgiunti: {Bn }n∈N con B0 := E0 e, per n > 0, Bn = En \ (E1 ∪ · · · ∪ En−1) . Si verifica facilmente che: ∪pn=0 En = ∪pn=0 Bn
per ogni p ∈ N ∪ {+∞}.
Da questa identit` a, usando la propriet` a I − P (B) = P (R \ B) ed usando ricorsivamente la seconda identit` a in (i) di (b) di teorema 7.20, si ricava facilmente che: ∨pn=0 P (En ) = ∨pn=0 P (Bn ) per ogni n ∈ N, e quindi: ∨pn=0 P (En ) =
p
P (Bn ) ,
(7.34)
n=0
dove abbiamo tenuto conto che la propriet` a (d) nella tesi di questa proposizione implica che: p p P (Bn ) , ∨n=0 P (Bn ) = n=0
per una classe finita di insiemi disgiunti Bn (la classe finita pu`o sempre essere completata ad una classe numerabile aggiungendo infinite copie dell’insieme vuoto). Possiamo, per concludere, prendere il limite forte per p → +∞ in (7.34). Tale limite esiste per (b) in teorema 7.20 e vale anche, nelle nostre ipotesi: ∨n∈N P (En ) = s- lim
p
p→+∞
P (Bn ) = P (∪n∈NBn ) = P (∪n∈NEn ) .
n=0
Questo conclude la dimostrazione.
Osservazioni 7.37. (1) Si osservi che (c) e (d) da sole implicano che I = P (I ∪ ∅) = I + P (∅) per cui P (∅) = 0 . (2) Se B ∈ B(R) allora R \ B ∈ B(R) e R = B ∪ (R \ B). Quindi da (d), prendendo B0 = B, B1 = R \ B e tutti i rimanenti Bk = ∅ abbiamo che: I = P (B) + P (R \ B). In altre parole vale anche ¬P (B) = P (R \ B) .
La proposizione appena provata consente di identificare in modo biunivoco le osservabili con enti matematici ben noti in letteratura: le misure a valori di proiezione su R. Tale nozione sar`a generalizzata nel prossimo capitolo.
7.5 Le osservabili come Misure a Valori di Proiezione su R
299
Definizione 7.38. Un’applicazione P : B(R) → B(H), con H spazio di Hilbert, che soddisfa le richieste (a), (b), (c) e (d) della proposizione 7.36 `e detta misura a valori di proiezione (PVM) su R oppure equivalentemente misura spettrale su R. Possiamo enunciare il quarto assioma della formulazione matematica generale della Meccanica Quantistica. A4. Ogni osservabile A sul sistema quantistico S `e descritta da una misura a valori di proiezione su R, P (A), nello spazio di Hilbert del sistema HS , in modo tale che, se E `e un boreliano di R, il proiettore P (A)(E) corrisponde alla proposizione “l’esito della misura di A cade nel boreliano E”.
7.5.2 Operatori autoaggiunti associati a osservabili: motivazioni fisiche e esempi elementari In questa sezione daremo l’idea fondamentale di come si possano associare operatori autoaggiunti ad osservabili. In altre parole daremo le motivazioni fisiche per i teoremi spettrali che studieremo nei capitoli 8 e 9. Nel caso di un sistema classico, descritto al tempo t sullo spazio delle fasi Ft , come sappiamo, le osservabili corrispondono a quelle che abbiamo chiamato grandezze fisiche, cio`e funzioni Borel-misurabili f : Ft → R. Ad ogni grandezza fisica f possiamo associare la classe di tutte le proposizioni/boreliani della forma: (f) PE := “Il valore di f valutata sullo stato del sistema cade nell’insieme di Borel E ⊂ R” , ovvero, in termini insiemistici: (f)
PE := f −1 (E) ∈ B(Ft ) . (f)
Le proposizioni 7.15 e 7.16 hanno chiarito che {PE }E∈B(R) `e una σ-algebra (f) (di Boole) e l’applicazione B(R) E → PE ∈ B(Ft ) `e un omomorfismo di σ-algebre di Boole. La situazione `e identica nel caso quantistico, quando (A) consideriamo la classe {PE }E∈B(R) delle proposizioni/proiettori associata ad un’osservabile A: tale classe `e una σ-algebra di Boole e l’applicazione B(R) (A) E → PE ∈ P(H) `e un omomorfismo di σ-algebre di Boole. Se ci limitiamo (f) (A) a confrontare le classi {PE }E∈B(R) e {PE }E∈B(R) la struttura `e del tutto analoga. Nel caso classico per`o esiste la funzione f che permette di costruire (f) la classe {PE }E∈B(R) , racchiudendo, da sola, tutta l’informazione possibile (f) della classe di proposizioni PE . Questo `e un fatto banale perch´e noi abbiamo definito tali proposizioni/insiemi partendo da f! Nel caso quantistico, quando
300
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili (A)
`e assegnata un’osservabile {PE }E∈B(R) non c’`e nulla, per il momento, che (A) possa corrispondere ad una funzione f che “generi” la PVM {PE }E∈B(R) . Esiste un corrispondente quantistico ad f? Per cercare di rispondere discutiamo pi` u approfonditamente il legame tra (f) la funzione f e la classe {PE }E∈B(R) ad essa associata. Sappiamo costruire la seconda dalla prima, ma a noi interesserebbe ricostruire la prima a partire dalla seconda, dato che nella formulazione quantistica partiamo dal corrispon(f) (f) dente di {PE }E∈B(R) . In effetti risulta che dalla σ-algebra {PE }E∈B(R) si pu` o ricostruire f con una certa procedura di limite che ricorda una procedura di integrazione. Per illustrare questo punto, abbiamo bisogno di un risultato tecnico. Ricordiamo che se (X, Σ) `e uno spazio misurabile, una funzione Σ-misurabile s : X → C `e detta semplice se assume solo un numero finito di valori. Proposizione 7.39. Sia (X, Σ) spazio misurabile. Se S(X) `e lo spazio delle funzioni semplici su X rispetto a Σ, M (X) `e lo spazio delle funzioni, a valori in C, Σ-misurabili e Mb (X) ⊂ M (X) `e il sottospazio delle funzioni limitate, vale quanto segue. (a) S(X) `e denso in M (X) in senso puntuale. (a) S(X) `e denso in Mb (X) rispetto alla topologia della norma || ||∞. (c) Se f ∈ M (X) assume valori reali non negativi, esiste {sn }n∈N ⊂ S(X) con: 0 ≤ s0 ≤ s1 ≤ · · · ≤ sn (x) → f(x)
se n → +∞ per ogni x ∈ X
e la convergenza `e anche rispetto alla norma || ||∞ quando f ∈ Mb (X). ` sufficiente provare la tesi nel caso di funzioni a valori reali, il Dimostrazione. E caso complesso si ottiene facilmente da questo, decomponendo le funzioni a valori complessi in parte reale ed immaginaria. Definiamo f+ (x) := sup{0, f(x)} e f− (x) := inf{0, f(x)} per x ∈ X; allora f = f+ + f− , dove f+ ≥ 0 e f− ≤ 0 sono, come noto, misurabili essendo f misurabile. Ora costruiamo una successione di funzioni semplici che tende a f+ , tale costruzione dimostra, tra le altre cose, il punto (c) dato che f = f+ se f ≥ 0. Per 0 < n ∈ N fissato, costruiamo una partizione del semi asse reale [0, +∞) fatta da boreliani En,i e En con:
* i−1 i En,i := , En := [n, +∞) , , 2n 2n con 1 ≤ i ≤ n2n . Quindi, per ogni suddetto n, definiamo la classe di insiemi in Σ: (f) Pn,i := f −1 (En,i ) , Pn(f) := f −1 (En ) . Infine poniamo, s0 (x) := 0 se x ∈ X e, per ogni n ∈ N \ {0}: n
sn :=
n2 i−1 i=1
2n
χP (f) + nχP (f) . n,i
n
(7.35)
7.5 Le osservabili come Misure a Valori di Proiezione su R
301
Per costruzione 0 ≤ sn ≤ sn+1 ≤ f per n = 1, 2, . . .. Inoltre, per ogni fissato x ` quindi evidente che risulta |f+ (x)−sn (x)| ≤ 1/2n se n `e abbastanza grande. E sn → f+ puntualmente se n → +∞. La stima |f+ (x)−sn (x)| ≤ 1/2n `e uniforme in x se f+ `e limitata (basta che sia n > sup f+ ), in tal caso la convergenza sn → f+ vale anche nel senso uniforme. Si costruisce similmente, decomponendo il semiasse reale negativo con partizioni analoghe a quella di sopra, una (−) successione di funzioni semplici, sn ≤ 0 che converge puntualmente a f− . (−) La successione delle funzioni semplici sn + sn converge puntualmente a f e uniformemente se f `e limitata. ` chiaro dunque che, assegnata la grandezza classica f : Ft → R misurabile, E possiamo ricostruirla usando una successione di funzioni che sono costanti e (f) differenti da zero solo su insiemi della classe {PE }E∈B(R) . Senza perdere generalit` a concentriamoci sul caso f : Ft → R+ e supponiamo anche che f sia limitata, in modo tale che in (7.35) possiamo trascurare, per n abbastanza grande: (i) tutti gli intervalli En e (ii) gli En,i con il primo estremo ((i−1)2−n ) superiore, diciamo, a (sup f)+1/2n : la controimmagine di tali insiemi secondo f `e l’insieme vuoto. In questo caso la somma nella definizione di sn in (7.35) si pu` o troncare, ottenendo: f = lim
n 2+2 sup f
n→+∞
i=1
i−1 χ (f) . 2n Pn,i
(7.36)
Questo limite pu`o essere visto come una procedura di integrazione rispetto ad una “misura a valori di funzioni caratteristiche” ν (f) : B(R) E → χf −1 (E) ∈ S(X) che associa ad ogni insieme di Borel (nello spazio dei valori assumibili dalla funzione) E ⊂ R, una funzione caratteristica χf −1 (E) : X → C. Si osservi (f)
e approssimativamente il valore che f assume in Pn,i – e tale infatti che, i−1 2n ` stima diventa sempre pi` u precisa quanto pi` u n diventa grande – ed il secondo membro di (7.36) non `e altro che una “somma di Cauchy”. La (7.36) potrebbe essere scritta formalmente: f = λdν (f)(λ) . (7.37) R
Non ci interessa qui andare a fondo in questa analogia, che si pu`o portare avanti in modo rigoroso dando un significato matematicamente rigoroso all’integrale scritto di sopra, perch´e siamo interessati al caso quantistico. In tal caso una formula analoga a (7.37) esiste e definisce un operatore autoaggiunto associato ad un’osservabile che corrisponde a f. Da tale operatore pu` o essere (A) ricostruita, a posteriori, l’osservabile {PE }E∈B(R) in modo simile a quanto (f)
si fa per ottenere {PE }E∈B(R) da f. Vedremo tutto ci`o in modo generale e rigoroso nei prossimi capitoli. Viceversa ora presentiamo un esempio elementare di osservabile e mostriamo come associare a essa un operatore autoaggiunto.
302
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Esempi 7.40. (1) Consideriamo un sistema quantistico, descritto su uno spazio di Hilbert H, e consideriamo per esso una grandezza fisica che, dal punto di vista fisico possa assumere solo una quantit` a discreta e finita di valori distinti {an }n=1,···,N ⊂ R. Cominciamo con il mostrare come associare a tale grandezza un’osservabile, (A) che indicheremo la lettera A, data da una classe di proiettori ortogonali PE con E ∈ B(R). Postuliamo che esista una classe di proiettori ortogonali non nulli etichettati sugli an , {Pan }n=1,···,N tale che Pan Pam = 0 se n = m (che equivale, per aggiunzione, a Pam Pan = 0 se n = m) ed inoltre: N
Pan = I .
(7.38)
n=1
Il significato di Pan sar`a ovviamente: “il valore della grandezza A, in seguito a misura di essa sul sistema, risulta essere esattamente an ”. ` chiaro che la richiesta Pan Pam = Pam Pan = 0, ossia Pan ∧Pam = 0, se n = m E corrisponde alla duplice richiesta fisica che (a) le proposizioni Pan e Pam siano fisicamente compatibili, ma (b) la misura dell’osservabile non possa produrre contemporaneamente il valore an ed anche il valore distinto am (infatti la proposizione associata al proiettore nullo `e quella impossibile). La richiesta N n=1 Pan = I, altrimenti scrivibile come Pa1 ∨ · · · ∨ Pan = I, corrisponde alla richiesta che almeno una delle proposizioni Pan debba risultare verificata in seguito ad una misura dell’osservabile A. L’osservabile A : B(R) → P(H) `e costruita come segue: per ogni boreliano E ⊂ R (A) (A) PE := Pan , con P∅ := 0 . (7.39) an ∈E
La verifica delle propriet` a (a), (b), (c) e (d) della proposizione 12.14 `e ora immediata per costruzione. (2) Riferendoci all’esempio (1), possiamo associare all’osservabile A un operatore, che indicheremo ancora con la stessa lettera A. La definizione `e la seguente: N A := an Pan . (7.40) n=0
L’operatore A `e limitato ed autoaggiunto per costruzione essendo combinazione lineare a coefficienti reali di operatori autoaggiunti ed ha una ulteriore propriet` a interessante: l’insieme degli autovalori σp (A) di A coincide con i valori assumibili dall’osservabile A. La prova di ci` o `e diretta: se 0 = u ∈ Pan (H) allora Pam u = Pam Pan u = u se n = m oppure 0 se n = m. Inserendo questo risultato in (7.40), si ha subito che Au = an u per cui an ∈ σp (A). Viceversa, se u = 0 `e autovettore di A con
7.5 Le osservabili come Misure a Valori di Proiezione su R
303
autovalore λ (che deve essere reale dato che A = A∗ ), deve risultare da (7.40): λu =
N
an Pan u .
n=0
D’altra parte, essendo an Pan = I, modificando il primo membro dell’identit` a di sopra, deve risultare: N
λPan u =
n=0
N
an Pan u ,
n=0
e quindi: N
(λ − an )Pan u = 0 .
(7.41)
n=0
Se applichiamo infine Pm ad ambo membri e ricordiamo che Pm Pn = δm,n Pn , otteniamo le N identit` a: (λ − am )Pam u = 0 . Se queste identit`a fossero tutte risolte da Pm u = 0 per ogni m avremmo un assurdo dovendo essere: 0 = u = Iu =
N
Pan u .
n=0
o pu` o Quindi ci deve essere qualche n in (7.41) per cui λ = an . Si noti che ci` accadere per un solo valore di n essendo per ipotesi gli an distinti. In definitiva l’autovalore λ di A deve coincidere con uno dei valori an . Abbiamo provato che l’insieme degli autovalori di A coincide con i valori assumibili dall’osservabile A. L’operatore autoaggiunto A gioca qui un ruolo analogo a quello giocato (f) dalla funzione f nel caso di una grandezza classica {PE }E∈T (R) . Nei prossimi capitoli svilupperemo una procedura che consente di associare in modo univoco ad ogni osservabile A (cio`e ad ogni misura a valori di proiezione su R) un operatore autoaggiunto (generalmente non limitato) che indicheremo con la stessa lettera A, estendendo quanto trovato negli esempi precedenti. I valori assumibili dall’osservabile saranno dati dagli elementi dello spettro completo dell’operatore σ(A) che, come vedremo, `e un insieme generalmente pi` u grande dell’insieme σp (A) degli autovalori. Lo strumento centrale da utilizzare sar`a la procedura d’integrazione rispetto ad una misura a valori di proiezione, che corrisponde alla generalizzazione dell’espressione: f(λ)Pλ =: f(λ) dP (A)(λ) , λ∈σp (A)
σ(A)
304
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
(cfr (7.38) con f : λ → 1 e (7.40) con f : λ → λ ) al caso in cui i valori λ sono infiniti e possono variare in modo continuo in tutto lo spettro di A. In particolare dovranno valere le identit` a, la cui interpretazione verr`a dalla teoria delle misure spettrali: (A) A= λ dP (λ) , I = 1 dP (A)(λ) . σ(A)
σ(A)
7.5.3 Misure di probabilit` a associate a coppie stato - osservabile Un’altra propriet` a notevole delle misure a valori di proiezione su R `e la seguente, che avr`a importanti conseguenze nelle applicazioni fisiche. Proposizione 7.41. Sia H uno spazio di Hilbert e A = {PE }E∈B(R) una misura a valori di proiezione su R. Se ρ ∈ S(H) `e uno stato, l’applicazione (A) μρ : E → tr(ρPE ) `e una misura di Borel di probabilit` a su R. (A)
Dimostrazione. La prova `e elementare. Basta provare che μρ `e positiva, σ(A) additiva e μρ (R) = 1. R `e di Hausdorff e localmente compatto, per cui ogni misura positiva σ-additiva sull’algebra di Borel `e una misura di Borel. Decomponiamo ρ come al solito su una base hilbertiana di suoi autovettori: ρ= pj (ψj | )ψj , j∈N (A)
dove i numeri pj sono non negativi e la loro somma `e 1. Vale: μρ (E) = tr(ρPE ) ≥ 0 dato che i proiettori ortogonali sono operatori positivi, i numeri (A) Pj sono non negativi e che tr(ρPE ) = j∈N pj (ψj |PE ψj ). Inoltre μρ (R) = 1 dato che, valendo PR = I, pj (ψj |Iψj ) = trρ = 1 . j∈N (A)
Proviamo la σ-additivit` a di μρ . Se {En }n∈N `e una classe di boreliani disgiunti a due a due e E := ∪n∈N En , allora vale, tenendo conto di (d) della proposizione 7.39: +∞ +∞ +∞ +∞
+∞ > tr(ρPE ) = pj ψj PEi ψj = pj (ψj |PEi ψj ) .
j=0
i=0
j=0 i=0
Dato che pj ≥ 0 e (ψj |PEi ψj ) ≥ 0, il teorema di Fubini permette di interscambiare le serie di sopra, ottenendo: tr(ρPE ) =
+∞ +∞ i=0 j=0
pj (ψj |PEi ψj ) =
+∞ i=0
tr(ρPEi ) .
7.5 Le osservabili come Misure a Valori di Proiezione su R
305
In altre parole, se {En }n∈N `e una classe di boreliani disgiunti a due a due allora: +∞ μρ(A) (∪n∈N En ) = μρ(A) (En ) . n=0
Questo conclude la dimostrazione.
Esempi 7.42. (1) Consideriamo l’osservabile A che assume un numero finito N di valori discreti an vista negli esempi (1) e (2) in 7.40, usando le stesse notazioni usate ivi. Sia A (7.40) l’operatore autoaggiunto associato all’osservabile. Fissiamo uno stato ρ ∈ S(H) e consideriamo la sua misura di probabilit` a relativa (A) all’osservabile {PE }E∈T (R) . Per costruzione, se E ∈ T (R): (A) tr(ρPan ) = pn δan (E) μρ(A) (E) := tr(ρPE ) = an ∈E
an
con: pn := tr(ρPan ) . Quindi: μρ(A) =
pn δan ,
(7.42)
an
dove abbiamo usato le misure di Dirac δan centrate nei punti an : δa (E) = 1 se a ∈ E, oppure δa (E) = 0 se a ∈ E. Si osservi che 0 ≤ pn ≤ 1 e n pn = 1 per costruzione. Quindi la misura di probabilit` a associata allo stato ρ e riferita all’osservabile A `e di fatto una combinazione lineare convessa di misure di Dirac. (2) Il valore medio dell’osservabile A sullo stato ρ, A ρ ed il suo scarto quadratico medio ΔA2ρ sullo stato ρ, possono essere scritti in modo sintetico usando l’operatore A (7.40) associato all’osservabile nel modo che segue. Per definizione di valore medio: A ρ = a dμρ(A)(a) . R
D’altra parte, tenendo conto dell’espressione (7.42) si ha: a dμρ(A) (a) = p n an = an tr(ρPan ) . R
n
n
Usando infine (7.40) e le propriet` a lineari della traccia, concludiamo che: A
ρ
= tr(Aρ) .
(7.43)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.43) che, se A ψ indica il valor medio di A sullo stato individuato dal vettore ψ: A ψ = (ψ|Aψ) (7.44)
306
7 I primi 4 assiomi della MQ: proposizioni, stati quantistici e osservabili
Per definizione lo scarto quadratico medio `e: ΔA2ρ = a2 dμρ(A) (a) − A R
2 ρ
.
Procedendo come nel caso del valor medio: a
2
R
dμρ(A) (a)
=
n
pn a2n
=
a2n tr(ρPan )
= tr ρ
n
a2n Pan
.
n
Si osservi ora che: A2 = an Pan am Pam = an am Pan Pam = a2n Pan = A2 , n
m
n,m
n
dove abbiamo usato Pan Pam = δn,m Pn . In definitiva: 2 ΔA2ρ = tr ρA2 − (tr (ρA)) .
(7.45)
Nel caso che ρ sia uno stato puro, ossia ρ = ψ(ψ|·) con ||ψ|| = 1, si ha immediatamente da (7.45) che, se ΔA2ψ indica lo scarto quadratico medio di A sullo stato individuato dal vettore ψ: 2 ΔA2ψ = ψ|A2 ψ − (ψ|Aψ) = ψ| A2 − A 2ψ ψ . (7.46) Le formule che abbiamo scritto negli esempi di sopra concernenti i valori medi e gli scarti quadratici medi di osservabili in fissati stati, sono in realt`a valide in casi pi` u generali (con opportune ipotesi tecniche), come sar`a provato nella proposizione 10.5, quando avremo definito in maniera del tutto generale la procedura per associare operatori autoaggiunti ad osservabili.
Esercizi 7.1. Provare che per ogni algebra di Boole X, se a ∈ X allora ¬a `e l’unico elemento a soddisfare (i) e (ii) di (c) nella definizione 7.11. 7.2. Provare che in ogni algebra di Boole X valgono le identit` a di De Morgan (7.5) e (7.6). 7.3. Provare che un’algebra di Boole `e σ-completa se e solo se ogni insieme numerabile {an }n∈N ⊂ X ammette estremo inferiore. 7.4. Provare che un omomorfismo di algebre di Boole h : X → Y preserva l’ordinamento: se per a, b ∈ X vale a ≤ b, allora vale anche h(a) ≤ h(b).
Esercizi
307
7.5. Provare che se h : X → Y `e un omomorfismo di σ-algebre di Boole allora vale la (7.7) 7.6. Dimostrare la proposizione 7.14. 7.7. Dimostrare la proposizione 7.15. un insieme di proiettori ortogonali a due a due commutanti 7.8. Sia P(H) nello spazio di Hilbert H. Mostrare che esiste un insieme P0 (H) di proiettori e che `e massimale rispetto alla condizioortogonali che include l’insieme P(H) ne di commutativit` a (cio`e ogni proiettore ortogonale in H che commuta con gli elementi di P0 (H) `e contenuto in P0 (H)). Suggerimento. Usare il lemma di Zorn rispetto alla relazione d’ordine dell’inclusione insiemistica, nell’insieme parzialmente ordinato i cui elementi sono le classi di proiettori a due a due commutanti.
8 Teoria Spettrale I: generalit` a e operatori normali di B(H) in spazi di Hilbert Il matematico gioca un gioco in cui egli stesso inventa le regole. Il fisico gioca un gioco in cui le regole sono fornite dalla Natura. Ma, con il passare del tempo, diventa sempre pi` u evidente che le regole che il matematico trova interessanti sono quelle che la Natura ha scelto. Paul Adrien Maurice Dirac
In questo capitolo, di carattere puramente matematico, introduciamo i primi rudimenti di teoria spettrale per operatori (generalmente non limitati) su spazi normati, fino ad arrivare alla nozione di misura spettrale ed al teorema di decomposizione spettrale per operatori normali in B(H) con H spazio di Hilbert. Il teorema spettrale per operatori autoaggiunti non limitati sar`a trattato nel prossimo capitolo. Nella prima parte del capitolo introdurremo il concetto di risolvente e di spettro di un operatore e, pi` u in generale, di un elemento di un’algebra di Banach con unit` a. Ne studieremo alcune propriet`a generali. Lo spettro di un operatore `e un insieme di numeri complessi che generalizza il concetto di insieme degli autovalori. Il teorema spettrale prova che ogni operatore (in questo libro: limitato normale, oppure autoaggiunto non necessariamente limitato) pu` o essere decomposto tramite una procedura di integrazione dello spettro, rispetto ad una opportuna misura a “valori di proiezione”. In definitiva, tale teorema pu`o essere visto come una generalizzazione negli spazi di Hilbert del teorema di diagonalizzazione delle matrici normali a coefficienti in C. Gli strumenti matematici necessari per formulare il teorema spettrale sono utili anche per altri fini. Vedremo infatti che, attraverso di essi, `e possibile dare una nozione di “operatore funzione di un secondo operatore”. Tale nozione ha molteplici applicazioni in fisica matematica. Il legame della teoria spettrale con la Meccanica Quantistica risiede nel fatto che le misure a valori di proiezione non sono altro che le osservabili definite nel capitolo precedente. Attraverso il teorema spettrale, le osservabili risultano essere in corrispondenza biunivoca con operatori autoaggiunti (generalmente non limitati) e gli spettri di tali operatori costituiscono gli insiemi degli esiti possibili delle misure quando si misurano le osservabili. La corrispondenza tra osservabili e operatori autoaggiunti permetter` a di sviluppare la formulazione della teoria quantistica in stretto legame con la meccanica Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
310
8 Teoria Spettrale I: operatori limitati
classica, nella quale, le osservabili sono le grandezze fisiche rappresentate da funzioni a valori reali. Esaminiamo con pi` u dettaglio il contenuto del capitolo. Nella prima sezione definiremo, come detto sopra i concetti di: spettro, risolvente, operatore risolvente, discutendone le propriet` a pi` u importanti ed in particolare la formula del raggio spettrale. Tali nozioni saranno estese al caso astratto di elementi di algebre di Banach o C ∗ -algebre, includendo la dimostrazione del teorema di Gelfand-Mazur. Nella sezione successiva costruiremo alcuni ∗-omomorfismi continui di C ∗algebre di funzioni indotti da operatori limitati autoaggiunti in spazi di Hilbert, che saranno lo strumento fondamentale per fare il primo passo verso il teorema spettrale. Nella quarta sezione, introdurremo la nozione di misura spettrale o misura a valori di proiezione (PVM) e definiremo la nozione di integrale di una funzione limitata rispetto ad una misura a valori di proiezione. L’ultima sezione sar´a dedicata alla formulazione ed alla dimostrazione del teorema spettrale per operatori limitati normali (in particolare autoaggiunti o unitari) ed alla discussione di risultati tecnici correlati. Dimostreremo infine l’utile teorema di Fuglede.
8.1 Spettro e risolvente In questa sezione ci occuperemo delle nozioni e dei risultati fondamentali della teoria spettrale in spazi normati, di Banach e di Hilbert ed anche in contesti pi` u generali di algebre di Banach e C ∗ -algebre. Nel seguito faremo uso della teoria delle funzioni analitiche definite su sottoinsiemi aperti di C ed a valori in uno spazio di Banach sul campo complesso [Rud82], piuttosto che in C. Definizione 8.1. Se (X, || ||) `e uno spazio di Banach sul campo C e Ω ⊂ C `e un aperto non vuoto, f : Ω → X `e detta analitica se, per ogni z0 ∈ Ω esiste δ > 0 con: +∞ f(z) = (z − z0 )n an per ogni z ∈ Bδ (z0 ), n=0
dove Bδ (z0 ) ⊂ Ω, an ∈ X per ogni n ∈ N e la convergenza della serie `e riferita alla topologia indotta dalla norma || ||. La teoria delle funzioni analitiche a valori in spazi di Banach `e essenzialmente la stessa delle funzioni analitiche a valori complessi che supponiamo nota, con l’unica differenza che, sull’immagine delle funzioni, il valore assoluto deve essere sostituito con la norma dello spazio di Banach. Le definizioni, gli enunciati dei teoremi e le loro dimostrazioni sono gli stessi del caso elementare, se si tiene conto di tale precisazione.
8.1 Spettro e risolvente
311
8.1.1 Nozioni fondamentali Partiamo dal caso operatoriale lavorando con operatori definiti in spazi normati. Ricordiamo che, se X `e uno spazio vettoriale, dire che (definizione 5.1) “A `e un operatore in X”, significa che A : D(A) → X, dove il dominio di A, D(A) ⊂ X, `e un sottospazio, in generale non chiuso, di X. Definizione 8.2. Sia A un operatore nello spazio normato X. (a) Si dice insieme risolvente di A l’insieme ρ(A) dei λ ∈ C tali che siano soddisfatte le seguenti tre condizioni insieme: (i) Ran(A − λI) = X, (ii) (A − λI) : D(A) → X `e iniettivo, (iii) (A − λI)−1 : Ran(A − λI) → X `e limitato. (b) Se λ ∈ ρ(A), si dice operatore risolvente di A l’operatore: Rλ (A) := (A − λI)−1 : Ran(A − λI) → D(A) . (c) Si dice spettro di A l’insieme σ(A) := C \ ρ(A). Lo spettro di A `e unione dei seguenti tre sottoinsiemi disgiunti: (i) lo spettro puntuale di A, σp (A), costituito dai numeri complessi λ per cui l’operatore A − λI non `e iniettivo, (ii) lo spettro continuo di A, σc (A), costituito dai numeri complessi λ per cui l’operatore A − λI `e iniettivo e vale l’identit` a Ran(A − λI) = X, ma (A − λI)−1 non `e limitato, (iii) lo spettro residuo di A, σr (A), costituito dai numeri complessi λ per cui l’operatore A − λI `e iniettivo, ma Ran(A − λI) = X. Osservazioni 8.3. ` chiaro che σp (A) contiene tutti e soli gli autovalori di A (vedi defini(1) E zione 3.48). Nel caso in cui X = H `e uno spazio di Hilbert e gli autovettori di A formano una base hilbertiana di H, si dice che A ha spettro puntuale puro. Si osservi che questo non significa, in generale, che σp (T ) = σ(T ); per esempio gli operatori autoaggiunti compatti hanno tutti spettro puntuale puro, tuttavia 0 pu` o essere un punto dello spettro continuo. (2) Esistono altre decomposizioni dello spettro [ReSi80, AbCi97] nel caso in cui X = H sia spazio di Hilbert e A sia operatore normale di B(H), oppure autoaggiunto in H. Ne esamineremo brevemente qualcuna nel capitolo seguente, dopo aver dimostrato il teorema spettrale per operatori autoaggiunti non limitati. Per uno studio pi` u dettagliato di tali classificazioni, per operatori rilevanti in Meccanica Quantistica, si veda [ReSi80, AbCi97]. Cominciamo a fare qualche assunzione pi` u specifica, assumendo che X sia spazio di Banach e lavorando con operatori chiusi. In particolare il seguente risultato si applica quindi a T ∈ B(X) oppure, se X = H `e spazio di Hilbert, si applica a T : D(H) → H autoaggiunto o coincidente con l’aggiunto di un operatore in H, tenendo conto del teorema 5.9.
312
8 Teoria Spettrale I: operatori limitati
Teorema 8.4. Sia T un operatore chiuso nello spazio di Banach X = {0}. Valgono i seguenti fatti. (a) λ ∈ ρ(T ) se e solo se T − λI `e una biezione di D(T ) su X. (b) (i) ρ(T ) `e aperto, (ii) σ(T ) `e chiuso, (iii) se ρ(T ) = ∅, ρ(T ) λ → Rλ (T ) ∈ B(H) `e analitica. (c) Se D(T ) = X (e quindi T ∈ B(X)), allora: (i) ρ(T ) = ∅, (ii) σ(T ) = ∅ `e compatto (iii) |λ| ≤ ||T || per ogni λ ∈ σ(T ). (d) Per ogni λ, μ ∈ ρ(T ) vale l’equazione risolvente: Rλ (T ) − Rμ (T ) = (λ − μ)Rλ (T )Rμ (T ) . Osservazioni 8.5. (1) A commento della precisazione che appare nel punto (c), si osservi che, se X `e spazio di Banach e D(T ) = T , allora vale che T : D(T ) → X `e chiuso se e solo se T ∈ B(X), per il teorema 2.104 del grafico chiuso. (2) Il punto (a) del teorema `e spesso tecnicamente utile perch´e in virt` u di esso, nelle ipotesi stabilite, per verificare se λ ∈ ρ(T ) non `e necessario controllare le propriet` a topologiche di densit` a di Ran(T −λI) e di limitatezza di (T −λI)−1 , ma `e sufficiente controllare la propriet`a algebrica che T − λI : D(T ) → X sia biettiva. Prova del teorema 8.4. (a). Se λ ∈ ρ(T ), basta provare che Ran(T − λI) = X. Dato che (T − λI)−1 `e continuo, esiste K ≥ 0 per cui ||(T − λI)−1 x|| ≤ K||x|| per ogni x = (T − λI)y ∈ Ran(T − λI). Di conseguenza, per ogni y ∈ D(T ) vale: ||y|| ≤ K||(T − λI)y|| . (8.1) Dato che Ran(T − λI) = X, se x ∈ X, esister`a una successione {yn }n∈N ⊂ D(T ) per cui (T − λI)yn → x per n → +∞. Da (8.1) concludiamo che {yn }n∈N `e successione di Cauchy e quindi ammette limite y ∈ X. Essendo T un operatore chiuso, dovr` a essere y ∈ D(T ) e (T − λI)y = x, per cui x ∈ Ran(T − λI). Abbiamo provato che Ran(T − λI) = X, come volevamo. Supponiamo ora che T −λI sia una biezione di D(T ) su X; per provare la tesi `e sufficiente mostrare che (T −λI)−1 `e continuo. Poich´e T `e chiuso, allora anche T − λI `e chiuso, cio`e ha grafico chiuso. Dato che T − λI `e una biezione, segue subito che anche (T − λI)−1 ha grafico chiuso ed `e quindi chiuso. Essendo (T − λI)−1 definito su tutto X per ipotesi, il teorema 2.104 del grafico chiuso prova immediatamente che (T − λI)−1 `e limitato. (b). Se μ ∈ ρ(T ), la serie: S(λ) :=
+∞ n=0
(λ − μ)n Rμ (T )n+1
8.1 Spettro e risolvente
313
converge assolutamente nella norma operatoriale (e quindi nella topologia uniforme) se: |λ − μ| < 1/||Rμ(T )|| . (8.2) Infatti vale: +∞
|λ − μ|n ||Rμ(T )n+1 || ≤
n=0
+∞
|λ − μ|n ||Rμ(T )||n+1
n=0
= ||Rμ(T )||
+∞
| (λ − μ) ||Rμ(T )|| |n .
n=0
L’ultima serie `e una serie geometrica di ragione |(λ−μ)||Rμ (T )|||, che converge in quanto | (λ − μ) ||Rμ(T )|| | < 1 per la (8.2). Se λ soddisfa la condizione di sopra, applicando T − λI = (T − μI) + (μ − λ)I a sinistra ed a destra di S(λ) svilupatto in serie come visto sopra, si ottiene immediatamente che (usando anche la definizione Rμ (T )0 := I): (T − λI)S(λ) = IX mentre: S(λ)(T − λI) = ID(T ) . Abbiamo provato che se μ ∈ ρ(T ), c’`e un intorno aperto di μ tale che, per ogni punto λ di tale intorno, esiste ed `e limitato l’inverso, destro e sinistro, di T − λI da X a D(T ). Quindi, per (a), tale intorno `e incluso in ρ(T ) e allora ρ(T ) `e aperto e σ(T ) = C \ ρ(T ) `e chiuso. Inoltre Rλ (T ) `e sviluppabile in serie di Taylor nell’intorno di ogni punto di ρ(T ) secondo la topologia operatoriale uniforme, per cui, per definizione, ρ(T ) λ → Rλ (T ) `e una funzione analitica da ρ(T ) a valori nello spazio di Banach B(X). (c). Nel caso D(T ) = X, essendo T chiuso e X spazio di Banach, il teorema del grafico chiuso implica che T `e limitato. Se λ ∈ C soddisfa |λ| > ||T ||, allora la serie: +∞ S(λ) = (−λ)−(n+1) T n n=0 0
(T := I), converge assolutamente nella norma operatoriale. Per computo diretto si verifica che, come nel caso precedente, valgono effettivamente le identit` a: (T − λI)S(λ) = I e anche: S(λ)(T − λI) = I , e quindi S(λ) = Rλ (T ) per (a). Quindi, per (a), ogni λ ∈ C con |λ| > ||T || appartiene a ρ(T ), che `e dunque non vuoto. Inoltre, se λ ∈ σ(T ), deve valere |λ| ≤ ||T ||, per cui, se σ(T ) `e non vuoto, allora `e compatto perch´e chiuso e limitato. Mostriamo che σ(T ) = ∅. Supponiamo per assurdo che σ(T ) = ∅. In
314
8 Teoria Spettrale I: operatori limitati
tal caso λ → Rλ (T ) `e definita su tutto C. Fissiamo f ∈ X (duale di X) e x ∈ X e consideriamo la funzione a valori complessi: ρ(T ) λ → g(λ) := f(Rλ (T )x). Questa funzione `e sicuramente analitica in ogni componente connessa dell’insieme aperto ρ(T ), perch´e, per quanto provato sopra, se μ ∈ ρ(T ), in un intorno di μ tutto contenuto in ρ(T ), si ha lo sviluppo di Taylor: f(Rλ (T )x) :=
+∞
(λ − μ)n f(Rμ (T )n+1 x) ,
n=0
dove abbiamo sfruttato la continuit` a di f, ed il fatto che la serie converge nella topologia uniformemente (e quindi anche in quella debole). Dunque, nell’ipotesi in cui σ(T ) = ∅, g `e una funzione analitica su tutto C. Notiamo ancora che per |λ| > ||T || vale anche lo sviluppo: g(λ) := f(Rλ (T )x) =
+∞
(−λ)−(n+1) f(T n x) .
n=0
Dato che tale serie converge assolutamente (per il teorema di Abel sulle serie di potenze), possiamo scrivere, per |λ| ≥ 1 + ||T ||: |g(λ)| ≤ |λ|−1
+∞
|λ|−n |f(T n x)| ≤
n=0
K , |λ|
per qualche K > 0. Quindi la funzione |g|, essendo continua ovunque e maggiorata da K|λ−1 | per |λ| ≥ Λ per qualche costante Λ, deve essere limitata su tutto il piano complesso. Essendo anche analitica su tutto il piano complesso, g deve essere costante per il teorema di Liouville. Annullandosi |g(λ)| all’infinito, g deve essere la funzione nulla. Allora f(Rλ (T )x) = 0. Dato che il risultato vale per ogni f ∈ X , il corollario 2.68 di Hahn-Banach (che richiede X = {0}), implica che deve essere ||Rλ(T )x|| = 0. Dato che anche x ∈ X = {0} era arbitrario, dobbiamo concludere che Rλ (T ) = 0 per ogni λ ∈ ρ(T ). Ma allora `e impossibile che Rλ (T ) sia l’operatore inverso di T − λI. L’assurdo prova che l’ipotesi σ(T ) = ∅ non pu` o verificarsi. (d). L’equazione risolvente si prova come segue. Valgono le equazioni: (T − λI)Rλ (T ) = I
e
(T − μI)Rμ (T ) = I .
Esplicitando i prodotti: T Rλ (T ) − λRλ (T ) = IX e T Rμ (T ) − μRμ (T ) = IX . Moltiplicando a sinistra la prima equazione per Rμ (T ) e la seconda per Rλ (T ), sottraendo i risultati ottenuti membro a membro e tenendo conto che Rμ (T )Rλ (T ) = Rλ (T )Rμ (T ) e che Rμ(T )T Rλ (T ) = Rλ (T )T Rμ (T ), si ottiene l’equazione risolvente. La prima relazione di commutazione scritta sopra segue dall’evidente identit`a: (T − μI)(T − λI) = (T − λI)(T − μI)
8.1 Spettro e risolvente
315
che ne implica un’analoga per gli operatori inversi; la seconda relazione di commutazione si prova come segue: Rμ (T )T Rλ (T ) = Rμ (T )(T − λI)Rλ (T ) + Rμ (T )λIRλ (T ) = Rμ (T )I + λRμ (T )Rλ (T ) = Rμ (T ) + λRλ (T )Rμ (T ) = (I + λRλ (T ))Rμ (T ) = (Rλ (T )(T − λI) + λRλ (T ))Rμ (T ) = Rλ (T )T Rμ (T ) . Questo conclude la dimostrazione.
8.1.2 Algebre di Banach: teorema di Gelfand-Mazur, raggio spettrale, formula di Gelfand Passiamo ora al caso pi` u astratto a livello di algebre di Banach con unit` ae C ∗-algebre con unit` a (definizioni 2.36 e 3.40 rispettivamente). Ricordiamo che se X `e uno spazio normato, allora B(X) `e un’algebra di Banach con unit` a per (i) di (c) del teorema 2.54. Se H `e uno spazio di Hilbert, allora B(X) `e una C ∗-algebra con unit` a, in cui l’involuzione `e data dalla coniugazione hermitiana di operatori, per il teorema 3.43. Per cominciare estendiamo la definizione di risolvente e spettro in termini astratti, usando come modello B(X), con X spazio di Banach e tenendo conto che in tal caso vale il teorema 8.4 per gli elementi di B(X). Definizione 8.6. Sia A un’algebra di Banach con unit` a I e a ∈ A. (a) Il risolvente di a `e l’insieme: ρ(a) := {λ ∈ C | ∃(a − λI)−1 ∈ A inverso destro e sinistro di (a − λI)} . (b) Lo spettro di a `e l’insieme: σ(a) := C \ ρ(a). In tal caso abbiamo il seguente teorema che generalizza al caso astratto la parte del teorema 8.4 che si applica agli operatori di B(X). Teorema 8.7. Sia A = {0} un’algebra di Banach con unit` a I. Per ogni a ∈ A valgono i fatti seguenti. (a) ρ(a) = ∅ `e aperto, σ(a) = ∅ `e compatto e vale: |λ| ≤ ||a|| , per ogni λ ∈ σ(a). (b) ρ(a) λ → Rλ (a) := (a − λI)−1 ∈ A `e una funzione analitica. (c) Se λ, μ ∈ ρ(a) vale l’equazione risolvente: Rλ (a) − Rμ (a) = (λ − μ)Rλ (a)Rμ (a) . Dimostrazione. La dimostrazione `e la stessa delle propriet`a (b), (c) e (d) del teorema 8.4, tenendo anche conto di (1) nell’osservazione 8.5 e rimpiazzando, nella dimostrazione della propriet` a (c) del teorema 8.4, f(Rλ (T )x) con f(Rλ (a)), dove f ∈ A duale topologico di A visto come spazio di Banach.
316
8 Teoria Spettrale I: operatori limitati
Un immediato corollario del teorema precedente `e un importante risultato, noto come teorema di Gelfand-Mazur. Teorema 8.8. (Di Gelfand-Mazur.) Se B = {0} `e un’algebra di Banach con unit` a, in cui ogni elemento non nullo ammette inverso, allora B `e isomorfa in modo naturale a C (quindi, in particolare, B deve essere commutativa). Dimostrazione. Se x ∈ B allora σ(x) = ∅ per (a) del teorema precedente. Allora x − cI non `e invertibile per qualche c ∈ C per definizione di spettro. Nelle nostre ipotesi deve essere x − cI = 0 e quindi x = cI. c `e unicamente fissato x, dato che cI = c I se c = c . L’applicazione B x → c ∈ C `e un isomorfismo di algebre di Banach come si prova immediatamente. In base ad (a) del teorema 8.7, se a ∈ A, il suo spettro `e contenuto nel cerchio di raggio ||a|| centrato nell’origine di C. Tuttavia potrebbe esserci un cerchio di raggio pi` u piccolo, con lo stesso centro, che racchiude σ(a). A tal fine si enuncia la seguente definizione. Definizione 8.9. Sia A algebra di Banach con unit` a. Il raggio spettrale di a ∈ A `e il numero reale non negativo: r(a) := sup{|λ| | λ ∈ σ(a)} . La definizione si applica in particolare al caso A = B(X) con X spazio di Banach. Esiste una celebre formula per il calcolo del raggio spettrale, dovuta al matematico Gelfand. Otterremo la formula di Gelfand usando un risultato sullo spettro di polinomi di elementi di A. Proposizione 8.10. Siano A algebra di Banach con unit` a I, a ∈ A e p = p(z) un polinomio complesso nella variabile z ∈ C. Valgono i seguenti fatti. (a) Se p(a) indica l’elemento di A ottenuto sostituendo al numero z l’elemento a in p(z) ed interpretando in modo ovvio ogni potenza an (a0 := I), vale: σ(p(a)) = p(σ(a)) := {p(λ) | λ ∈ σ(a)} .
(8.3)
(Il risultato si applica in particolare al caso A = B(X) con X spazio di Banach.) (b) Se A `e anche C ∗-algebra con unit` a, lo spettro di a∗ soddisfa: σ(a∗ ) = σ(a) := {λ | λ ∈ σ(a)} .
(8.4)
(Il risultato si applica in particolare al caso A = B(H) con H spazio di Hilbert.) Dimostrazione. (a). Se α1 , . . . , αn sono .nle radici di un polinomio q (non necessariamente distinte), vale q(z) = c i=1 (z − αi ), per qualche complesso c.
8.1 Spettro e risolvente
317
.n
Quindi q(a) = c i=1 (a − αi I). Sia λ ∈ σ(a): allora (a − λI) non `e invertibile per definizione; definiamo μ := p(λ). Consideriamo il polinomio q := p − μ. Dato che q(λ) = 0, uno dei fattori della decomposizione di q scritta sopra sar`a (z − λ). Di conseguenza, scegliendo opportunamente l’ordine delle radici e tenendo conto che gli elementi a − αi I commutano tra di loro, si ha: # "n−1 n−1 / / (a − αi I) (a − λI) = c(a − λI) (a − αi I) . p(a) − μI = c i=1
i=1
Come conseguenza, p(a) − μI non potr` a essere invertibile, essendo a − λI non invertibile, per definizione deve allora essere μ ∈ σ(p(a)). Abbiamo quindi provato che p(σ(a)) ⊂ σ(p(a)). Per concludere proviamo l’altra inclusione. Sia μ ∈ . σ(p(a)): poniamo q = p − μ e decomponiamo il polinomio q come n q(z) = c i=1 (z − αi ). Avremo l’analoga decomposizione: n / p(a) − μI = c (a − αi I) . i=1
Se tutte le radici αi appartenessero a ρ(a), allora ogni (a − αi I) : X → X sarebbe invertibile e quindi sarebbe invertibile p(a) − μI, cosa che `e esclusa per ipotesi. Di conseguenza ci sar`a una radice αk tale che (a − αk I) non `e invertibile e quindi αk ∈ σ(a). Ma allora p(αk ) − μ = 0 e dunque μ ∈ p(σ(a)), il che implica p(σ(a)) ⊃ σ(p(a)). (b). (a − λI) `e invertibile se e solo se `e invertibile (a − λI)∗ = a∗ − λI `e per (c) di proposizione 3.41 e quindi vale la tesi. Teorema 8.11. Siano A algebra di Banach con unit` a e a ∈ A. (a) Il raggio spettrale di a si pu` o ottenere dalla formula di Gelfand: r(a) = lim ||an ||1/n , n→+∞
dove il limite a secondo membro esiste sempre. (Il risultato si applica in particolare al caso A = B(X) con X spazio di Banach.) (b) Se A `e una C ∗ -algebra con unit` a e a `e normale (cio`e a∗ a = aa∗ ), allora vale sempre r(a) = ||a|| ; (8.5) di conseguenza:
||a|| = r(a∗ a)1/2
per ogni a ∈ A.
(8.6)
(Il risultato si applica in particolare al caso A = B(H) con H spazio di Hilbert.) Dimostrazione. (a). Per (a) di proposizione 8.10 si ha (σ(a))n = σ(an ), per cui r(a)n = r(an ) ≤ ||an|| e quindi vale: r(a) ≤ lim inf ||an||1/n . n
(8.7)
318
8 Teoria Spettrale I: operatori limitati
(Si noti che, al contrario del limite inferiore, che esiste sempre, il limite potrebbe non esistere.) Se |λ| > r(a), allora vale: Rλ (a) =
+∞
(−λ)−(n+1) an ,
(8.8)
n=0
perch´e, per il teorema di Hadamard, il bordo del cerchio di convergenza di una serie di potenze di Laurent di una funzione analitica `e quello che passa nella singolarit` a pi` u vicina al punto all’infinito. Nel caso in esame, dato che tutte le singolarit` a appartengono allo spettro σ(a), il bordo del cerchio di convergenza `e dato dai punti λ ∈ C con |λ| > r(a). In definitiva, la serie di sopra converge per ogni λ ∈ C tale che |λ| > r(a) e quindi converger`a assolutamente in ogni cerchio, centrato nel punto all’infinito, che passa per un tale λ. In particolare varr` a: |λ|−(n+1)||an || → 0 , se n → +∞, per ogni λ ∈ C con |λ| > r(a). Per ogni > 0, deve accadere allora che, definitivamente: ||an||1/n < 1/n |λ|(n+1)/n = (|λ|)1/n|λ| , a che lim supn ||an||1/n ≤ per cui, essendo (|λ|)1/n → 1 per n → +∞, accadr` |λ| per ogni λ ∈ C con |λ| > r(a). Dato che possiamo avvicinarci a piacere al valore di r(a) con |λ|, dovr` a accadere che lim supn ||an ||1/n ≤ r(a). Tenendo conto di (8.7), abbiamo infine che: r(a) ≤ lim inf ||an ||1/n ≤ lim sup ||an ||1/n ≤ r(a) . n
n
Questo prova che esiste il limite di ||an ||1/n per n → +∞ e che esso coincide con r(a). (b). Per (a) di proposizione 3.41 abbiamo che ||an || = ||a||n se a `e normale. Applicando la formula di Gelfand, si ha: r(a) = lim ||an ||1/n = lim (||a||n)1/n = ||a|| . n→+∞
n→+∞
La (8.6) segue immediatamente dalla propriet` a delle C ∗ -algebre: ||a∗ a|| = 2 ||a|| valida per ogni elemento a e tenendo conto che a∗ a `e autoaggiunto e quindi normale. Questo completa la dimostrazione. L’identit` a (8.6) mostra che la norma di una fissata C ∗ -algebra `e unicamente individuata: non `e possibile cambiare la norma, lasciando immutata la struttura di ∗ -algebra, in modo da ottenere ancora una C ∗ -algebra. Inoltre la norma `e completamente determinata dalle propriet`a algebriche: dato che il raggio spettrale si ricava dallo spettro, che si costruisce per via completamente algebrica. La (8.6) ha un importante conseguenza.
8.1 Spettro e risolvente
319
Corollario 8.12. Se φ : A → B `e uno ∗ -omomorfismo tra le C ∗ -algebre con unit` a A e B, allora `e continuo valendo: ||φ(a)||B ≤ ||a||A per ogni a ∈ A. Se φ `e un ∗ -isomorfismo, allora `e anche isometrico: ||φ(a)||B = ||a||A per ogni a ∈ A. Dimostrazione. Se λ ∈ ρ(a), allora λ ∈ ρ(φ(a)), come segue immediatamente dal fatto che φ `e uno ∗ -omomorfismo. Quindi σ(φ(a)) ⊂ σ(a) e dunque r(φ(a)) ≤ r(a) se a `e normale. La (8.6) implica subito che ||φ(a)||2B = rB (φ(a)∗ φ(a)) = rB (φ(a∗ a)) ≤ rA (a∗ a) = ||a||2A. La seconda affermazione `e ora ovvia ripetendo la prova per φ−1 . Osservazioni 8.13. (1) Ci si pu` o chiedere se esistano C ∗ -algebre che non siano algebre concrete di operatori su spazi di Hilbert. La risposta `e negativa, anche se l’identificazione tra una C ∗ -algebra ed una C ∗ -algebra di operatori non `e univocamente fissata. Vale infatti il seguente importantissimo risultato [BrRo02]. Teorema 8.14. (Di Gelfand-Naimark.) Se A `e una C ∗-algebra con unit` a, allora esiste uno spazio di Hilbert H ed uno ∗ -isomorfismo (isometrico) φ : A → B, dove B ⊂ B(H) `e una sotto C ∗ -algebra di B(H). La terna (H, B, φ) non `e univocamente fissata da A. (2) L’immagine φ(A) di uno ∗ -omomorfismo di C ∗ -algebre, φ : A → B, `e sempre una sotto C ∗ -algebra di B [BrRo02]. Dal corollario 8.12 segue allora che φ `e isometrico se φ `e iniettivo, ma non necessariamente suriettivo. 8.1.3 Spettri di operatori autoaggiunti, unitari e normali in spazi di Hilbert Torniamo a considerare il caso concreto di operatori unitari e di operatori autoaggiunti in spazi di Hilbert e discutiamone la struttura dello spettro. Usando la definizione 8.2, lavoriamo nel caso generale, considerando anche operatori non limitati con dominio non massimale. Proposizione 8.15. Sia H spazio di Hilbert. Valgono i seguenti fatti. (a) Se A `e operatore autoaggiunto in H (non necessariamente limitato e non definito su tutto H in generale), allora: (i) σ(A) ⊂ R, (ii) σr (A) = ∅, (iii) autospazi di A con autovalori (cio`e punti di σp (A)) distinti sono ortogonali1 . (b) Se U ∈ B(H) `e operatore unitario, allora: (i) σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}, (ii) σr (U ) = ∅. 1 L’analoga propriet` a per operatori normali (e quindi unitari o autoaggiunti limitati) in B(H) `e gi` a stata provata in (b) della proposizione 3.49.
320
8 Teoria Spettrale I: operatori limitati
(c) Se T ∈ B(H) `e operatore normale, allora: (i) σr (T ) = σr (T ∗ ) = ∅, (ii) σp (T ∗ ) = σp (T ), dove la barra indica la coniugazione complessa, (iii) σc(T ∗ ) = σc (T ), dove la barra indica la coniugazione complessa. Dimostrazione. (a). Cominciamo con (i). Supponiamo λ = μ + iν con ν = 0 e proviamo che λ ∈ ρ(A). Se x ∈ D(A), vale: ((A−λI)x|(A−λI)x) = ((A−μI)x|(A−μI)x)+ν 2 (x|x)+iν[(Ax|x)−(x|Ax)]. L’ultimo addendo `e nullo perch´e A `e autoaggiunto. Concludiamo che: ||(A − λI)x|| ≥ |ν| ||x|| . Con la stessa procedura si trova anche che: ||(A − λI)x|| ≥ |ν| ||x|| . a ||(A−λI)−1 || ≤ Gli operatori A−λI e A−λI saranno dunque iniettivi e varr` −1 −1 |ν| , dove (A − λI) : Ran(A − λI) → D(A). Notiamo ora che vale: ⊥
Ran(A − λI) = [Ran(A − λI)]⊥ = Ker(A∗ − λI) = Ker(A − λI) = {0} , dove, nell’ultimo passaggio, si `e tenuto conto del fatto che A − λI `e iniettivo. Riassumendo, vale che: A − λI `e iniettivo, (A − λI)−1 `e limitato e ⊥
Ran(A − λI) = {0}, cio`e Ran(A − λ) `e denso in H; quindi λ ∈ ρ(A), per definizione di insieme risolvente. Passiamo a (ii). Supponiamo che λ ∈ σ(A), ma che λ ∈ σp (A). In tal caso A − λI deve essere iniettivo e quindi Ker(A − λI) = {0}. Essendo A = A∗ e λ ∈ R per (i), vale allora Ker(A∗ − λI) = {0}, per cui [Ran(A − λI)]⊥ = Ker(A∗ − λI) = {0} e quindi Ran(A − λI) = H. Di conseguenza λ ∈ σc (A). La prova di (iii) `e immediata: se λ = μ e Au = λu, Av = μv, allora, tenendo conto del fatto che λ, μ ∈ R e che A = A∗ , (λ − μ)(u|v) = (Au|v) − (u|Av) = (u|Av) − (u|Av) = 0 ; essendo λ − μ = 0, deve essere (u|v) = 0. (b). (i) Il fatto che σ(U ) sia chiuso segue subito da (b) del teorema 8.4, dato che ogni operatore unitario `e definito su tutto H, limitato e, quindi, chiuso. Essendo ||U || = 1, da (c) dello stesso teorema segue anche che σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| ≤ 1}. Per concludere, consideriamo la serie: +∞ S(λ) = λn (U ∗ )n+1 n=0
dove |λ| < 1. Tenendo conto che ||U || = ||U ∗|| = 1, si vede immediatamente che la serie converge assolutamente nella norma operatoriale e quindi definisce
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
321
un operatore di B(H). Tenendo infine conto che U ∗ U = U U ∗ = I ed usando la serie scritta sopra, si ha che: (U − λI)S(λ) = S(λ)(U − λI) = I . Per (a) del teorema 8.4, deve allora essere λ ∈ ρ(U ). In definitiva: σ(U ) `e un sottoinsieme compatto e non vuoto di {λ ∈ C | |λ| = 1}. (ii) La tesi `e conseguenza di (i) di (c), essendo normale ogni operatore unitario. (c). Ricordiamo che, se T ∈ B(H) `e normale, allora λ ∈ C `e autovalore di T se e solo se λ `e autovalore di T ∗ ((i) di (b) in proposizione 3.49). Questo fatto da solo prova (ii). Essendo le tre parti dello spettro disgiunte e valendo σ(T ) = σ(T ∗ ) ((b) proposizione 8.10), per provare (iii) basta dimostrare (i). Supponiamo che λ ∈ σ(T ), ma che λ ∈ σp (T ). Essendo σ(T ) = σ(T ∗ ) e σp(T ) = σp (T ∗ ), questo equivale a dire che λ ∈ σ(T ∗ ), ma che λ ∈ σp (T ∗ ). In tal caso T ∗ − λI deve essere iniettivo e quindi Ker(T ∗ − λI) = {0}. Allora (per (d) di proposizione 3.38) [Ran(T − λI)]⊥ = Ker(T ∗ − λI) = {0} e quindi Ran(T − λI) = H (dove la barra indica qui la chiusura!). Di conseguenza λ ∈ σc(T ). In altre parole σr (T ) = ∅. La dimostrazione per T ∗ `e la stessa, usando il fatto che (T ∗ )∗ = T ((b) di proposizione 3.38).
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati In questa sezione dimostreremo come sia possibile rappresentare un’algebra di funzioni f misurabili limitate in termini di un’algebra di operatori costituita da corrispondenti funzioni di un operatore f(T ). Pi` u precisamente, costruire mo una trasformazione continua ΦT : Mb (K) → B(H), che conservi la struttura di C ∗ -algebra, da uno spazio di funzioni misurabili limitate e definite su un compatto K, allo spazio degli operatori limitati e definiti su uno spazio di Hilbert H (vedi (4) in esempi 2.39 e (1) in esempi 3.42). La trasformazione suddetta `e “generata” da un operatore autoaggiunto T ∈ B(H) e K = σ(T ). T (f) come f(T ), per motivi che saranno Nei prossimi capitoli interpreteremo Φ suggeriti dall’interpretazione fisica in relazione con la nozione di osservabile. Il primo passo per costruire tali trasformazioni consiste nello studio di funzioni polinomiali di T e T ∗ , nel caso pi` u generale in cui T ∈ B(H) sia un operatore normale. Per ragioni tecniche `e conveniente, in certi casi, esprimere tali polinomi in funzione di due variabili autoaggiunte che ora introduciamo. Consideriamo un operatore normale T ∈ B(H), dove H `e uno spazio di Hilbert. Possiamo sempre decomporre T e T ∗ in combinazioni lineari di due operatori autoaggiunti, X, Y , commutanti tra di loro: T = X + iY ,
T ∗ = X − iY ,
(8.9)
T − T∗ . 2i
(8.10)
essendo per definizione: X :=
T + T∗ , 2
Y :=
322
8 Teoria Spettrale I: operatori limitati
Gli operatori X e Y sono evidentemente autoaggiunti per costruzione. La prova del fatto che X e Y commutano `e immediata, in virt` u della commutativit` a di T e T ∗ . La decomposizione (8.9) `e analoga a quella dei numeri complessi in parte reale ed immaginaria: z = x + iy ,
z = x − iy ,
(8.11)
z−z . 2i
(8.12)
essendo per definizione x :=
z+z , 2
y :=
` importante precisare che si possono considerare z e Osservazione 8.16. E z come variabili indipendenti, biunivocamente legate alle variabili x, y. I polinomi e, pi` u in generale, le funzioni di x e y, sono allora in corrispondenza biunivoca con le funzioni di z e z: alla funzione f = f(z, z) si pu` o associare la funzione g = g(x, y), definita come g(x, y) := f(x +iy, x −iy) e, viceversa, alla funzione g = g(x, y) si pu` o associare la funzione f1 = f1 (z, z), definita come ` chiaro che vale f1 = f identicamente. f1 (z, z) := g((z + z)/2, (z − z)/2i). E Sfrutteremo tale possibilit`a in seguito. Definiamo l’applicazione φT che associa ad un polinomio a coefficienti complessi p = p(x, y), (x, y) ∈ R2 , l’operatore normale p(X, Y ) (definito nel modo pi` u ovvio, interpretando i prodotti di numeri x e y come composizione di operatori X e Y e definendo X 0 := Y 0 := I). φT ha delle caratteristiche interessanti, la cui verifica `e immediata, tenendo conto del fatto che X e Y (e dunque le loro potenze) commutano: (a) `e lineare: φT (αp + βp ) = αφT (p) + βφT (p ) per ogni α, β ∈ C, (b) trasforma il prodotto di polinomi nella composizione di operatori: φT (p· p ) = φT (p) ◦ φT (p ), (c) trasforma il polinomio costante 1 nell’operatore identit`a: φT (1) = I. Queste propriet` a, per definizione (cfr A7 in definizione 2.36), rendono φT un omomorfismo di algebre con unit` a, definito sulla ∗ -algebra con unit` a dei polinomi complessi ed a valori nella C ∗-algebra B(H). Ci sono altre propriet` a di φT interessanti: (d) φT manda il polinomio R2 (x, y) → z = x + iy, che indicheremo un po’ impropriamente con z, nell’operatore T . Cio`e: φT (z) = T , (e) se p denota il polinomio complesso coniugato del polinomio p (cio`e p(x, y) = p(x, y) per ogni (x, y) ∈ R2 ), vale φT (p)∗ = φT (p), (f) se, per A ∈ B(H), valgono AT = T A e AT ∗ = T ∗ A, allora AφT (p) = φT (p)A per ogni polinomio p. C’`e infine un’altra interessante propriet` a, che si riscontra quando T = T ∗ e si restringe il dominio dei polinomi considerati al compatto σ(T ) ⊂ R. In tal caso ogni polinomio complesso p = p(x, y) definito sul compatto σ(T ) si pu` o scrivere come funzione della sola variabile z = x, dato che y = 0.
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
323
Dato che φT (p) = p(T ) `e un operatore normale, in virt` u di (b) del teorema 8.11, deve valere: ||p(T )|| = r(p(T )) = sup{|μ| ∈ C | μ ∈ σ(p(T ))} . La proposizione 8.10 implica allora che: ||φT (p)|| = sup{|p(z)| | z ∈ σ(T )} .
(8.13)
In altre parole, se dotiamo l’algebra dei polinomi su σ(T ) della norma ||||∞, φT risulta essere un’isometria. Questo risultato, come vedremo tra poco, pu` o essere esteso, con opportune precisazioni, al caso di funzioni non necessariamente polinomiali. Occupiamoci ora, in modo specifico, del caso in cui T sia autoaggiunto. Ricordiamo che C(X) indica lo spazio delle funzioni continue sullo spazio topologico X a valori complessi, come visto nel capitolo (vedi (4) in esempi 2.39 e (1) in esempi 3.42), tale spazio `e una C ∗-algebra commutativa con unit`a se X `e compatto, in tal caso la norma `e quella dell’estremo superiore || ||∞ e l’involuzione `e data dalla coniugazione complessa. Proposizione 8.17. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. (a) Esiste un unico omomorfismo continuo, ΦT : C(σ(T )) → B(H), dalla C ∗-algebra commutativa con unit` a C(σ(T )) alla C ∗ -algebra con unit` a B(H), che gode della propriet` a: ΦT (x) = T ,
dove x indica il polinomio σ(T ) x → x.
(8.14)
(b) ΦT gode delle ulteriori seguenti propriet` a: (i) `e isometrico: per ogni f ∈ C(σ(T )) vale ||ΦT (f)|| = ||f||∞, (ii) se, per A ∈ B(H), vale AT = T A, allora vale anche AΦT (f) = ΦT (f)A per ogni f ∈ C(σ(T )), (iii) ΦT `e uno ∗ -omomorfismo: ΦT (f ) = ΦT (f)∗ per ogni f ∈ C(σ(T )). Dimostrazione. (a). Dimostriamo l’esistenza. Lo spettro σ(T ) ⊂ R `e compatto per (c) del teorema 8.4 ed `e spazio topologico di Hausdorff perch´e tale `e R, quindi possiamo applicare il teorema 2.40 di Stone-Weierstrass. Lo spazio P (σ(T )) dei polinomi p = p(x), con x ∈ σ(T ), a coefficienti complessi, costituisce una sottoalgebra di C(σ(T )) che contiene l’unit`a, data dalla funzione di valore costantemente pari a 1, separa i punti di σ(T ) (se x1 , x2 ∈ σ(T ) con x1 = x2 , il polinomio p(x) := x − x1 su σ(T ) `e tale che p(x1 ) = 0, ma p(x2 ) = 0) ed `e chiusa rispetto alla coniugazione complessa. Il teorema 2.40 di Stone-Weierstrass assicura che lo spazio dei polinomi considerati `e denso in C(σ(T )). Consideriamo l’applicazione (definita prima della proposizione 8.17): φT : P (σ(T )) p → p(X, Y ) ∈ B(H) . Sappiamo che φT `e lineare e vale inoltre ||φT (p)|| = ||p||∞ per (8.13), il che implica la continuit`a di φT . Per la proposizione 2.57, esiste allora un unico
324
8 Teoria Spettrale I: operatori limitati
operatore lineare ΦT : C(σ(T )) → B(H) limitato che estende φT su C(σ(T )) e con la stessa norma. Tale operatore `e un omomorfismo di algebre con unit`a in quanto: (a) `e lineare, (b) soddisfa ΦT (f · g) = ΦT (f)ΦT (g) per continuit` a (dato che, banalmente, ci` o `e vero sulla sottoalgebra dei polinomi per definizione di φT ), (c) trasforma la funzione che vale costantemente 1 ∈ P (σ(T )) nell’operatore identit` a I ∈ B(H) per definizione di φT . La (8.14) `e banalmente vera in virt` u della propriet` a (d) dell’applicazione φT . Passiamo all’unicit` a: ogni altro omomorfismo χT di algebre con unit` a che soddisfa (8.14), deve coincidere con ΦT sullo spazio dei polinomi. (Infatti, deve essere T = χT (x) = ΦT (x) e quindi, usando pi` u volte il fatto che il prodotto di polinomi `e trasformato nella composizione di operatori, T n = χT (xn ) = ΦT (xn ); inoltre, l’ulteriore identit` a I = χT (1) = ΦT (1) vale per definizione di omomorfismo tra algebre con unit` a. Usando la linearit` a, si ottiene che, per ogni p ∈ P (σ(T )), vale p(T ) = χT (p) = ΦT (p).) Se χT `e anche continuo, per l’unicit` a dell’estensione continua coincider`a con ΦT ovunque. (b). Le propriet` a (i) e (ii) si provano immediatamente se f `e un polinomio e quindi si estendono direttamente per continuit` a al caso di f ∈ C(σ(T )). Infine l’omomorfismo `e uno ∗ -omomorfismo in quanto, se {pn } `e una successione di polinomi che tende, uniformemente su σ(T ), alla funzione continua f, {pn } tender` a, uniformemente su σ(T ), alla funzione continua f ; d’altra parte, come visto sopra (cfr propriet`a (e) di φT ), ΦT (pn ) = ΦT (pn )∗ e l’operazione di coniugazione hermitiana `e continua nella topologia operatoriale uniforme. Per la continuit` a di ΦT , dovr` a quindi essere: ΦT (f ) = ΦT (f)∗ . Ricordiamo che se X `e uno spazio topologico, B(X) indica la σ-algebra di Borel su X. La C ∗ -algebra delle funzioni f : X → C Borel-misurabili e limitate `e indicata con Mb (X) (vedi (3) in esempi 2.39 e (1) in esempi 3.42) con Mb (X). Rimanendo nel caso T = T ∗ , la proposizione appena provata pu` o essere estesa dimostrando l’esistenza e l’unicit` a di un analogo omomorfismo di algebre con unit` a tra Mb (σ(T )) e B(H) (dove la topologia usata su σ(T ) `e quella indotta dalla topologia di R ⊃ σ(T )). Questo risultato ha molteplici conseguenze. In particolare sar`a il cardine della parte di dimostrazione che riguarda l’esistenza della misura spettrale, nella prova del teorema spettrale 8.34. Teorema 8.18. Siano H spazio di Hilbert e T ∈ B(H) operatore autoaggiunto. T : Mb (σ(T )) → B(H), dalla (a) Esiste un unico omomorfismo continuo, Φ ∗ C -algebra commutativa con unit` a Mb (σ(T )) (riferita alla norma || ||∞), alla C ∗-algebra con unit` a B(H), tale che: (i) vale l’identit` a: T (x) = T , Φ
dove x `e la funzione σ(T ) x → x ,
(8.15)
(ii) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f :
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
σ(T ) → C, allora:
325
T (f) = w- lim Φ T (fn ) . Φ n→+∞
T gode delle ulteriori seguenti propriet` (b) Φ a: T si riduce all’omomorfismo isometrico ΦT su C(σ(T )) di proposizio(i) Φ ne 8.17, T (f)|| ≤ ||f||∞, (ii) per ogni f ∈ Mb (σ(T )) vale ||Φ T (f)A per ogni T (f) = Φ (iii) se, per A ∈ B(H), vale AT = T A, allora AΦ f ∈ Mb (σ(T )), T (f ) = Φ T (f)∗ per ogni f ∈ Mb (σ(T )), T `e uno ∗ -omomorfismo: Φ (iv) Φ (v) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f : σ(T ) → C, allora: T (f) = s- lim Φ T (fn ) , Φ n→+∞
T (f) ≥ 0. (vi) se f ∈ Mb (σ(T )) assume solo valori reali e f ≥ 0, allora Φ Dimostrazione. (a). Fissati x, y ∈ H, l’applicazione: Lx,y : C(σ(T )) f → (x|ΦT (f)y) ∈ C `e lineare e ||Lx,y || `e dato da: sup{|Lx,y (f)| | f ∈ C(σ(T )) , ||f||∞ = 1} ≤ ||x|| ||y|| sup{||ΦT (f)|| | f ∈ C(σ(T )) , ||f||∞ = 1} (dove si `e usata la disuguaglianza di Cauchy-Schwarz), da cui, usando il fatto che ΦT `e isometrico, troviamo: ||Lx,y || ≤ ||x|| ||y|| , e quindi Lx,y `e limitato. Per il teorema 2.62 della rappresentazione di Riesz per le misure complesse, esiste un’unica misura complessa μx,y sul compatto σ(T ) ⊂ C tale che, per ogni f ∈ C(σ(T )), si abbia: Lx,y (f) = (x|ΦT (f)y) = f(λ) dμx,y (λ) ; (8.16) σ(T )
vale inoltre |μx,y |(σ(T )) = ||Lx,y || ≤ ||x||||y||. Notiamo per inciso che se x = y, allora μx,x `e una misura reale, positiva e finita: infatti, se f ∈ C(σ(T )) assume solo valori reali, vale ΦT (f) = ΦT (f)∗ per (iii) di (b) nella proposizione 8.17, per cui: f(λ) h(λ)d|μx,x(λ)| = f(λ) h(λ)d|μx,x (λ)| σ(T )
σ(T )
= (x|ΦT (f)x) = (ΦT (f)x|x)
326
8 Teoria Spettrale I: operatori limitati
= (x|ΦT (f)x) =
σ(T )
f(λ) h(λ)d|μx,x(λ)| ,
dove abbiamo decomposto dμx,x in hd|μx,x|, essendo h una funzione misurabile di modulo unitario individuata quasi ovunque da μx,x e |μx,x| la misura positiva finita associata a μx,x detta variazione totale (vedi (1) in esempi 2.58). Per linearit` a, la relazione: f(λ) h(λ)d|μx,x(λ)| = f(λ) h(λ)d|μx,x (λ)| σ(T )
σ(T )
deve valere anche quando f ∈ C(σ(T )) prende valori complessi. Il teorema 2.62 di Riesz sulle misure complesse assicura allora che hd|μx,x| = hd|μx,x|, per cui h(λ) = h(λ) quasi ovunque, ma essendo |h(λ)| = 1, segue che h(λ) = 1 quasi ovunque e quindi μx,x `e una misura reale, positiva e finita (perch´e tale `e |μx,x|). Usiamo (8.16) per estendere Lx,y (f) al caso generale in cui f ∈ Mb (σ(T )), dato che il secondo membro `e comunque ben definito: se g ∈ Mb (σ(T )), g(λ) dμx,y (λ) . (8.17) Lx,y (g) := σ(T )
Dovr` a essere, per propriet`a generali delle misure complesse (cfr. (1) in esempi 2.58): |Lx,y (g)| ≤ ||g||∞|μx,y |(σ(T )) ≤ ||g||∞||x|| ||y|| . (8.18) Per costruzione, se g ∈ C(σ(T )) `e fissata, (x, y) → Lx,y (g) `e anti lineare in x e lineare in y. Si pu` o dimostrare che ci` o continua a valere anche per g ∈ Mb (σ(T )). Proviamo per esempio la linearit`a in y, l’anti linearit` a si prova analogamente. Da cui si ha che, per x, y, z ∈ H e g ∈ Mb (σ(T )) fissati, se α, β ∈ C, allora vale α g(λ) dμx,y (λ) + β g(λ) dμx,z (λ) = g(λ) dν(λ) , (8.19) σ(T )
σ(T )
σ(T )
dove ν `e la misura complessa definita da ν(E) := αμx,y (E)+βμx,z (E) per ogni boreliano E ⊂ σ(T ). Tenendo conto di come abbiamo definito le misure μx,y (cfr. (8.16)) e sfruttando la linearit` a del prodotto scalare di H nell’argomento di destra, si ricava subito che, per ogni f ∈ C(σ(T )) inserita in (8.19) al posto di g, sussiste l’identit`a: f(λ) dμx,αy+βz (λ) = f(λ) dν(λ) . σ(T )
σ(T )
Il teorema di Riesz assicura a questo punto che μx,αy+βz = ν. Pertanto, (8.19) pu` o essere riscritta, per ogni g ∈ Mb (σ(T )): g(λ) dμx,y (λ) + β g(λ) dμx,z (λ) = g(λ) μx,αy+βz (λ) . α σ(T )
σ(T )
σ(T )
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
327
Abbiamo provato che Lx,y (g) `e lineare in y per ogni fissato x ∈ H e ogni g ∈ Mb (σ(T )). La (8.18) implica la limitatezza dell’operatore lineare y → Lx,y (g) e quindi, per il teorema 3.17 (ancora di Riesz), fissati g ∈ Mb (σ(T )) e x ∈ H, esiste un unico vettore vx ∈ H tale che Lx,y (g) = (vx |y) per ogni y ∈ H. Dato che vx `e lineare in x (perch´e Lx,y (g) `e anti lineare in x e il prodotto scalare (vx |y) `e anti lineare in vx ), esister`a anche un unico operatore g(T ) ∈ L(H) per cui vx = g(T ) x per ogni x ∈ H. E quindi Lx,y (g) = (g(T ) x|y). La condizione (8.18) implica subito che g(T ) `e limitato, infatti: ||g(T ) x||2 = |(g(T ) x|g(T ) x)| = |Lx,g(T ) x (g)| ≤ ||g||∞ ||x|| ||g(T ) x|| , da cui
||g(T ) x|| ≤ ||g||∞ ||x||
e quindi ||g(T ) || ≤ ||g||∞. Posto g(T ) := g(T )∗ , abbiamo provato che, per g ∈ Mb (σ(T )), esiste un unico operatore g(T ) ∈ B(H) tale che, per ogni coppia x, y ∈ H: Lx,y (g) = (x|g(T )y) . L’applicazione lineare: T : Mb (σ(T )) f → f(T ) ∈ B(H) , Φ dove, per ogni x, y ∈ H: Lx,y (f) = (x|f(T )y) :=
σ(T )
f(λ) dμx,y (λ) ,
`e, per costruzione, un’estensione di ΦT : in particolare vale (8.15). L’estensione T (f)|| ≤ ||f||∞ per ogni f ∈ Mb (σ(T )), infatti: `e continua in quanto ||Φ T (f)|| = ||f(T )|| = ||f(T )∗ || = ||f(T ) || ≤ ||f||∞ . ||Φ T estende l’omomorfismo di algebre con unit` a ΦT , per provare che Dato che Φ T (f · T `e un omomorfismo di algebre con unit`a `e sufficiente mostrare che Φ Φ g) = ΦT (f)ΦT (g) quando f, g ∈ Mb (σ(T )). Se le due funzioni appartengono a C(σ(T )), la tesi `e vera per il teorema precedente. Supponiamo f, g ∈ C(σ(T )); allora: T (f · g)y) = (x|Φ T (f)Φ T (g)y) = f · g dμx,y = (x|Φ f dμx,ΦT (g)y . σ(T )
σ(T )
Il teorema di Riesz sulle misure complesse citato prima implica che la misura dμx,ΦT (g)y coincida con la misura g dμx,y . Quindi, se f ∈ Mb (σ(T )), si ha: f · g dμx,y = f dμx,ΦT (g)y . σ(T )
σ(T )
328
8 Teoria Spettrale I: operatori limitati
Da questo segue che, per ogni coppia x, y ∈ H, per ogni f ∈ Mb (σ(T )) e g ∈ C(σ(T )): T (f)Φ T (g)y) = (Φ T (f)∗ x|Φ T (g)y) f · g dμx,y = f dμx,ΦT (g)y = (x|Φ σ(T )
σ(T )
= σ(T )
g dμΦT (f)∗ x,y .
Ragionando come sopra e usando il teorema di Riesz, si ha che l’uguaglianza f · g dμx,y = g dμΦT (f)∗ x,y , (8.20) σ(T )
σ(T )
valida per ogni g ∈ C(σ(T )), implica fdμx,y = dμΦT (f)∗ x,y e dunque la (8.20) deve essere vera per ogni coppia x, y ∈ H e per ogni coppia f, g ∈ Mb (σ(T )). Quindi, con tali scelte del tutto generali: T (f · g)y) = (x|Φ f · g dμx,y = g dμΦT (f)∗ x,y σ(T )
σ(T )
T (f)∗ x|Φ T (g)y) = (x|Φ T (f)Φ T (g)y) = (Φ da cui:
x (Φ =0. T (f · g) − ΦT (f)ΦT (g))y
Scegliendo x coincidente con il secondo argomento del prodotto scalare, si trova che: T (f · g)y = Φ T (f)Φ T (g)y Φ per ogni y ∈ H e per ogni coppia f, g ∈ Mb (σ(T )), da cui T (f · g) = Φ T (f)Φ T (g) . Φ La propriet`a (ii) di (a) vale in conseguenza di (v) di (b), che proviamo sotto, indipendentemente da (ii) di (a). T quando sodPer concludere la dimostrazione di (a), proviamo l’unicit`a di Φ disfa le condizioni dette in (a). Se Ψ : Mb (σ(T )) → B(H) soddisfa le condizioni T sui polinomi, e quindi, per continuit` a, coincide in (a), allora coincide con Φ con ΦT su C(σ(T )). Per fissati x, y ∈ H, l’applicazione νx,y : E → (x|Ψ (χE )y) , dove E `e un qualsiasi boreliano di σ(T ) e χE la sua funzione caratteristica, `e una misura complessa su σ(T ). Infatti νx,y (∅) = (x|Ψ (0)y) = 0; inoltre, se {Sk }k∈N `e una famiglia di boreliani a due a due disgiunti, si ha: n
νx,y (∪k Sk ) = (x|Ψ (χ∪k Sk )y) = x lim Ψ χSk y
n→+∞ k=0
8.2 ∗-omomorfismi di C ∗ -algebre di funzioni indotti da operatori limitati
= lim
n
n→+∞
(x|Ψ (χSk )y) =
k=0
+∞
329
νx,y (Sk ) ,
k=0
dove il primo membro `e sempre finito e abbiamo tenuto conto della condizione (ii) di (a) e del fatto che, puntualmente: χ∪k Sk =
+∞
χSk .
(8.21)
k=0
Si osservi che la (8.21) non dipende dall’ordine con cui si etichettano gli insiemi Sk , essendo la serie di termini positivi. Di conseguenza, la relazione: νx,y (∪k Sk ) =
+∞
νx,y (Sk )
k=0
vale indipendentemente dall’ordinamento della serie e quindi, per un noto teorema, la serie converge assolutamente. Abbiamo provato che νx,y `e una misura complessa. Tenendo conto della linearit` a di Ψ e del prodotto scalare, nonch´e della definizione di integrale di una funzione semplice, si arriva facilmente a dimostrare che: s(x) dνx,y = (x|Ψ (s)y) σ(T )
per ogni funzione semplice s ∈ S(σ(T )). Se f ∈ Mb (σ(T )) e {sn } ⊂ S(σ(T )) converge uniformemente a f (tale successione esiste per (b) di proposizione 7.39), allora, in virt` u della continuit` a di Ψ nella norma || ||∞ e del teorema della convergenza dominata, si ha che, per ogni f ∈ Mb (σ(T )), vale: f dνx,y . (8.22) (x|Ψ (f)y) = σ(T )
In particolare, questo fatto deve valere per f ∈ C(σ(T )), sul quale spazio Ψ T . Di conseguenza, in virt` u del teorema 2.62 di Riesz sulle misucoincide con Φ re complesse, la misura νx,y coincide con la misura complessa μx,y introdotta T come: all’inizio della dimostrazione, attraverso la quale abbiamo definito Φ T (f)y) = f dμx,y , (x|Φ σ(T )
per x, y ∈ H e f ∈ Mb (σ(T )). Ma allora, essendo νx,y = μx,y , (8.22) implica T (f) per ogni f ∈ Mb (σ(T )). che Ψ (f) = Φ (b). Bisogna dimostrare solo (iii), (iv), (v) e (vi), dato che gli altri punti sono stati dimostrati nella prova di (a). La propriet` a (iii) vale nel caso in cui f ∈ C(σ(T )), come noto da (b) della proposizione 8.17. Allora: T (f)Ay) = (x|AΦ T (f)y) f dμx,Ay = (x|Φ σ(T )
330
8 Teoria Spettrale I: operatori limitati
T (f)y) = = (A∗ x|Φ
σ(T )
f dμA∗ x,y ,
per ogni coppia di vettori x, y ∈ H e per ogni f ∈ C(σ(T )). Il teorema 2.62 di Riesz sulla rappresentazione delle misure complesse sui Boreliani assicura allora che μA∗ x,y = μx,Ay , e quindi: f dμx,Ay = f dμA∗ x,y (x|ΦT (f)Ay) = σ(T )
σ(T )
T (f)y) = (x|AΦ T (f)y) , = (A∗ x|Φ per ogni coppia di vettori x, y ∈ H e per ogni f ∈ Mb (σ(T )). Per l’arbitrariet` a T (f) se f ∈ Mb (σ(T )) e T A = AT . T (f)A = AΦ dei vettori x, y, vale: Φ Passiamo a provare (iv). Se x ∈ H e g ∈ Mb (σ(T )), tenendo conto che μx,x `e reale, si ha: T (g)x) = T (g)x|x) = (x|Φ T (g)∗ x) . (x|Φ g dμx,x = g dμx,x = (Φ σ(T )
σ(T )
T (g) − Φ T (g)∗ )x) = 0 per ogni x ∈ H. Dall’esercizio 3.10 segue Quindi (x|(Φ ∗ che ΦT (g) = ΦT (g) . Dimostriamo (v). Sia {fn }n∈N ⊂ Mb (σ(T )) una successione, limitata (in valore assoluto) da K > 0, che converge a f : σ(T ) → C. Quindi ||f||∞ ≤ K e f `e misurabile, dunque f ∈ Mb (σ(T )). Fissati x, y ∈ H e usando (iv) di (b), T (fn ) − Φ T (f))x||2 = ((Φ T (fn ) − Φ T (f))x|(Φ T (fn ) − Φ T (f))x) ||(Φ T (|f − fn |2 )x) . T (fn − f)x) = (x|Φ T (fn − f)∗ Φ = (x|(Φ L’ultimo termine si pu` o scrivere come: 2 |f − fn | dμx,x = σ(T )
σ(T )
|f − fn |2 hd|μx,x| ,
dove |μx,x| `e la misura positiva (detta variazione totale) associata alla misura reale (con segno) μx,x e h `e una funzione misurabile di valore assoluto costante pari a 1 [Rud82]. (In realt` a, come abbiamo provato nel punto (a) di questa dimostrazione, μx,x `e una misura reale positiva, per cui |μx,x| = μx,x e h = 1.) Dato che `e: |μx,x|(σ(T )) < +∞ , per il teorema della convergenza dominata |h||f − fn |2 converge a 0 in T (fn ) − Φ T (f))x||2 → 0 per ogni L1 (σ(T ), |μx,x |). Quindi, se n → +∞, ||(Φ scelta di x ∈ H. Per finire dimostriamo (vi). Se Mb (σ(T )) f ≥ 0, allora f = g 2 dove vale T (f) = Φ T (g · g) = Φ T (g)Φ T (g). Inol0 ≤ g ∈ Mb (σ(T )). Pertanto, per (a), Φ ∗ T (g) = Φ T (g) (per (iv)), per cui: Φ T (g · g) = Φ T (g)∗ Φ T (g) = Φ T (g). Il tre Φ secondo membro `e evidentemente positivo.
8.3 Misure a Valori di Proiezione (PVM)
331
8.3 Misure a Valori di Proiezione (PVM) In questa sezione introdurremo le misure a valori di proiezione, anche dette misure spettrali o PVM. Esse sono lo strumento centrale per enunciare i teoremi spettrali. Si tratta della generalizzazione della nozione di misura sulla σ-algebra di Borel di uno spazio topologico X, ammettendo che l’immagine della misura non cada in R, ma nell’insieme dei proiettori ortogonali P(H) di uno spazio di Hilbert H: B(X) E → P (E) ∈ P(H) . Con tale nozione potremo integrare funzioni producendo operatori. Vedremo, T studiato nella sezione precedente, assoin particolare, che l’omomorfismo Φ ciato ad un operatore autoaggiunto limitato T , non `e altro che un integrale rispetto ad una di tali misure generata dall’operatore autoaggiunto T : ΦT (f) = f(x)dP (T ) (x) . σ(T )
Abbiamo gi` a incontrato le misure a valori di proiezione nel capitolo 7 (definizione 7.38), nella situazione particolare in cui la σ-algebra su cui `e definita la PVM fosse B(R). Un’osservabile quantistica, nel senso stabilito nel capitolo precedente `e un caso particolare di tali misure spettrali in virt` u della proposizione 7.36. 8.3.1 Misure a Valori di Proiezione (PVM) dette anche misure spettrali Per introdurre le misure a valori di proiezione, richiamiamo alcuni fatti topologici generali che risulteranno utili nel seguito. Definizione 8.19. Uno spazio topologico (X, T ) `e detto essere a base numerabile o numerabile di secondo tipo, se esiste una classe numerabile T0 ⊂ T (appunto la “base numerabile”) tale che ogni insieme aperto si possa ottenere come unione di elementi di T0 . Se (X, T ) `e a base numerabile vale il lemma di Lindel¨ of: Teorema 8.20. (Lemma di Lindel¨ of.) Sia (X, T ) spazio topologico a base numerabile. Se {Uα }α∈I `e una classe di aperti che ricopre l’insieme B ⊂ X, cio`e ∪α∈I Uα ⊃ B, allora `e possibile estrarre un sotto ricoprimento numerabile da {Uα }α∈I . In altre parole esiste una scelta di indici αn ∈ I, con n ∈ N tale che ∪n∈NUαn ⊃ B. Rn (e quindi Cn ), dotato della topologia standard, `e a base numerabile: T0 pu` o essere presa come la classe delle palle aperte di raggi razionali e centri dati da punti con coordinate razionali (con segno).
332
8 Teoria Spettrale I: operatori limitati
Ricordiamo infine che, se T, U ∈ B(H) con H spazio di Hilbert, T ≥ U significa (x|T x) ≥ (x|U x) per ogni x ∈ H (vedi la definizione 3.46 ed i commenti ad essa). Definizione 8.21. Siano H uno spazio di Hilbert, (X, T ) uno spazio topologico a base numerabile e B(X) la σ-algebra di Borel su X. Un’applicazione: P : B(X) → B(H) `e detta misura a valori di proiezione su X (PVM), oppure equivalentemente misura spettrale su X, se soddisfa i seguenti requisiti. (a) P (B) ≥ 0 per ogni B ∈ B(X); (b) P (B)P (B ) = P (B ∩ B ) per ogni coppia B, B ∈ B(X); (c) P (X) = I; (d) se {Bn }n∈N ⊂ B(X), con Bn ∩ Bm = ∅ per n = m, vale: s-
+∞
P (Bn ) = P (∪n∈N Bn ) .
n=0
Il supporto di P `e l’insieme chiuso: supp(P ) := X \
A.
A∈T ,P (A)=0
Quando X = Rn o Cn , P `e detta limitata se supp(P ) `e limitato. Un’altra collegata ed utile definizione `e la seguente. Definizione 8.22. Se P : B(X) → B(H) `e una PVM, f : X → C Borel misurabile `e detta essenzialmente limitata rispetto a P se: P ({x ∈ X | |f(x)| ≥ M }) = 0
per qualche M < +∞.
(8.23)
(P )
Se f `e essenzialmente limitata, l’estremo inferiore ||f||∞ dell’insieme dei valori M ≥ 0 che soddisfano (8.23) `e detto (semi) norma essenziale di f rispetto a P . Abbiamo subito una proposizione che enuncia le propriet` a fondamentali delle PVM. In particolare, risulta che P (E) ∈ P(H), dove P(H) indica, come al solito, la classe dei proiettori ortogonali sullo spazio di Hilbert H. Proposizione 8.23. Sia P : B(X) → B(H) una PVM nel senso della definizione 8.21. Valgono i fatti seguenti. (a) P (B) ∈ P(H) per ogni B ∈ B(X), in particolare P (∅) = 0 proiettore su {0}. (b) Vale la propriet` a di isotonia: P (C) ≤ P (B) se B, C ∈ B(X) e C ⊂ B. (c) Vale la propriet` a di subadditivit` a: se Bn ∈ B(X) per n ∈ N, allora: (x |P (∪n∈N Bn ) x) ≤ (x|P (Bn )x) per ogni x ∈ H. n∈N
8.3 Misure a Valori di Proiezione (PVM)
333
(d) Vale P (supp(P )) = I e quindi: (i) P (B) = P (B ∩ supp(P )) se B ∈ B(X) (ii) P (C) = 0 se C ⊂ X \ supp(P ) e C ∈ B(X). Dimostrazione. (a). Gli operatori P (B) sono idempotenti P (B)P (B) = P (B∩ B) = P (B) per (b) nella def 8.21 e autoaggiunti perch´e limitati e positivi (per (a) in def. 8.21) per cui sono proiettori ortogonali. Usando poi (c) e (d) di def. 8.21 abbiamo I = P (X ∪ ∅) = I + P (∅), per cui P (∅) = 0. (b) B = C ∪ (B \ C) e C ∩ (B \ C) = ∅ per cui, da (d) in def. 8.21: P (B) = P (C) + P (B \ C). Essendo P (B \ C) ≥ 0, vale P (C) ≤ P (B). (c) Definiamo B := ∪n∈N Bn e la successione {Cn }n∈N con C0 := B0 , C1 := B1 \ B0 , C2 := B2 \ (B0 ∪ B1 ) e via di seguito. Evidentemente Ck ∩ Ch = ∅ se h = k e B = ∪n∈N Cn . Di conseguenza, +∞ per (d) di def. 8.21, +∞ P (B) = s- n=0 P (Ck ) e quindi: (x|P (B)x) = n=0 (x|P (Ck )x). Dato che Ck ⊂ Bk per ogni k ∈ N, per isotonia varr` a anche (x|P (Ck )x) ≤ (x|P (Bk )x) +∞ e pertanto: (x|P (B)x) ≤ n=0 (x|P (Bk )x). (d) P (supp(P )) = I `e evidentemente equivalente (per (d) di def. 8.21 ristretto al caso finito) a P (A) = 0, dove A := X \ supp(P ). Per provare che P (A) = 0 notiamo che, per definizione A `e unione di aperti con misura spettrale nulla. Dato che X `e numerabile di secondo tipo, possiamo estrarre un sotto ricoprimento numerabile dal ricoprimento detto. In altre parole, vale A = ∪n∈N An con P (An ) = 0 per ogni n ∈ N. Usando la subadditivit` a per ogni x ∈ H: 0 ≤ ||P (A)x||2 = (P (A)x|P (A)x) = (x|P (A)x) ≤
(x|P (An )x) = 0
n∈N
per cui P (A) = 0. La propriet` a (ii) segue immediatamente per isotonia. Con la definizione di A detta, la propriet` a (i) segue decomponendo B = (B ∩ supp(P )) ∪ (B ∩ A), da cui, per (d) della def. 8.21, P (B) = P (B ∩ supp(P )) + P (B ∩ A), ed usando infine (i). Osservazioni 8.24. (1) La coppia di condizioni (a) e (b) nella definizione 8.21 pu` o essere sostituita equivalentemente con la richiesta che ogni P (B) sia un proiettore ortogonale. Il fatto che ogni P (B) nella definizione 8.21 sia un proiettore ortogonale `e provato in (a) della proposizione 8.23. Il fatto che, se ogni P (B) `e proiettore ortogonale e valgono (c) e (d) della definizione 8.21, allora valgono anche (a) e (b) della stessa definizione sar` a provato nel lemma 9.16. (2) Se f : X → C `e Borel misurabile, la propriet` a (ii) in (d) implica immediatamente la prima disuguaglianza di sotto (la seconda `e ovvia): (P ) ||f||∞ ≤ ||fsupp(P ) ||∞ ≤ ||f||∞ .
(8.24)
L’insieme delle funzioni Borel misurabili essenzialmente limitate rispetto a P (P ) `e uno spazio vettoriale e || ||∞ `e una seminorma su tale spazio.
334
8 Teoria Spettrale I: operatori limitati
(3) In questo libro lavoreremo solo con PVM definite su σ-algebre di Borel B(X) ricavate da spazi topologici X a base numerabile. Tale requisito non `e strettamente necessario e quasi tutta la teoria si potrebbe sviluppare lavorando con σ-algebre generiche (vedi per esempio [Rud91]). La nostra scelta `e unicamente dettata dalla comodit`a. In primo luogo, in questo modo, il supporto della PVM soddisfa le propriet` a enunciate in (d) della proposizione appena provata, che rendono utile la nozione di supporto, inoltre il teorema di decomposizione spettrale viene enunciato su C (o R), che ha topologia a base numerabile. 8.3.2 Integrale di funzioni misurabili limitate rispetto a una PVM Passiamo ora a costruire una procedura d’integrazione di funzioni misurabili limitate f : X → C rispetto ad una misura a valori di proiezione P : B(X) → B(H). Ricordiamo che, se X `e uno spazio dotato di una σ-algebra Σ, s : X → C, che sia misurabile rispetto a Σ, `e detta funzione semplice quando assume solo un numero finito di valori. Notazione 8.25. Se X `e uno spazio topologico, S(X) denota lo spazio vettoriale delle funzioni semplici su X, relative a σ-algebra di Borel B(X). Supponiamo che sia assegnata una PVM su X, spazio topologico a base numerabile, a valori in B(H), per uno spazio di Hilbert H. Consideriamo una funzione s ∈ S(X). Possiamo sempre scriverla come, per opportuni ci ∈ C e I finito: s= ci χEi . (8.25) i∈I
Poich´e, per definizione, una funzione semplice assume solo un numero finito di valori distinti, questa espressione `e univocamente fissata da s se si richiede che gli insiemi Ei siano misurabili e a due a due disgiunti, e i numeri complessi ci siano tutti distinti. Definiamo l’integrale di s rispetto a P come l’operatore di B(H): s(x) dP (x) := ci P (Ei ) . (8.26) X
i∈I
Osservazione 8.26. Se non si richiede che i numeri ci nell’espressione di s scritta sopra siano distinti, ci sono molte possibilit`a nello scrivere s come combinazione lineare di funzioni caratteristiche di insiemi misurabili disgiunti. Tuttavia si prova facilmente, ripetendo la stessa dimostrazione del caso in cui si lavori con una misura ordinaria, che l’integrale di s non dipende dalla rappresentazione di s scelta.
8.3 Misure a Valori di Proiezione (PVM)
335
L’applicazione: I : S(X) s →
X
s(x) dP (x) ∈ B(X) ,
(8.27)
`e lineare, ovvero I ∈ L(S(X), B(X)), come `e facile dimostrare tenendo conto dell’osservazione precedente. Essendo S(X) e B(X) spazi normati, L(S(X), B(X)) `e dotato della norma operatoriale. I risulta essere un operatore limitato rispetto a tale norma. Proviamolo consideriamo s ∈ S(X) della forma in (8.25), tenendo conto che gli insiemi Ek sono a due a due disgiunti, per cui: P (Ej )P (Ei ) = P (Ej ∩ Ei ) = 0 se i = j oppure P (Ej )P (Ei ) = P (Ei ) se i = j. Se x ∈ H:
⎛ ⎞
||I(s)x||2 = (I(s)x|I(s)x)2 = ⎝ ci P (Ei )x
cj P (Ej )x ⎠
j∈I i∈I =
( ci P (Ej )∗ P (Ei )x| cj x) =
i,j∈I
=
( ci P (Ej )P (Ei )x| cj x)
i,j∈I
|ci |2 (x|P (Ei )x) ≤ sup |ci |2 i∈I
i∈I
(x|P (Ei )x) ,
i∈I
a ed dove I ⊂ I `e costituito dagli indici per cui P (Ei ) = 0. Per subadditivit` isotonia: (x|P (Ei)x) ≤ (x|P (∪i∈I Ei )x) ≤ (x|P (X)x) = (x|x) = ||x||2 . i∈I Tenendo infine conto che, banalmente ||s||P ∞ = sup i∈I |ci |, essendo I fini2 2 P 2 to, concludiamo che: ||I(s)x|| ≤ ||x|| (||s||∞) , da cui, prendendo l’estremo superiore sui vettori x ∈ H con ||x|| = 1: (P ) ||I(s)|| ≤ ||s||∞ . (P )
Tuttavia, dato che ||s||∞ coincide con uno dei valori finiti assunti da |s|, diciamo |ck |, se scegliamo x ∈ P (Ek )(H) (che `e = {0} per costruzione), valendo x = P (Ek )x, avremo che: I(s)x = ci P (Ei )x = ci P (Ei )P (Ek )x = ck P (Ek )x = ck x . i∈I
i∈I (P )
Pertanto, scegliendo x con ||x|| = 1, si ottiene ||I(s)x|| = ||s||∞ . Concludiamo che I `e sicuramente continua su S(X) ⊂ Mb (X) nella norma || ||∞, valendo per quanto appena provato e per (8.24): (P ) ||I(s)|| = ||s||∞ ≤ ||s supp(P ) ||∞ ≤ ||s||∞ .
(8.28)
336
8 Teoria Spettrale I: operatori limitati
Con questo risultato possiamo passare a definire l’integrale di funzioni Borelmisurabili limitate, estendendo I, per linearit` a e continuit`a, a tutto lo spazio di Banach Mb (X) delle funzioni f : X → C Borel-misurabili e limitate. Mb (X) contiene S(X) come sottospazio denso nella norma || ||∞ , per (b) di proposizione 7.36. L’operatore I : S(X) → B(X) `e continuo. Per la proposizione 2.57, esiste ed `e unico un operatore limitato da Mb (X) in B(X) che estende I. Definizione 8.27. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione definita sulla σ-algebra di Borel di X. (a) L’unica estensione limitata I : Mb (X) → B(X) dell’operatore I : S(X) → B(X) (vedi (8.26) e (8.27)) si chiama operatore integrale rispetto a P . (b) Per ogni f ∈ Mb (X): f(x) dP (x) := I(f) X
`e detto integrale di f rispetto alla misura a valori di proiezione P . (c) Sia f : X → C Borel-misurabile, non necessariamente limitata. Se f E ∈ Mb (E) con E ⊂ B(X), allora si definisce: f(x) dP (x) := χE (x)f(x) dP (x) . X
E
Se g ∈ Mb (E), con E ⊂ B(X), allora si definisce: g(x) dP (x) := g0 (x) dP (x) , X
E
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x ∈ E. Osservazione 8.28. Se P `e una misura spettrale su X e supp(P ) = X, possiamo restringere P ad una misura spettrale P supp(P ) su supp(P ) (dotato della topologia indotta da X), definendo P supp(P ) (E) := P (E) per ogni boreliano E ⊂ B(supp(P )). Il fatto che P supp(P ) sia una PVM `e di verifica immediata usando la proposizione 8.23, specialmente il punto (d). Da (i) nel punto (d) segue immediatamente che, per ogni s ∈ S(X): sdP = sdP = ssupp(P ) dP supp(P ) , X
supp(P )
supp(P )
dove il secondo integrale `e interpretato nel senso di (c) nella definizione 8.27. Dato che, se S(X) sn → f rispetto alla norma || ||∞, allora S(X) sn supp(P ) → f supp(P ) rispetto alla stessa norma, applicando la definizione di integrale rispetto a P per una f ∈ Mb (X), risulta subito che: fdP = fdP = fsupp(P ) dP supp(P ) per ogni f ∈ Mb (X). X
supp(P )
supp(P )
(8.29)
8.3 Misure a Valori di Proiezione (PVM)
337
Esempi 8.29. (1) Facciamo un esempio concreto affinch´e la procedura non sembri troppo astratta. In realt` a, il seguente esempio, con un’estensione, esaurisce tutti i casi possibili, come vedremo pi` u avanti. Consideriamo uno spazio di Hilbert H = L2 (X, μ), dove X `e uno spazio topologico a base numerabile e μ `e una misura positiva σ-additiva sulla σalgebra di Borel di X. Una misura spettrale su H si ottiene definendo, per ogni ψ ∈ L2 (X, μ) e E ∈ B(X): (P (E)ψ)(x) := χE (x)ψ(x) ,
per quasi ogni x ∈ X .
(8.30)
Si prova facilmente che l’applicazione B(X) E → P (E) definisce effettivamente una misura spettrale su L2 (X, μ). Vogliamo ora capire come siano fatti gli operatori X f(x) dP (x) per ogni funzione di Mb (X). Notiamo che se ψ ∈ L2 (X, μ) e f ∈ Mb (X), allora f · ψ ∈ L2 (X, μ), dove · indica la moltiplicazione delle due funzioni punto per punto, infatti: |f(x)ψ(x)|2 dμ(x) ≤ ||f||2∞ |ψ(x)|2 dμ(x) < +∞ . X
X
In particolare, abbiamo anche provato che, se f ∈ Mb (X) e ψ ∈ L2 (X, μ), allora: ||f · ψ|| ≤ ||f||∞||ψ|| . Da ci`o segue immediatamente che: Se {fn }n∈N ⊂ Mb (X) e fn → f ∈ Mb (X) nella norma || ||∞ per n → +∞, allora anche fn · ψ → f · ψ nella convergenza di L2 (X, μ). Notiamo inoltre che, se s ∈ S(X), l’operatore X s(x) dP (x) si scrive esplicitamente usando (8.30) e (8.26): risulta subito che, per ogni ψ ∈ L2 (X), vale:
s(y) dP (y)ψ (x) = s(x)ψ(x) . X
u di Pertanto, se {sn } ⊂ S(X) converge uniformemente a f ∈ Mb (X) (in virt` (b) di proposizione 7.39, una siffatta successione esiste per ogni f ∈ Mb (X)), si ha: sn · ψ = sn (x) dP (x)ψ → f(x) dP (x)ψ X
X
quando n → +∞, per la definizione di integrale mediante l’estensione continua I di I. D’altra parte abbiamo visto all’inizio che nelle nostre ipotesi (con fn := sn ) vale anche sn · ψ → f · ψ nel senso di L2 (X) per n → +∞, per cui:
f(y) dP (y)ψ (x) = f(x)ψ(x) per quasi ogni x ∈ X, (8.31) X
per ogni f ∈ Mb (X) ed ogni ψ ∈ L2 (X, μ). (2) Come secondo esempio, consideriamo una base Hilbertiana N in uno spazio di Hilbert H separabile. Possiamo mettere su N la topologia discreta data
338
8 Teoria Spettrale I: operatori limitati
dall’insieme delle parti di N . In tale topologia gli insiemi contenenti singoli punti sono aperti, la σ-algebra di Borel associata a tale topologia coincide con la stessa topologia e coincide quindi con l’insieme delle parti di N . Si osservi che N `e numerabile di secondo tipo essendo H separabile. Se E ⊂ N `e un boreliano, consideriamo il sottospazio chiuso HE := < {z}z∈E >. Il proiettore ortogonale che proietta su tale spazio `e (cfr. (d) in proposizione 3.53): P (E) := s(z| )z , z∈E
essendo E base hilbertiana di HE . Si verifica subito che P : B(N ) E → P (E) `e effettivamente una misura a valori di proiezione. Infine si pu`o dimostrare che, se f : N → C `e una funzione limitata, vale: f(z) dP (z) = sf(z) (z| ) z . (8.32) N
z∈N
La prova di ci` o si pu` o ottenere dall’esempio (1), usando il fatto che (teorema 3.29) H `e isomorfo come spazio di Hilbert, sotto l’isometria suriettiva U : H → L2 (N, μ) che associa a x ∈ H la funzione z → ψx (z) := (z|x), allo spazio L2 (N, μ), dove μ `e la misura che conta i punti di N . Si verifica subito che effettivamente Q(E) := U P (E)U −1 `e l’operatore moltiplicativo in L2 (N, μ), che moltiplica per la funzione caratteristica di E: in tal modo si ottiene (come `e possibile verificare) una misura spettrale Q : B(N ) E → Q(E) del tipo di quelle introdotte nell’esempio (1). Usando la definizione di integrale di una funzione f ∈ Mb (X) tramite l’integrale di funzioni semplici, per le quali vale evidentemente: −1 s(z) dQ(z) = ci Q(Ei ) = U ci P (Ei )U = U s(z) dP (z)U −1 , N
i
si ricava:
N
i
f(z) dQ(z) = U
N
f(z) dP (z)U −1 ,
(8.33)
N
per la continuit` a della composizione di operatori in B(H). La (8.31) implica che: f(z) dQ(z)ψ = f · ψ . (8.34) N
Usando (8.33) e (8.34), si ha che: f(z) dP (z)φ = U −1 f · U φ = f(z) (z|φ) z , N
z∈N
dove abbiamo ricordato la definizione di U (cfr. teorema 3.29): U : H φ → {(z|φ)}z∈N ∈ L2 (N, μ)
8.3 Misure a Valori di Proiezione (PVM)
e la sua inversa: U −1 : L2 (N, μ) {αz }z∈N →
339
αz z ∈ H .
z∈N
In definitiva, abbiamo provato che, come volevamo: f(z) dP (z) = sf(z) (z| ) z . N
z∈N
(3) Come terzo esempio, presentiamo una generalizzazione dell’esempio (2). Consideriamo un insieme X che assumiamo dotato di una topologia a base numerabile per la quale valga anche che ogni insieme {x}, con x ∈ X, appartenga alla σ-algebra di Borel B(X) associata alla topologia. Per esempio, ci`o accade se X `e numerabile e si dota X della topologia discreta, ma si possono fare altri esempi ovvi: se `e X = R dotato della topologia standard, oppure se `e X := {0} ∪ {±1/n | n = 1, 2, . . .} ⊂ R e si dota X della topologia indotta da quella di R. Definiamo una classe di proiettori ortogonali, Pλ : H → H, sullo spazio di Hilbert H, per ogni λ ∈ X. Per avere una PVM richiediamo che valgano i seguenti fatti: (a) P λ Pμ = 0 per λ, μ ∈ X con λ = μ; (b) λ∈X ||Pλ ψ||2 < +∞ , per ogni ψ ∈ H; (c) λ∈X Pλ ψ = ψ , per ogni ψ ∈ H. Dalla richiesta (b) segue che solo una quantit` a al pi` u numerabile (cfr. proposizione 3.22) di elementi Pλ ψ sono non nulli, anche nel caso in cui X sia non numerabile; allora, tenendo anche conto del fatto che, per (a), i vettori Pλ ψ e Pμ ψ sono ortogonali se λ = μ, per il lemma 3.26 la somma in (c) `e ben definita e pu` o essere riordinata arbitrariamente. Il fatto che le richieste (a), (b) e (c) sono compatibili si verifica esibendo una classe di proiettori ortogonali che le soddisfano contemporaneamente. Il caso pi` u semplice `e fornito dalla classe dei proiettori P ({z}), z ∈ N , dell’esempio (2) nel caso in cui X `e una base hilbertiana. Un ulteriore esempio, in cui X non `e una base hilbertiana, sar` a presentato in (2) di esempi 8.39. Un caso in cui le condizioni (a), (b) e (c) sono verificate si ha considerando un operatore autoaggiunto compatto T , definendo X = σp (T ) ed infine definendo Pλ con λ ∈ σp (T ) come il proiettore ortogonale sull’autospazio con autovalore λ. La topologia su X sar`a quella indotta da R. Dai teoremi 4.17 e 4.18 segue facilmente che le condizioni (a), (b) e (c) sono verificate. Riscriveremo le due ultime richieste in forma sintetica come: sPλ = I . (8.35) λ∈X
Con le condizioni poste, si verifica facilmente che P : B(X) → B(H), definita in modo tale che, per ogni E ⊂ B(X), valga P (E) = sPλ , (8.36) λ∈E
340
8 Teoria Spettrale I: operatori limitati
`e una misura a valori di proiezione su H. La somma λ∈E Pλ ψ esiste sempre in H, per ogni ψ ∈ H, e non dipende dall’ordinamento: ci` o segue subito dalla condizione (b), tenendo conto di lemma 3.26. Vogliamo ora dimostrare che, per ogni f ∈ Mb (X): f(x) dP (x) = sf(x)Px . (8.37) X
x∈X
Si osservi che il secondo membro `e ben definito e pu` o essere riordinato a piacimento, per il lemma 3.26, essendo, per ogni ψ ∈ H: ||f(x)Px ψ||2 ≤ ||f||2∞ ||Pxψ||2 = ||f||2∞ (Px ψ|Pxψ) x∈X
=
x∈X
||f||2∞
(ψ|Px2 ψ) x∈X =
=
||f||2∞
x∈X
(ψ|Px ψ) =
||f||2∞
x∈X
||f||2∞(ψ|ψ)
ψ Px ψ
x∈X
=
||f||2∞||ψ||2
,
dove la penultima uguaglianza vale per (8.35). Se s ∈ S(X) `e una funzione semplice, applicando la definizione di integrale di funzione semplice e (8.36), segue subito che, per ogni ψ ∈ H: s(x) dP (x)ψ = ci P (Ei )ψ = s(x)Px ψ = s(x)Px ψ , (8.38) X
i
i
x∈Ei
x∈X
dove, nella seconda uguaglianza, abbiamo sfruttato il fatto che dall’espressione di s(x) = i ci χEi si ha ci = s(x) per ogni x ∈ Ei . Se {sn } ⊂ S(X) e sn → f ∈ Mb (X) uniformemente, allora, per ogni ψ ∈ H: f(x) dP (x)ψ − sn (x) dP (x)ψ → 0 , (8.39) X
X
per n → +∞, per la definizione di integrale di funzioni misurabili limitate. D’altra parte, per (8.38) e usando la (a), si ottiene:
2
f(x) Px ψ − sn (x) dP (x)ψ
X x∈X
=
|f(x) − sn (x)|2 ||Pxψ||2 ≤ ||f − sn ||2∞||ψ||2 .
x∈X
L’ultimo membro tende a zero se n → +∞. Per (8.39) e per l’unicit` a del limite in H, deve allora valere che, per ogni ψ ∈ H: f(x) Pxψ = f(x) dP (x)ψ , x∈X
pertanto vale (8.37).
X
8.3 Misure a Valori di Proiezione (PVM)
341
8.3.3 Propriet` a degli operatori ottenuti integrando funzioni limitate rispetto a PVM Esaminiamo in questa sezione le propriet`a dell’operatore integrale, dividendole in due parti. Vale il seguente teorema che stabilisce le prime propriet` a dell’operatore integrale. Riguardo a (v) in (c), ricordiamo che se B(X) `e la σ-algebra di Borel di uno spazio topologico X, il supporto di una misura μ su B(X), indifferentemente se positiva σ-additiva o complessa (vedi l’Appendice per la prima e (1) in esempi 2.58 per la seconda), `e l’insieme chiuso supp(μ) ⊂ X, dato dal complemento all’unione di tutti gli aperti A ⊂ X per cui μ(A) = 0. Teorema 8.30. Sia X spazio topologico a base numerabile, (H, ( | )) spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti. (a) Per ogni f ∈ Mb (X),
(P )
f(x) dP (x)
= ||f||∞ ≤ ||f supp(P ) ||∞ . (8.40)
X
(b) L’operatore integrale rispetto alla misura di proiezione P `e positivo: f(x) dP (x) ≥ 0 se vale 0 ≤ f ∈ Mb (X) . X
(c) Per ogni coppia ψ, φ ∈ H, si consideri l’applicazione:
μψ,φ : B(X) E → ψ
χE dP (x)φ . X
Valgono le propriet` a seguenti di μψ,φ : (i) μψ,φ `e una misura complessa su X, detta misura spettrale complessa associata a ψ e φ, (ii) se ψ = φ, μψ := μψ,ψ `e una misura positiva finita su X, detta misura spettrale (positiva) associata a ψ, (iii) μψ,φ (X) = (ψ|φ) e, in particolare, μψ (X) = ||ψ||2 , (iv) per ogni funzione f ∈ Mb (X) vale:
ψ f(x) dP (x)φ = f(x) dμψ,φ (x) , (8.41) X
X
(v) vale supp(μψ,φ ) ⊂ supp(|μψ,φ |) ⊂ supp(P ) e supp(μψ ) ⊂ supp(P ). Dimostrazione. (a). Consideriamo una successione di funzioni semplici tale (P ) che sn → f nella norma || ||∞. Di conseguenza: ||sn −f||∞ ≤ ||sn −f||∞ → 0 e (P ) (P ) (P ) (P ) quindi, dato che |||sn||∞ −||f||∞ | ≤ ||sn −f||∞ , concludiamo che ||sn ||∞ → (P ) (P ) ||f||∞ . Sappiamo anche che || X sn dP || = ||sn ||∞ dalla (8.28). Dato che
342
8 Teoria Spettrale I: operatori limitati
dalla definizione di integrale di funzioni limitate segue che: || X sn dP || → (P ) (P ) || X fdP ||, concludiamo che deve essere: ||sn ||∞ → ||f||∞ = || X fdP || e quindi vale la prima uguaglianza in (8.40). La disuguaglianza segue dalla propriet` a di supp(P ) come discusso nell’osservazione 8.28. (b). Usando (c) della proposizione 7.39, se 0 ≤ f ∈ Mb (X), esiste una successione di funzioni semplici {sn }n∈N , con 0 ≤ sn ≤ sn+1 ≤ f per ogni n, che converge uniformemente a f. Di conseguenza, tenendo conto della definizione dell’integrale rispetto a P e del uniforme implica fatto che la convergenza quella debole, otteniamo che (ψ| X sn dP ψ) → (ψ| fdP ψ) per n → +∞ per X ogni ψ ∈ H. Per avere la positivit` a di X fdP `e allora sufficiente provare che (ψ| X sn dP ψ) ≥ 0 per ogni n. Direttamente da (8.26) troviamo che:
(n) (n)
ψ sn dP ψ = ψ P (Ei ) ψ ≥ 0 , ci X
i∈In
(n)
dato che ogni proiettore ortogonale `e un operatore positivo ed i numeri ci sono non negativi, essendo sn ≥ 0. (c). Notiamo che, per (8.26), si ha:
μψ,φ (E) = ψ χE (x) dP (x)φ = (ψ|1 · P (E)φ) = (ψ|P (E)φ) , (8.42) X
ed `e (ψ|P (E)ψ) ≥ 0. Allora, la propriet` a definitoria (d) della misura a valori di proiezione data in definizione 8.21, unitamente alla continuit` a del prodotto scalare, implicano che μψ,φ `e una misura complessa sulla σ-algebra di Borel B(X) (vedi la definizione in (1) in esempi 2.58); inoltre, la stessa (d) unitamente alla (a) di definizione 8.21 implicano che, se ψ = φ, μψ `e una misura positiva sigma-additiva, finita, sulla σ-algebra di Borel B(X). Infine la (c) di definizione 8.21 comporta che μψ,φ (X) = (ψ|φ), e in particolare μψ (X) = (ψ|ψ) = ||ψ||2 . Dato che μψ e |μψ,φ| sono misure finite, l’integrale associato ad esse `e continuo nella norma || ||∞ su Mb (X). (Infatti, per ogni f ∈ Mb (X), vale:
f(x) dμψ,φ (x) ≤ |f(x)| d|μψ,φ(x)| ≤ ||f||∞ |μψ,φ|(X) ,
X
X
da cui segue la continuit` a dell’integrale nella norma dell’estremo superiore.) Se sn ∈ S(X), usando (8.42) e (8.26) si prova immediatamente che vale:
ψ sn (x) dP (x)φ = sn (x) dμψ,φ (x) . X
X
Se ora f ∈ Mb (X) e {sn }n∈N ⊂ S(X) converge a f per n → +∞ in senso uniforme (cfr. (b) proposizione 7.39), usando la continuit` a del prodotto scalare e la continuit` a dell’integrale associato a μψ,φ rispetto alla convergenza uniforme, si ha subito che:
ψ
f(x) dP (x)φ = ψ
lim sn (x) dP (x)φ X
n→+∞
X
8.3 Misure a Valori di Proiezione (PVM)
343
ψ
sn (x) dP (x)φ = lim = lim sn (x) dμψ,φ(x) n→+∞ n→+∞ X X = f(x) dμψ,φ (x) . X
Proviamo la (v). La tesi equivale a dire che X \ supp(μψ,φ) ⊃ X \ supp(P ). Sia x ∈ X \ supp(P ): allora esiste un aperto A ⊂ X tale che x ∈ A e P (A) = 0. Per isotonia P (B) = 0 se B(X) B ⊂ A. Di conseguenza:
μψ,φ (B) = χA (x) dP (x) = ψ
χB (x) dP (x)φ = (ψ|P (B)φ) = 0 . X
X
Dalla definizione di variazione totale (vedi (1) in esempi 2.58) |μψ,φ|(A) = 0, per cui x ∈ X \ supp(|μψ,φ |). Essendo poi |μψ,φ|(A) ≥ |μψ,φ(A)| per ogni A ∈ B(X), in particolare con A aperto, si ha: supp(μψ,φ ) ⊂ supp(|μψ,φ |). Il caso di μψ `e analogo. Questo completa la dimostrazione del teorema. Osservazioni 8.31. (1) Bisogna notare che se vogliamo che le misure positive μψ definite sulla σ-algebra di Borel di X, siano misure di Borel propriamente dette, bisogna anche richiedere che lo spazio X sia di Hausdorff e localmente compatto, per definizione di misura di Borel ([Rud82] e vedi l’Appendice). Nei casi concreti, per esempio lavorando con PVM che definiscono lo sviluppo spettrale di operatori, X `e sempre (un sottoinsieme di) R o R2 e pertanto queste ipotesi sono soddisfatte. ` utile osservare che la misura complessa μψ,φ si decompone nella combi(2) E nazione lineare complessa di 4 misure positive finite μχ . Essendo μψ,φ (E) = (ψ|P (E)φ) = (P (E)ψ|P (E)φ), dall’identit` a di polarizzazione (3.4), abbiamo: μψ,φ(E) = μψ+φ (E)−μψ−φ (E)−iμψ+iφ (E)+iμψ−iφ (E)
per ogni E ∈ B(X).
Il seguente teorema stabilisce la pi` u importante propriet` a delle misure a valori di proiezione: il fatto che diano luogo a ∗-omomorfismi di C ∗ -algebre. Tale ingrediente sar`a essenziale nel provare il teorema spettrale che dimostreremo subito dopo. Teorema 8.32. Siano H uno spazio di Hilbert, X uno spazio topologico a base numerabile e P : B(X) → B(H) una misura a valori di proiezione. Valgono i fatti seguenti. (a) L’operatore integrale: I : Mb (X) f → f(x)dP (x) ∈ B(H) X
a Mb (X) alla C ∗`e uno ∗-omomorfismo continuo dalla C ∗-algebra con unit` algebra con unit` a B(H). In altre parole, oltre a valere (8.40), valgono anche:
344
8 Teoria Spettrale I: operatori limitati
(i) se 1 denota la funzione costante con valore unitario su X, allora: 1 dP (x) = I , X
(ii) per ogni coppia f, g ∈ Mb (X) e per ogni α, β ∈ C: (αf(x) + βg(x)) dP (x) = α f(x)dP (x) + β g(x)dP (x) , X
X
X
(iii) per ogni coppia f, g ∈ Mb (X): f(x) dP (x) g(x) dP (x) = f(x)g(x) dP (x) , X
X
X
(iv) per ogni f ∈ Mb (X) vale:
∗ f(x) dP (x) = f(x)dP (x) . X
X
(b) Se ψ ∈ H e f ∈ Mb (X), allora vale:
2
f(x) dP (x)ψ
= |f(x)|2 dμψ (x) .
X
X
(c) Se {fn }n∈N ⊂ Mb (X) `e limitata e converge puntualmente a f : X → C, allora esiste l’integrale di f rispetto alla misura spettrale P e vale: f(x) dP (x) = s- lim fn (x) dP (x) . n→+∞
X
X
(d) Se X = R2 , dotato della topologia euclidea standard, e se supp(P ) `e limitato, allora, pensando σ(T ) come sottoinsieme di R2 , si ha: supp(P ) = σ(T ) ,
dove:
z dP (x, y) ,
T := supp(P )
essendo z la funzione R2 (x, y) → z := x + iy. Osservazioni 8.33. (1) La propriet` a (iii) di (a) implica, in particolare, la seguente propriet`a di commutazione di operatori: f(x) dP (x) g(x) dP (x) = g(x) dP (x) f(x) dP (x) , X
X
X
X
per ogni coppia f, g ∈ Mb (X). (2) Da (iv) e da (iii) di (a) segue che, per ogni f ∈ Mb (X), l’operatore f(x) dP (x) `e normale. X
8.3 Misure a Valori di Proiezione (PVM)
345
Prova del teorema 8.32. (a). Le uniche propriet` a non del tutto banali sono (iii) e (iv). Proviamo la prima. Scegliamo due successioni di funzioni semplici {sn } e {tm } che tendono uniformemente a f e g rispettivamente. Per computo diretto si verifica che sn (x) dP (x) tm (x) dP (x) = sn (x)tm (x) dP (x) . X
X
X
Per m fissato, essendo tm limitata, sn · tm tende uniformemente a f · tm per n → +∞. Tenendo conto della continuit` a (nel senso di (a) di teorema 8.30) e della linearit` a dell’integrale come funzione della funzione integranda e prendendo il limite per n → +∞ nell’identit` a di sopra, si ottiene: f(x) dP (x) tm (x) dP (x) = f(x)tm (x) dP (x) , X
X
X
dove si `e tenuto conto del fatto che la composizione di operatori limitati `e continua nei due argomenti. Con la stessa procedura, tenendo conto che f · tm tende uniformemente a f · g se m → +∞, si ottiene (iii). La propriet` a (iv) si verifica scegliendo una successione di funzioni semplici {sn } che tendono uniformemente a f. Per ψ, φ ∈ H, direttamente dalla definizione di integrale di una funzione semplice (tenendo conto che i proiettori ortogonali sono autoaggiunti), si verifica che:
sn (x) dP (x)ψ φ = ψ sn (x) dP (x)φ . X
X
Si osservi che sn → f uniformemente per n → +∞. Quindi, usando la continuit` a e la linearit` a dell’integrale come funzione della funzione integranda (nel senso di (a) di teorema 8.30), tenendo conto della continuit` a del prodotto scalare, e prendendo il limite per n → +∞ dell’identit` a di sopra, si ottiene:
f(x) dP (x)ψ φ = ψ f(x) dP (x)φ X
X
e quindi:
* X
f(x) dP (x) −
X
∗ +
ψ
φ = 0 . f(x) dP (x)
Dato che ψ, φ ∈ H sono arbitrari, si conclude che deve valere (iv). (b). Se ψ ∈ H, usando (iii) e (iv) di (a), si ha subito che vale:
2
f(x) dP (x)ψ
= ψ |f(x)|2 dP (x)ψ = |f(x)|2 dμψ (x) ,
X
X
X
dove, nell’ultima uguaglianza, abbiamo tenuto conto di (c) in teorema 8.30. (c). Per prima cosa notiamo che f ∈ Mb (X), dato che `e una funzione misurabile, essendo limite di funzioni misurabili, ed `e limitata dalla stessa costante
346
8 Teoria Spettrale I: operatori limitati
che limita la successione delle fn . Se ψ ∈ H, la linearit` a dell’integrale e (b) implicano immediatamente che:
2
f(x) dP (x) − fn (x) dP (x) ψ
= |f(x) − fn (x)|2 dμψ (x) .
X
X
X
La misura μψ `e finita, per cui le funzioni costanti sono integrabili. Per ipotesi, |fn | < K < +∞ per ogni n ∈ N, quindi |f| ≤ K e pertanto |fn − f|2 ≤ (|fn | + |f|)2 < 4K 2 . Dato che |fn − f|2 → 0 puntualmente, possiamo applicare il teorema della convergenza dominata, ottenendo che, per n → +∞,
!
f(x) dP (x)ψ − fn (x) dP (x)ψ
= |f(x) − fn (x)|2 dμψ (x) → 0 .
X
X
X
Data l’arbitrariet` a di ψ ∈ H, questo risultato prova (c). (d). Se supp(P ) `e limitato, dato che `e chiuso per definizione, sar` a compatto e su di esso ogni funzione continua sar` a limitata. L’applicazione R2 (x, y) → zχ (x, y) ∈ C `e dunque limitata, per cui T := supp(P ) z dP (x, y) := supp(P ) zχsupp(P ) (x, y) dP (x, y) `e ben definito ed `e un operatore normale in B(H) R2 e quindi, in particolare, il suo spettro residuo `e vuoto per (c) di proposizione 8.15. Per definizione di insieme risolvente, la tesi `e equivalente all’affermazione: C λ ∈ supp(P ) se e solo se λ ∈ ρ(T ). Proviamo che λ ∈ supp(P ) implica λ ∈ ρ(T ). Tenendo conto che R2 (x, y) → z = x + iy `e limitata su supp(P ), supponiamo che λ ∈ supp(P ). In tal caso c’`e un aperto di R2 , A (x0 , y0 ) con x0 + iy0 = λ, tale che P (A) = 0. Segue facilmente che (x, y) → (z−λ)−1 `e limitata sull’insieme chiuso supp(P ). Allora esiste l’operatore di B(H): 1 dP (x, y) . z − λ supp(P ) In virt` u di (iii) e (i) di (a), vale: 1 dP (x, y) (z − λ) dP (x, y) supp(P ) z − λ supp(P ) 1 = (z − λ) dP (x, y) dP (x, y) supp(P ) supp(P ) z − λ 1 dP (x, y) = 1 dP (x, y) = I , = supp(P )
R2
che pu` o essere scritto anche come, tenendo conto di (i) e (ii) di (a): 1 1 dP (x, y)(T − λI) = (T − λI) dP (x, y) = I . supp(P ) z − λ supp(P ) z − λ
8.3 Misure a Valori di Proiezione (PVM)
347
In altre parole, T − λI `e una biezione di H su H. Per (a) del teorema 8.4. Mostriamo ora che λ ∈ ρ(T ) implica che λ ∈ supp(P ). Per dimostrare questo fatto, proviamo la proposizione equivalente: λ ∈ supp(P ) implica λ ∈ σ(T ) = σp(T ) ∪ σc(T ). Se λ ∈ supp(P ), pu` o accadere che T −λI : H → H non sia iniettivo: in tal caso λ ∈ σp (T ) e la dimostrazione finisce. Supponiamo invece che T − λI : H → H sia iniettivo e mostriamo che l’operatore inverso (T − λI)−1 : Ran(T − λI) → H non pu` o essere limitato, per cui λ ∈ σc(T ). Per provare questo fatto, `e sufficiente mostrare che, se λ ∈ supp(P ), per ogni n = 1, 2, . . . esiste ψn ∈ H, con ψn = 0, tale che: ||(T − λI)ψn ||/||ψn|| ≤ 1/n . (Infatti, nelle nostre ipotesi, vale ψn = (T − λ)−1 φn per ogni n = 1, 2, . . ., con φn = 0 per avere ψn = 0. Allora si ha: 1/n ≥ ||(T − λI)ψn ||/||ψn|| = ||(T − λI)(T − λI)−1 φn ||/||(T − λI)−1 φn || . In altre parole, per ogni n = 1, 2, . . ., esiste φn ∈ H, con φn = 0, tale che: ||(T − λI)−1 φn || ≥n. ||φn|| Allora (T − λI)−1 non pu` o essere limitato e quindi λ ∈ σc (T ).) Se λ ∈ supp(P ), ogni aperto A λ deve soddisfare P (A) = 0. Posto x0 +iy0 := λ, consideriamo la classe di dischi aperti Dn ⊂ R2 , centrati in (x0 , y0 ) e di raggio 1/n, con n = 1, 2, . . .. Dato che P (Dn ) = 0, esister`a ψn = 0 tale che ψn ∈ P (Dn )(H). In tal caso, si ha: (T − λI)ψn = (z − λ) dP (x, y)ψn supp(P )
= supp(P )
(z − λ) dP (x, y)
supp(P )
χDn (z) dP (x, y)ψn ,
dove abbiamo tenuto conto di P (Dn ) = R2 χDn (z) dP (x, y) e di P (Dn )ψn = ψn . Usando (iii) di (a) del presente teorema, troviamo allora: (T − λI)ψn = χDn (z)(z − λ)dP (x, y) . R2
Quindi, dalla propriet` a (b), otteniamo: ||(T − λI)ψn ||2 = |χDn (z)|2 |z − λ|2 dμψn (x, y) ≤ R2
= n−2
R2
R2
1 dμψn (x, y) = n−2 ||ψn ||2 ,
1 · n−2 dμψn (x, y)
348
8 Teoria Spettrale I: operatori limitati
dove, nell’ultima uguaglianza, abbiamo usato il fatto che μψn (R2 ) = ||ψn ||2 per la (iii) di (c) in teorema 8.30. Estraendo le radici quadrate ad ambo i membri, si ha infine: ||(T − λI)ψn || ≤ 1/n . ||ψn|| Questo conclude la dimostrazione.
8.4 Teorema spettrale per operatori normali in B(H) Abbiamo accumulato un numero sufficiente di risultati da poter ora enunciare e provare il primo importante teorema di decomposizione spettrale per operatori normali in B(H). In questa sezione dimostreremo poi un’altra versione dello stesso teorema, che riguarda un’utile rappresentazione spettrale, degli operatori normali limitati T in termini di operatori moltiplicativi su spazi L2 opportuni, costruiti sullo spetto di T . Infine enunceremo e dimostreremo un notevole risultato tecnico noto come Teorema di Fuglede. 8.4.1 Teorema di decomposizione spettrale per operatori limitati normali Il teorema di decomposizione spettrale mostra come ogni operatore normale di B(H) si possa sempre costruire integrando una certa PVM, che ha supporto dato dallo spettro dell’operatore e che `e unicamente determinata dall’opera` importante osservare per le applicazioni, che il teorema `e valido, tore stesso. E in particolare, per operatori autoaggiunti in B(H) e per operatori unitari, che sono sottocasi di operatori normali. Teorema 8.34. (Teorema di decomposizione spettrale per operatori in B(H) normali.) Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Valgono i fatti seguenti. (a) Esiste, `e unica e limitata una misura a valori di proiezione P (T ) su R2 (dotato della topologia standard) tale che: T = z dP (T ) (x, y) , (8.43) supp(P (T ) )
dove z `e la funzione R2 (x, y) → z := x + iy ∈ C. (a)’ Se T `e autoaggiunto oppure unitario, l’enunciato (a) si pu` o precisare ulteriormente sostituendo R2 , rispettivamente, con R oppure con S1 := {(x, y) ∈ R2 | x2 + y2 = 1} . (b) Vale:
supp(P (T ) ) = σ(T ) .
8.4 Teorema spettrale per operatori normali in B(H)
349
In particolare, per λ = x + iy ∈ C (rispettivamente λ = x ∈ R, oppure λ = x + iy ∈ S1 ) valgono i seguenti fatti: (i) λ ∈ σp (T ) se e solo se P (T )({λ}) = 0, (ii) λ ∈ σc (T ) se e solo se P (T ) ({λ}) = 0 e, per ogni aperto Aλ ⊂ R2 (rispettivamente, R oppure S1 ) con Aλ λ, `e P (T )(Aλ ) = 0, (iii) se λ ∈ σ(T ) `e un punto isolato, allora λ ∈ σp (T ), (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ H con ||φ|| = 1 e 0 < ||T φ − λφ || ≤ . (c) Se f ∈ Mb (σ(T )), l’operatore σ(T ) f(x, y) dP (T )(x, y) commuta con tutti gli operatori di B(H) che commutano con T e T ∗ . Osservazione 8.35. La propriet` a (iv) di (b) afferma in pratica che, se λ ∈ σc(T ), bench´e non esistano autovettori di T con λ come autovalore (dato che lo spettro continuo e quello discreto sono disgiunti), possiamo comunque costruire vettori che risolvono l’equazione degli autovalori con approssimazione arbitrariamente buona. Prova del teorema 8.34. (a), (a)’ e (c). Unicit` a. Dimostriamo prima di tutto l’unicit` a della misura spettrale. Prima di tutto si noti che se una misura spettrale P soddisfa (8.43) deve avere supporto limitato, dato che la funzione z non `e limitata su insiemi non limitati ed il secondo membro di (8.43) deve quindi intendersi nel senso di (c) della definizione 8.27. Siano dunque P e P misure a valori di proiezione con supporto limitato (e quindi compatto, essendo supp(P ) chiuso in R2 per definizione) e tali che: T = z dP (x, y) = z dP (x, y) . (8.44) supp(P )
supp(P )
Da tale relazione, usando (i), (ii), (iii) e (iv) di (a) nel teorema 8.32, segue che, per ogni polinomio p = p(z, z), vale: p(T, T ∗ ) = p(x + iy, x − iy) dP (x, y) supp(P )
= supp(P )
p(x + iy, x − iy) dP (x, y) ,
u ovvio, ossia traducendo la dove il polinomio p(T, T ∗ ) `e definito nel modo pi` moltiplicazione nella composizione di operatori e ponendo T 0 := I e (T ∗ )0 := I. Se u, v ∈ H sono arbitrari, per ogni polinomio complesso p = p(z, z) su R2 , avremo allora che:
p(z, z) dμu,v (x, y) = u p(z, z) dP (x, y)v
supp(P ) supp(μu,v )
350
8 Teoria Spettrale I: operatori limitati
= u p(z, z) dP (x, y)v = p(z, z) dμu,v (x, y) .
supp(P ) supp(μu,v ) Le due misure complesse μu,v e μu,v sono quelle introdotte in (c) del teorema 8.30 (con u e v sostituiti da ψ e φ.) supp(μu,v ) e supp(μu,v ) sono compatti di R2 (per (v) di (c) in teorema 8.30), e pertanto esiste un compatto K ⊂ R2 che include entrambi i supporti. Estendiamo in modo ovvio le due misure su K senza alterarne il supporto, definendo la misura di un boreliano E di K come μu,v (E ∩ supp(μu,v )) e la stessa cosa per la misura rispetto a μu,v . Dato che i polinomi in z, z a coefficienti complessi individuano biunivocamente tutti i polinomi complessi q(x, y) nelle variabili reali x, y (tramite la solita sostituzione z := x + iy e z := x − iy per cui p(x + iy, x − iy) = q(x, y)), possiamo riscrivere le identit`a di sopra in termini di polinomi, a coefficienti complessi, nelle variabili reali (x, y) ∈ K: p(x + iy, x − iy) dμu,v (x, y) = p(x + iy, x − iy) dμu,v (x, y) . K
K
Per il teorema 2.40 di Stone-Weierstrass, l’algebra dei polinomi complessi q(x, y) `e densa rispetto alla norma dell’estremo superiore nello spazio C(K). Concludiamo che l’algebra dei polinomi complessi della forma p(x + iy, x − iy) ristretti al compatto K `e densa, nella norma dell’estremo superiore, nello spazio C(K). Dato che gli integrali rispetto a misure complesse sono funzionali continui nella norma dell’estremo superiore, deve valere: f(x, y) dμu,v (x, y) = f(x, y) dμu,v (x, y) per ogni f ∈ C(K) . K
K
Il teorema 2.62 di Riesz per le misure complesse assicura che le due misure estese a K devono coincidere. Di conseguenza, le misure non ancora estese a K devono avere lo stesso supporto e coincidere. Quindi, usando (iv) in (c) del teorema 8.30, abbiamo che, per ogni coppia di vettori u, v ∈ H e per ogni funzione misurabile g limitata su R2 , vale:
u g(x, y) dP (x, y)v = u g(x, y) dP (x, y)v ,
supp(P )
supp(P ) cio`e:
u
g(x, y) dP (x, y)v
R2
e quindi:
= u
g(x, y) dP (x, y)v
,
R2
g(x, y) dP (x, y) = R2
g(x, y) dP (x, y) ,
R2
per l’arbitrariet` a di u e v. Se E `e un arbitrario boreliano di R2 e si sceglie
8.4 Teorema spettrale per operatori normali in B(H)
351
g = χE , l’identit` a di sopra implica infine che: P (E) = R2
χE (x, y) dP (x, y) =
R2
χE (x, y) dP (x, y) = P (E) .
Questo prova che P = P . Inoltre osserviamo che, in virt` u di (8.44) e di (d) in teorema 8.32, si ha supp(P (T )) = σ(T ). L’unicit` a per i casi presentati in (a)’ `e conseguenza di quanto appena provato, del fatto che supp(P (T ) ) = σ(T ) e di (a) (i) e (b) (i) in proposizione 8.15. Esistenza. Passiamo a provare l’esistenza della misura spettrale P (T ). Divideremo la dimostrazione in due casi: il caso in cui T `e autoaggiunto, ed il caso in cui T non lo `e. T associato a T coCaso di T autoaggiunto. Si consideri lo ∗ -omomorfismo Φ me nel teorema 8.18. Se E `e un boreliano di R, definiamo E := E ∩ σ(T ) T (χE ). E ` chiaro che P (T ) (E) `e idempotente, essendo e quindi: P (T )(E) := Φ T un omomorfismo e valendo χE · χE = χE . Inoltre, la propriet` a (vi) di Φ (b) in teorema 8.18 ed il fatto che le funzioni caratteristiche sono positive implicano che P (T ) (E) ≥ 0 e quindi P (T ) (E) `e anche autoaggiunto. In definitiva ogni P (T ) (E) `e un proiettore ortogonale. Si verifica immediatamente che B(R) E → P (T )(E) `e una misura a valori di proiezione: P (T )(E) ≥ 0 come provato sopra; (b) di definizione 8.21 segue dal fatto che χE · χF = χE ∩F T `e omomorfismo; la propriet` e dal fatto che Φ a (c) di definizione 8.21 segue T (χσ(T ) ) = I, valida per definizione di omomorfismo immediatamente da Φ di algebre con unit` a (cfr. (a) del teorema 8.18); infine, la propriet` a (d) della definizione 8.21 segue da (v) di (b) in teorema 8.21, tenendo conto del fatto N che, puntualmente, limN→+∞ n=0 χEn = χ∪n∈N En quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T )) `e limitato in quanto supp(P (T )) ⊂ σ(T ), il secondo dei quali `e compatto per (c) del teorema 8.4. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della linearit` a dell’operatore integrale associato a P (T ) e della linearit` a di ΦT , segue immediatamente che: T (s σ(T ) ) = Φ
s(x) dP (T )(x) ,
supp(P (T ) )
per ogni funzione semplice s : R → C. Dato che entrambi i funzionali sono continui rispetto alla topologia dell’estremo superiore (ii) in (b) di teorema 8.18 e (a) di teorema 8.30, applicando la proposizione 7.39 si ha che: T (f σ(T ) ) = Φ
supp(P (T ) )
f(x) dP (T ) (x) ,
(8.45)
352
8 Teoria Spettrale I: operatori limitati
per ogni funzione f : R → C misurabile e limitata. In particolare, quindi, per (i) in (a) del teorema 8.18: T = x dP (T )(x) . supp(P (T ) )
Riguardo alla prova di (c), si osservi che (8.45) mostra anche che A ∈ B(H) commuta con supp(P (T ) ) f(x, y) dP (T ) (x, y) se A commuta con T , perch´e, sotT (f σ(T ) ) come conseguenza di (iii) in to le ipotesi dette, A commuta con Φ (b) di teorema 8.18. Caso di T normale non autoaggiunto. Decomponiamo T come in (8.9) mediante gli operatori X, Y ∈ B(H) autoaggiunti e commutanti, definiti in (8.10). Siano P (X) e P (Y ) le misure spettrali limitate definite su R, associate rispettivamente a X e Y secondo la prima parte di questa dimostrazione. Si osservi che risulta P (X) (E)P (Y ) (F ) = P (Y ) (F )P (X)(E) per ogni coppia di boreliani E, F ⊂ R. Infatti, per (8.45), vale: X (χE ) = P (X) (E) = Φ χE (x) dP (X)(x) . R
Il secondo membro commuta con tutti gli operatori di B(H) che commutano con X (per (iii) di (b) del teorema 8.18), pertanto P (X) (E)Y = Y P (X) (E) per ogni boreliano E ⊂ R. Con lo stesso ragionamento abbiamo allora che i proiettori P (Y ) (F ) (F ∈ B(R)) associati a Y , commutando con tutti gli operatori che commutano con Y , dovranno commutare con P (X) (E). In definitiva, tutti gli operatori: P (E × F ) := P (X) (E)P (Y ) (F ) , con E, F boreliani di R, sono a loro volta proiettori ortogonali. Da (8.10) segue immediatamente (ricordando anche che ||T ∗|| = ||T ||) che valgono le disuguaglianze ||X|| ≤ ||T || e ||Y || ≤ ||T ||. Dato che supp(P (X) ) = σ(X), supp(P (Y ) ) = σ(Y ), per (c) del teorema 8.4 i supporti delle misure P (X) e P (Y ) saranno contenuti nel segmento [−||T ||, ||T ||]. Nel seguito della dimostrazione, K denoter`a il compatto di R2 definito come: K := [−||T ||, ||T ||] × [−||T ||, ||T ||] . D’ora in poi, una funzione a gradini su K sar`a una funzione g : K → C esprimibile come: g(x, y) := gij χEi ×Fj , (8.46) (i,j)∈L
dove L `e un insieme finito di indici, gij ∈ C e Ei , Fj ⊂ K sono boreliani K tali che: (Ei × Fj ) ∩ (Er × Fs ) = ∅ se (i, j) = (r, s) . G(K) indicher` a lo spazio vettoriale su C delle funzioni a gradini. G(K) ha la struttura di una ∗ -algebra con unit` a, che `e sotto ∗ -algebra con unit` a di Mb (K).
8.4 Teorema spettrale per operatori normali in B(H)
353
Infatti: G(K) contiene solo funzioni misurabili limitate, `e chiusa rispetto alla combinazione lineare di funzioni, `e chiusa rispetto al prodotto punto per punto, `e chiusa rispetto alla coniugazione complessa e contiene la funzione che vale costantemente 1. Definiamo l’operatore lineare Ψ0 : G(K) → B(H): Ψ0 (g) := gij P (Ei × Fj ) . (8.47) (i,j)∈L
Si verifica facilmente che, se la stessa funzione a gradini g ammette due differenti rappresentazioni del tipo (8.46), il valore di Ψ0 (g) `e il medesimo quando valutato sulle due differenti rappresentazioni. Ψ0 : G(K) → B(H) `e uno ∗ -omomorfismo di algebre con unit`a, in quanto per costruzione `e lineare, trasforma i prodotti di funzioni a gradini in prodotti di operatori, trasforma la coniugazione complessa nella coniugazione hermitiana ed associa alla funzione costante di valore unitario l’operatore identit` a. Esattamente lo stesso procedimento con cui abbiamo dimostrato, prima di enunciare la definizione 8.27, che l’integrale delle funzioni semplici secondo una misura spettrale `e una funzione continua dell’integrando rispetto alla norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)), prova che Ψ0 : G(K) → B(H) `e continua nella norma || ||∞ (e rispetto alla norma della topologia uniforme in B(H)). In particolare vale: ||Ψ0 (g)|| ≤ ||g||∞ . Infine, se A ∈ B(H) commuta con T e T ∗ , allora commuter`a con le loro combinazioni lineari e quindi, in particolare, con X e Y . Ma allora, ripetendo la dimostrazione gi` a fatta sopra per la commutativit` a dei proiettori delle misure spettrali di X e Y , si prova che A commuta con i proiettori ortogonali della misura spettrale di X e con quelli della misura spettrale di Y . Di conseguenza, se A commuta con T e T ∗ , commuter`a anche con Ψ0 (g) per ogni g ∈ G(K). Passiamo ad estendere Ψ0 alle funzioni continue. Il cosiddetto “teorema dell’oscillazione limitata” dell’analisi elementare assicura che possiamo approssimare arbitrariamente, nella norma dell’estremo superiore, funzioni reali continue su K con funzioni reali a gradini su K; decomponendo le funzioni complesse in parte reale ed immaginaria, il risultato si generalizza a funzioni a valori complessi. In altre parole, G(K) `e denso in C(K) nella norma || ||∞. Usando la proposizione 2.57, possiamo estendere in modo unico Ψ0 : G(K) → B(H) ad uno ∗ -omomorfismo continuo di C ∗ -algebre ΨT : C(K) → B(H) che soddisfa: ||ΨT (f)|| ≤ ||f||∞ ,
per ogni f ∈ C(K)
(8.48)
e tale che ΨT (f)A = AΨT (f) per ogni f ∈ C(K) e ogni A ∈ B(H) che commuta con T e T ∗ . Per costruzione, tale ∗ -omomorfismo gode delle propriet` a: ΨT (x) = X , ΨT (y) = Y , ΨT (x + iy) = T ,
(8.49) (8.50) (8.51)
354
8 Teoria Spettrale I: operatori limitati
dove x, y, x + iy indicano le funzioni su K definite rispettivamente come ` chiaro che la terza propriet` (x, y) → x, (x, y) → y, (x, y) → x + iy. E a segue per linearit` a dalle prime due. La prima identit` a si prova come segue. Sia {sn }n∈N una successione di funzioni semplici su [−||T ||, ||T ||] che converge uniformemente alla funzione x ristretta a tale intervallo (tale successione esiste per (b) di proposizione 7.39). Possiamo definire la successione di funzioni a gradini su K, {gn }n∈N, come gn (x, y) := sn (x) per ogni n ∈ N. Tale successione tende ovviamente alla funzione (x, y) → x su K nella topologia della norma dell’estremo superiore. Si verifica subito che, per costruzione, vale: sn dP (X) (x) = Ψ0 (gn ) . [−||T ||,||T ||]
Prendendo il limite per n → +∞ della relazione precedente, il secondo membro tende a ΨT (x) e il primo membro tende a (si tenga conto che supp(P (X) ) = σ(X) ⊂ [−||T ||, ||T ||]) x dP (X) (x) = x dP (X)(x) = X , [−||T ||,||T ||]
supp(P (X) )
per la continuit` a dell’operatore integrale e per il punto (a), gi` a dimostrato, di questo teorema. Abbiamo in tal modo provato che vale (8.49). Con una dimostrazione analoga si prova (8.50), e quindi (8.51) segue per linearit` a. Usando la stessa dimostrazione del teorema 8.18, possiamo infine univocamente estendere ΨT : C(K) → B(H) ad uno ∗ -omomorfismo di C ∗ -algebre a scritte ΨT : Mb (K) → B(H), che soddisfa (8.51) e gode di tutte le propriet` in (b) del teorema 8.18, con la differenza che si deve rimpiazzare ovunque σ(T ) con K e ΦT con ΨT (che, al contrario del primo, in generale non `e isometrico) e rafforzando l’ipotesi in (iii) richiedendo che A commuti anche con T ∗ , oltre che con T . A questo punto la dimostrazione procede come nel caso di T autoaggiunto. Definiamo E := E ∩ K, dove E ⊂ R2 `e un qualsiasi boreliano. Quindi po` chiaro che P (T ) (E) `e idempotente, essendo niamo: P (T )(E) := ΨT (χE ). E a (vi) di ΨT un omomorfismo e valendo χE · χE = χE . Inoltre, la propriet` (b) in teorema 8.18, che, come detto sopra, vale anche per ΨT , unitamente al fatto che le funzioni caratteristiche sono positive, implica che P (T )(E) ≥ 0, e quindi P (T ) (E) `e anche autoaggiunto. In definitiva ogni P (T )(E) `e un proiettore ortogonale. Si verifica immediatamente che B(R2 ) E → P (T )(E) `e una misura a valori di proiezione: P (T )(E) ≥ 0 come provato sopra; (b) di definizione 8.3 segue dal fatto che χE · χF = χE ∩F e dal fatto che ΨT `e omomorfismo; la propriet` a (c) di definizione 8.21 segue immediatamente da ΨT (χK ) = 1; infine, la propriet` a (d) della definizione 8.21 segue da (v) di (b) in teorema 8.18, che, come detto sopra, N vale anche per ΨT , tenendo conto del fatto che, puntualmente, limN→+∞ n=0 χEn = χ∪n∈N En quando gli insiemi En sono disgiunti a due a due. Osserviamo che, per costruzione, supp(P (T ) )
8.4 Teorema spettrale per operatori normali in B(H)
355
`e limitato, in quanto supp(P (T )) ⊂ K, il secondo dei quali `e compatto per costruzione. Per proseguire con la dimostrazione, notiamo che, da quanto appena provato, tenendo conto della linearit` a di ΨT , segue immediatamente che: ΨT (s K ) = s(x, y) dP (T )(x, y) , R2
per ogni funzione semplice s : R2 → C. Dato che entrambi i funzionali sono continui rispetto alla topologia dell’estremo superiore ((ii) in (b) di teorema 8.18, valido anche per ΨT , e (a) di teorema 8.30), applicando la (b) di proposizione 7.39 si ha che: ΨT (f K ) = f(x, y) dP (T )(x, y) , (8.52) R2
per ogni funzione f : R2 → C misurabile e limitata. In particolare, quindi, per (8.51) si ha: T = (x + iy) dP (T )(x, y) . supp(P (T ) )
Si osservi che (8.52) mostra anche che A ∈ B(H) commuta con R2 f(x, y) dP (T )(x, y) se A commuta con T e T ∗ , perch´e, sotto le nostre ipotesi, A commuta con ΨT (f K ), come detto sopra. Quindi anche la dimostrazione di (c) `e conclusa. (b). Facciamo la dimostrazione per il caso generico in cui T non sia autoaggiunto e nemmeno unitario; la dimostrazione si specializza facilmente a tali casi. Il fatto che supp(P (T ) ) = σ(T ) `e immediata conseguenza di (d) del teorema 8.32. Proviamo (i). Scriveremo P in luogo di P (T ) per semplicit`a notazionale. Sia λ := x0 + iy0 un complesso arbitrario. Tenendo conto di (iii) di (a) in teorema 8.32, vale: T P ({(x0 , y0 )}) = (x + iy)χ{(x0 ,y0 )} (x, y) dP (x, y) σ(T )
=
σ(T )
=λ σ(T )
(x0 + iy0 )χ{(x0 ,y0 )} (x, y) dP (x, y)
χ{(x0 ,y0 )} (x, y) dP (x, y) = λP ({(x0 , y0 )}) .
In definitiva: T P ({(x0 , y0 )}) = λP ({(x0 , y0 )}) . Concludiamo che, se P ({(x0 , y0 )}) = 0, allora λ := x0 + iy0 `e autovalore per T , dato che un qualsiasi vettore u = 0 appartenente al sottospazio su cui proietta P ({(x0 , y0 )}) `e un autovettore con autovalore λ.
356
8 Teoria Spettrale I: operatori limitati
Supponiamo viceversa che T u = λu con u = 0 e λ := x0 + iy0 . Allora (cfr. (b) m di (i) in proposizione 3.49) T ∗ u = λu, T n (T ∗ )m u = λn λ u e, per linearit` a, p(T, T ∗ )u = p(x + iy, x − iy) dP (x, y)u = p(λ, λ)u (8.53) supp(P )
per ogni polinomio p = p(x + iy, x − iy), dove abbiamo usato il fatto che l’integrale definisce uno ∗ -omomorfismo. Ogni polinomio p = p(x + iy, x − iy) `e anche un polinomio complesso q = q(x, y) nelle variabili reali x e y, definendo punto per punto q(x, y) := p(x + iy, x − iy) e tale corrispondenza `e biunivoca. Dato che con i polinomi q(x, y) possiamo approssimare a piacimento le funzioni continue f(x, y) nella norma dell’estremo superiore, la seconda uguaglianza in (8.53) varr` a anche se, al posto del polinomio p(x + iy, x − iy) = q(x, y), si ` facile provare che, se λ = considera una funzione continua f = f(x, y). E x0 + iy0 , allora χ{(x0 ,y0 )} `e il limite puntuale di una successione limitata di funzioni continue fn . In definitiva, usando (c) di teorema 8.30 ed il teorema della convergenza dominata (tenendo conto che μu `e finita), vale:
χ (x, y)dP (x, y) u (u|P{(x0 ,y0)} u) = u
supp(P ) {(x0 ,y0 )}
= supp(P )
χ{(x0 ,y0 )} (x, y)dμu (x, y) = lim
n→+∞
supp(P )
fn (x, y)dμu (x, y)
u fn (x, y)dP (x, y) u = lim (u|fn (x0 , y0 )u) = lim n→+∞ n→+∞
supp(P ) = χ{(x0 ,y0 )} (x0 , y0 )(u|u) . Pertanto, tenendo conto del fatto che i proiettori ortogonali sono idempotenti ed autoaggiunti e che χ{(x0 ,y0 )} (x0 , y0 ) = 1 per definizione, si ha: (P{(x0 ,y0 )} u|P{(x0,y0)} u) = (u|u) = 0 . Questo prova che P{(x0 ,y0 )} = 0. Passiamo a provare (ii). Dato che σc(T ) ∪ σp (T ) = σ(T ) (per (i) di (c) in proposizione 8.15) e σc(T ) ∩ σp (T ) = ∅ per definizione, deve essere che λ ∈ σc(T ) se e solo se λ ∈ σ(T ) e λ ∈ σp (T ). Dato che supp(P (T ) ) = σ(T ), l’affermazione che λ ∈ σ(T ), equivale a dire che, per ogni aperto A di R2 che contiene (x0 , y0 ) con x0 + iy0 = λ, deve essere P (A) = 0. D’altra parte, per (i), λ ∈ σp (T ) significa P (T ) ({(x0 , y0 )}) = 0. Proviamo (iii). Se λ = x0 + iy0 ∈ C `e un punto isolato di σ(T ), allora, per definizione, c’`e un aperto A {(x0 , y0 )} che non interseca la parte rimanente di σ(T ). Se fosse P ({(x0 , y0 )}) = 0 non potrebbe essere λ ∈ supp(P (T ) ), valendo in tal caso P (A) = 0. Di conseguenza deve necessariamente essere P (T )({(x0 , y0 )}) = 0. Per (i) deve allora valere che λ ∈ σp (T ).
8.4 Teorema spettrale per operatori normali in B(H)
357
La prova di (iv) `e stata data nella dimostrazione di (d) del teorema 8.32, in cui abbiamo provato, tra le altre cose, che se λ ∈ σc(T ), allora, per ogni n > 0 naturale, esiste ψn ∈ H con ||ψn || = 0 e 0 < ||T ψn − λψn ||/||ψn|| ≤ 1/n. Per provare (iv) `e allora sufficiente definire φn := ψn /||ψn || con n tale che 1 ≤ n per il valore di fissato. 8.4.2 Teorema di rappresentazione spettrale per operatori normali in B(H) e teorema di Fuglede Il prossimo importante teorema fornisce una rappresentazione spettrale di ogni operatore normale di B(H), mostrando che, di fatto, ogni operatore normale limitato pu` o essere visto come un operatore moltiplicativo quando lo si rappresenta in un opportuno spazio L2 . Definizione 8.36. Se H `e uno spazio di Hilbert e {Hα }α∈A `e una famiglia, di cardinalit` a arbitraria, di suoi sottospazi chiusi, scriveremo H = ⊕α∈A Hα e diremo che H `e somma diretta hilbertiana dei sottospazi Hα , se i sottospazi Hα sono a due a due ortogonali e vale H = < {Hα }α∈A >. Osservazione 8.37. In riferimento alla decomposizione ortogonale H = ⊕α∈A Hα nel senso appena definito, lasciamo al lettore la semplice dimostrazione delle seguenti identit`a. Esse derivano dal fatto che l’unione di basi hilbertiane, scelte in ogni Hα , `e una base hilbertiana per H. Per ogni vettore ψ ∈ H vale (nel senso della definizione 3.20) ||ψ||2 = ||Pα ψ||2 (8.54) α∈A
dove Pα `e il proiettore ortogonale su Hα , per ogni α ∈ A. Vale anche (tenendo conto del lemma 3.26) ψ= Pα ψ (8.55) α∈A
dove la serie pu` o essere riordinata a piacimento. La somma si intende come una serie o una somma finita dato che solo una quantit`a al pi` u numerabile di vettori Pα ψ `e non nulla ((b) proposizione 3.22). Teorema 8.38. (Teorema di rappresentazione spettrale per operatori in B(H) normali.) Siano H spazio di Hilbert e T ∈ B(H) operatore normale. Sia P (T ) la misura spettrale associata a T secondo (a) (o (a)’) del teorema 8.34. ` possibile decomporre H come una somma diretta hilbertiana H = (a) E ⊕α∈A Hα (con A al pi` u numerabile se H `e separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le propriet` a seguenti: (i) per ogni α ∈ A, valgono T Hα ⊂ Hα e T ∗ Hα ⊂ Hα , (ii) per ogni α ∈ A esiste una misura di Borel positiva finita μα , sullo spettro σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ),
358
8 Teoria Spettrale I: operatori limitati
tali che, se f ∈ Mb (σ(T )), Uα
f(x, y)dP
(T )
Hα Uα−1 = f· ,
(x, y)
σ(T )
in particolare valgono: Uα T Hα Uα−1 = (x + iy)· ,
Uα T ∗ Hα Uα−1 = (x − iy)·
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): (f · g)(x, y) = f(x, y)g(x, y) quasi ovunque su σ(T ) se g ∈ L2 (σ(T ), μα ) , (ii)’ se T `e autoaggiunto oppure unitario, per ogni α ∈ A esiste una misura di Borel positiva finita, sui boreliani di σ(T ) ⊂ R oppure, rispettivamente σ(T ) ⊂ S1 , ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ), tali che, se f ∈ Mb (σ(T )), Uα in particolare,
f(x)dP (T )(x)
σ(T )
Hα Uα−1 = f· ,
Uα T Hα Uα−1 = x· ,
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): per ogni g ∈ L2 (σ(T ), μα ), (f · g)(x) = f(x)g(x) quasi ovunque su σ(T ) . (b) Vale σ(T ) = supp{μα }α∈A , dove supp{μα }α∈A `e il complemento dell’insieme dei numeri λ ∈ C (rispettivamente R, S1 ) per cui esiste un aperto Aλ ⊂ C (rispettivamente R, S1 ) tale che Aλ λ e μα (Aλ ) = 0 per ogni α ∈ A. (c) Se H `e separabile, esistono uno spazio con misura (MT , ΣT , μT ), dove vale μT (MT ) < +∞, una funzione limitata FT : MT → C (e rispettivamente R oppure S1 a seconda che T sia autoaggiunto oppure unitario), un operatore unitario UT : H → L2 (MT , μT ), tali che: UT T UT−1 f (m) = FT (m)f(m) , UT T ∗ UT−1 f (m) = FT (m)f(m) per ogni f ∈ H.
(8.56)
Dimostrazione. (a) Dimostriamo (i), (ii) e (iii). La prova per (ii)’ `e analoga a quella per (ii). Supponiamo inizialmente che esista un vettore ψ ∈ H tale che il sottospazio vettoriale Hψ contenente i vettori di H del tipo σ(T ) g(x, y) dP (T )(x, y)ψ, con
8.4 Teorema spettrale per operatori normali in B(H)
359
g ∈ Mb (σ(T )) sia denso in H. Se μψ `e la misura spettrale associata a ψ, che dunque `e una misura finita perch´e: dμψ = ||ψ||2 ; supp(P (T ) )
deve risultare supp(μψ ) ⊂ supp(P (T ) ) per (iv) di (c) del teorema 8.30. Consideriamo lo spazio di Hilbert L2 (σ(T ), μψ ) e l’operatore lineare suriettivo g(x, y) dP (T )(x, y)ψ ∈ Hψ . Vψ : Mb (σ(T )) g → σ(T )
Dato che μψ `e finita, Mb (σ(T )) ⊂ L2 (σ(T ), μψ ) come sottospazio. Tenuto conto di ci` o risulta che, per ogni coppia g1 , g2 ∈ Mb (σ(T )): g1 (x, y)g2 (x, y) dμψ (x, y) σ(T )
= σ(T )
g1 (x, y) dP
(T )
(T ) (x, y)ψ g2 (x, y) dP (x, y)ψ ,
σ(T )
che equivale a scrivere: g1 (x, y)g2 (x, y) dμψ (x, y) = (Vψ g1 |Vψ g2 ) .
(8.57)
(8.58)
σ(T )
La dimostrazione di (8.57) si ottiene notando che, se E, E ⊂ σ(T ) sono boreliani, usando (iv) di (c) di teorema 8.30, (iii) di (a) di teorema 8.32 e (iv) di (a) di teorema 8.32, si ha:
(T ) χE χE dμψ = χE∩E dμψ = ψ χE∩E dP ψ =
σ(T ) σ(T ) σ(T )
(T ) (T ) (T ) χE χE dP ψ = ψ χE dP χE dP ψ ψ
σ(T )
σ(T ) σ(T )
(T ) (T ) χE dP ψ χE dP ψ ; =
σ(T ) σ(T ) per linearit` a (ed anti linearit` a) del prodotto scalare e dell’integrale, se s e t sono funzioni semplici, dovr` a ancora valere:
(T ) (T ) st dμψ = s dP ψ t dP ψ .
σ(T ) σ(T ) σ(T ) Tenendo conto della proposizione 7.39, usando la definizione di integrale di una funzione misurabile limitata secondo una misura spettrale, il teorema della
360
8 Teoria Spettrale I: operatori limitati
convergenza dominata rispetto alla misura finita μψ ed infine la continuit` a del prodotto scalare, l’identit` a appena provata implica (8.57). Abbiamo provato che Vψ `e un’isometria suriettiva da Mb (σ(T )) a Hψ . Si osservi che Mb (σ(T )) `e denso in L2 (σ(T ), μψ ) in quanto, se g ∈ L2 (σ(T ), μψ ), le funzioni gn := χEn ·g, con: En := {(x, y) ∈ σ(T ) | |g(x, y)| < n} sono in Mb (σ(T )) e gn → g nel senso di L2 (σ(T ), μψ ), per il teorema della convergenza dominata (essendo |gn − g|2 → 0, per n → +∞, puntualmente e valendo |gn − g|2 ≤ 2|g|2 ∈ L1 (σ(T ), μψ )). Possiamo quindi estendere unicamente Vψ ad un operatore isometrico suriettivo Vψ : L2 (σ(T ), μψ ) → Hψ , il cui inverso sar` a indicato con Uψ . Nelle ipotesi fatte Hψ = H. Se f ∈ Mb (σ(T )), direttamente da (8.57) e facendo uso di (iii) in (a) di teorema 8.32, abbiamo che: σ(T )
g1 (x, y)f (x, y)g2 (x, y) dμψ (x, y)
(T ) g1 (x, y) dP (x, y)ψ f (x, y)g2 (x, y) dP (x, y)ψ = σ(T ) σ(T ) = g1 (x, y) dP (T ) (x, y)ψ f (x, y) dP (T ) (x, y) g2 (x, y) dP (T ) (x, y)ψ σ(T ) σ(T ) σ(T ) (T ) = Vψ g1 f (x, y) dP (x, y)Vψ g2 . σ(T )
(T )
Abbiamo quindi provato che, per ogni terna di funzioni g1 , g2 , f ∈ Mb (σ(T )), vale: g1 (x, y)f(x, y)g2 (x, y) dμψ (x, y) σ(T )
=
(T ) Vψ g1 f(x, y) dP (x, y)Vψ g2 .
σ(T )
L’operatore f· : L2 (σ(T ), μψ ) → L2 (σ(T ), μψ ), moltiplicativo per la funzione f ∈ Mb (σ(T )), `e limitato come `e facile provare; di conseguenza, tenendo conto che Mb (σ(T )) `e denso in L2 (σ(T ), μψ ), della definizione di Uψ , del fatto che: f(x, y) dP (T )(x, y) σ(T )
`e limitato e, infine, della continuit` a del prodotto scalare, abbiamo che: g1 (x, y)f(x, y)g2 (x, y) dμψ (x, y) σ(T )
=
Uψ−1 g1
f(x, y) dP
σ(T )
(T )
(x, y)Uψ−1 g2
,
8.4 Teorema spettrale per operatori normali in B(H)
per ogni coppia di funzioni g1 , g2 ∈ L2 (σ(T ), μψ ). In altre parole: Uψ f(x, y) dP (T )(x, y)Uψ−1 = f · .
361
(8.59)
σ(T )
Passiamo a considerare il caso in cui non esista alcun vettore ψ con Hψ = H. In tal caso, sia ψ un vettore arbitrario in H. Denotiamo con Hψ lo spazio vettoriale dei vettori σ(T ) f(x, y) dP (T )(x, y)ψ per ogni f ∈ Mb (σ(T )). Vale T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ , infatti, per ogni f ∈ Mb (σ(T )), si ha ((a) teorema 8.34 e (iii) in (a) di teorema 8.32): (T ) (T ) T f(x, y) dP ψ = (x + iy) dP f(x, y) dP (T )ψ σ(T )
σ(T )
=
σ(T )
(x + iy)f(x, y) dP (T ) ψ ,
σ(T )
(x + per cui T σ(T ) f(x, y) dP (T )ψ ∈ Hψ dato che la funzione (x, y) → iy)f(x, y) `e un elemento di Mb (σ(T ))). La dimostrazione per T ∗ `e analoga, usando il fatto che: T∗ = (x − iy) dP (T ) . σ(T )
Per continuit` a, vale anche T (Hψ ) ⊂ Hψ e T ∗ (Hψ ) ⊂ Hψ . Definendo Uψ come fatto sopra, vale la (8.59). Mostriamo ora come costruire un altro sottospazio chiuso, Hψ ortogonale a Hψ , invariante sotto T e T ∗ e che verifichi la (8.59) per una corrispondente isometria suriettiva Uψ : Hψ → L2 (σ(T ), μψ ). Se ψ ⊥ Hψ allora
(T ) ψ f(x, y) dP (x, y)ψ = 0 ,
σ(T ) per ogni f ∈ Mb (σ(T )). Ma allora, per le propriet` a dell’integrale rispetto a misure spettrali ((iii) e (iv) di (a) in teorema 8.32) vale anche, per ogni coppia g, f ∈ Mb (σ(T )):
g dP (T )ψ f dP (T )ψ = ψ g dP (T ) f dP (T )ψ
σ(T )
σ(T ) σ(T ) σ(T )
= ψ g(x, y)f(x, y) dP (T )(x, y)ψ = 0 , dove si `e tenuto conto che g · f ∈ Mb (σ(T )) nelle ipotesi fatte. In definitiva, se ψ ⊥ Hψ allora Hψ `e ortogonale a Hψ e quindi lo stesso fatto vale per le rispettive chiusure per la continuit`a del prodotto scalare. Lo spazio Hψ `e invariante sotto T e T ∗ (la dimostrazione `e la stessa che per Hψ ) ed `e verificata (8.59) per una corrispondente isometria suriettiva Uψ : Hψ → L2 (σ(T ), μψ )
362
8 Teoria Spettrale I: operatori limitati
(la prova `e quella data all’inizio di questa dimostrazione). In questo modo, scegliendo classi di vettori {ψα } opportunamente, si possono costruire classi di sottospazi chiusi Hα = Hψα , ciascuno dotato di un’isometria suriettiva Uα : Uα : Hα → L2 (σ(T ), μψ ), in modo tale che gli spazi (a) siano ortogonali a due a due, (b) siano separatamente invarianti sotto T e T ∗ e (c) verifichino: Uα f(x, y) dP (T )(x, y) Hα Uα−1 = f· (8.60) σ(T )
per ogni f ∈ Mb (σ(T )). Indichiamo con C l’insieme di tali classi di sottospazi. Possiamo mettere in C la relazione d’ordine parziale data dall’inclusione insiemistica. Con tale relazione d’ordine parziale, ogni sottoinsieme ordinato di C `e limitato superiormente, per cui, per il Lemma di Zorn, ci deve essere in C un elemento massimale {Hα }α∈A. Il sottospazio banale H0 := {0} (per esso μ0 `e la misura nulla – per cui L2 (σ(T ), μ0 ) contiene solo il vettore nullo – e U0 trasforma il vettore nullo di {0} nel vettore nullo di L2 (σ(T ), μ0 )) `e contenuto in {Hα }α∈A : se non fosse contenuto {Hα }α∈A ∪ {H0 } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Se esiste ψ ∈ H con ψ ⊥ Hα per ogni α ∈ A e ψ = 0, potremmo costruire uno spazio Hψ , differente da tutti gli Hα , ma che gode delle propriet` a (a), (b) e (c). Allora {Hα }α∈A ∪ {Hψ } maggiorerebbe {Hα }α∈A e si avrebbe un assurdo. Concludiamo che, se ψ `e ortogonale a tutti gli spazi Hα allora ψ = 0. In altre parole, < {Hα }α∈A > = H e quindi, essendo gli spazi a due a due ortogonali: H = ⊕α∈A Hα . Passiamo a provare (b) nel caso generale di T normale, il caso di T autoaggiunto e T unitario si provano specializzando la dimostrazione in modo ovvio. Proveremo che vale la doppia implicazione equivalente alla tesi: λ ∈ supp{μα }α∈A ⇔ λ ∈ ρ(T ). ⇒. Se λ ∈ supp{μα }α∈A, sia DR un disco aperto di raggio R > 0 centrato in λ con μα (DR ) = 0 per ogni α ∈ A, tale disco esiste sempre nelle ipotesi fatte. Si verifica subito che, in ogni spazio L2 (σ(T ), μα ), l’operatore moltiplicativo per (x + iy − λ)−1 `e limitato con norma non superiore a 1/R (indipendentemente da α) ed `e l’inverso destro e sinistro dell’operatore moltiplicativo per (x+iy −λ). Sia Rλ (α) : Hα → Hα l’operatore Uα−1 (x+iy −λ)−1 ·Uα . Rλ (α) ha la stessa norma dell’operatore moltiplicativo (x +iy −λ)−1 ·, dato che Ua `e isometrico suriettivo, per cui vale anche ||Rλ (α)|| ≤ 1/R. Si definisca l’operatore Rλ : H → H tale che: Pα ψ → Rλ (α)Pα ψ , Rλ : α∈A
α∈A
per ogni ψ ∈ H. Tenendo conto di quanto detto nella nota precedente e del fatto che gli spazi Hα sono invarianti per T e per Rλ (che si riduce a Rλ (α) su ciascuno di essi), si verifica facilmente che, vale ||Rλ || ≤ 1/R ed inoltre Rλ (T − λI) = (T − λI)Rλ = I. Infatti, dato che RanRλ (α) = Hα , si ha: ||Rλ ψ||2 = || Rλ (α)Pα ψ||2 = || Pa Rλ (α)Pα ψ||2 α∈A
α∈A
8.4 Teorema spettrale per operatori normali in B(H)
= =
||PaRλ (α)Pα ψ||2
α∈A
||Rλ(α)Pα ψ||2 ≤ R−2
α∈A
||Pα ψ||2 = R−2 ||ψ||2 .
α∈A
Inoltre: (T − λI)Rλ ψ = (T − λI)Rλ
363
(T − λI)Rλ Pα ψ =
α∈A
Pα ψ
α∈A
(T − λI) Hα Rλ (a)Pα ψ =
α∈A
IPα ψ = ψ ,
α∈A
per cui: (T − λI)Rλ = I. Similmente: Rλ (T − λI)ψ = Rλ (T − λI)
Pα ψ
α∈A
Rλ (T − λI)Pα ψ =
α∈A
Rλ (a)(T − λI) Hα Pα ψ =
α∈A
IPα ψ = ψ ,
α∈A
per cui: Rλ (T − λI) = I. Per (a) di teorema 8.4, λ ∈ ρ(T ). ⇐. Supponiamo ora che λ ∈ ρ(T ) per cui esiste (T − λI)−1 : H → H inverso destro e sinistro di T − λI ed operatore limitato. Definiamo > 0 in modo tale che valga ||(T − λI)−1 || =: 1/. Sosteniamo che allora μα (D ) = 0 per ogni α ∈ A, dove D `e il disco aperto di raggio centrato in λ. Procediamo per assurdo. Supponiamo sia falso quanto affermato per ultimo, allora esister`a β ∈ A tale che μβ (D ) > 0. Sia Dδ ⊂ D un secondo disco aperto centrato in un punto di D con raggio δ tale che 0 < δ < e μβ (Dδ ) > 0, se non esistesse un siffatto Dδ sarebbe μβ (D ) = 02 . Consideriamo un vettore ψ ∈ H \ {0} definito dal fatto che Pα ψ = 0 se α = β e Uβ ψ = f tale che suppf ⊂ Dδ . Possiamo sempre ridefinire ψ per un fattore moltiplicativo, in modo tale che ||ψ|| = 1. Vale allora, essendo |x + iy − λ| < se x + iy ∈ Dδ : ||(T − λI)ψ||2 = |(x + iy) − λ|2 |f(x, y)|2 dμβ (x, y) Dδ
< 2
|f(x, y)|2 dμβ (x, y) = 2 .
Dδ
Quindi vale: ||(T − λI)ψ|| < . 2
Per ogni z ∈ D, possiamo scegliere un disco aperto centrato in z di raggio positivo δ < in modo tale che Dδ ⊂ D . In tal modo abbiamo un ricoprimento dell’insieme D fatto da suoi sottoinsiemi aperti. Per il lemma di Lindel¨of, possiamo (i) (i) estrarre un sotto ricoprimento numerabile {Dδi }i∈N . Valendo D = ∪i∈NDδi dovr` a (i) (i) anche essere: μβ (E ) ≤ i∈N μβ (Dδi ). Se fosse μβ (Dδi ) = 0 per ogni i, avremmo che μβ (D) = 0.
364
8 Teoria Spettrale I: operatori limitati
D’altra parte, per definizione di norma di un operatore: ||(T − λI)−1 || ≥
||(T − λI)−1 φ|| ||φ||
per ogni φ ∈ H \ {0}. Di conseguenza, posto (T − λI)−1 φ = ψ, vale ||(T − λI)−1 || ≥
||ψ|| , ||(T − λI)ψ||
e pertanto: 1/ ≥
1 > 1/ , ||(T − λI)ψ||
che `e assurdo. Concludiamo la dimostrazione provando (c). Nel caso di H separabile, consideriamo la classe di vettori ortogonali {ψn }n∈N costruita come gli {ψα }α∈A di sopra, con la differenza che che ora α `e indicato con n ∈ N. Siamo liberi +∞di scegliere i vettori detti in modo che ||ψn ||2 = 2−n . Definiamo MT := n=1 σ(T ), cio`e MT `e l’unione disgiunta di infinite copie di σ(T ). Infine definiamo μT richiedendo che si restringa a μn sullacopia n-esima di σ(T ). Deve esser chia+∞ 2 ro che in questo modo μT (MT ) = e n=0 ||ψn || < +∞. La funzione FT ` ovviamente quella che si restringe alla funzione (x + iy)· su ogni componente σ(T ). In questo modo FT risulta essere limitata dato che ogni copia di σ(T ) `e limitato. L’operatore UT `e costruito in modo ovvio attraverso gli Un . Esempi 8.39. (1) Consideriamo l’operatore T su H := L2 ([0, 1] × [0, 1], dx⊗ dy) definito da: (T f)(x, y) = xf(x, y) quasi ovunque su X := [0, 1] × [0, 1], per ogni f ∈ H. Si verifica facilmente che tale operatore `e limitato, autoaggiunto e con spettro σ(T ) = σc (T ) = [0, 1]. Una misura spettrale su R a supporto limitato che riproduce T come integrale, (T ) `e quella data dai proiettori ortogonali PE definiti come operatori moltiplicativi per le funzioni caratteristiche χE con E := (E ∩ [0, 1]) × [0, 1], per ogni boreliano E ⊂ R. Infatti, usando i lemmi A e B dell’esempio (1) in esempi 8.29, e con una scelta opportuna per i domini delle funzioni usate, si verifica che, per ogni g ∈ Mb (X): g(λ) P (λ)f
(x, y) = g(x)f(x, y) ,
[0,1]
Quindi in particolare: λ P (λ)f [0,1]
quasi ovunque su X .
(x, y) = xf(x, y) ,
quasi ovunque su X ,
8.4 Teorema spettrale per operatori normali in B(H)
e quindi:
365
T =
λ dP (λ) , [0,1]
come volevamo. Questa misura spettrale `e allora l’unica, su R, a soddisfare (a) del teorema spettrale. Ci interessiamo ora al punto (c) dell’enunciato del teorema spettrale. Una decomposizione di H come quella precisata in tale punto si ottiene nel modo seguente. Sia {un }n∈N una base hilbertiana di L2 ([0, 1], dy). Consideriamo quindi i sottospazi di H := L2 ([0, 1] × [0, 1], dx ⊗ dy) dati da, per ogni n ∈ N, Hn := {f · un | f ∈ L2 ([0, 1], dx)} . ` facile verificare che questa classe di sottospazi soddisfa, rispetto a T , tutte le E richieste del punto (c) del teorema. In particolare, per costruzione Hn `e isomorfo a L2 ([0, 1], dx) secondo la trasformazione isometrica suriettiva: f · un → f e quindi μn = dx. (2) Consideriamo un operatore compatto autoaggiunto T ∈ B(H) nello spazio di Hilbert H. Per il teorema 4.17, σp (T ) `e un insieme discreto di punti in R, con eventualmente il punto 0 come unico punto di accumulazione. Di conseguenza, σ(T ) = σp (T ), eccetto il caso in cui 0 `e punto di accumulazione di σp (T ), ma 0 ∈ σp (T ). In questo caso (essendo σ(T ) chiuso, per il teorema 8.4) σ(T ) = σp(T ) ∪ {0} e 0 `e l’unico elemento di σc (T ) (essendo σr (T ) = ∅ per la proposizione 8.15). Seguendo l’esempio (3) in esempi 8.29, possiamo definire una misura a valori di proiezione su R che `e nulla fuori da σ(T ): PE := sPλ λ∈E
con E ⊂ σ(T ) e con Pλ proiettore ortogonale sull’autospazio con autovalore λ, se λ `e autovalore, Pλ = 0 (proiettore nullo) altrimenti. Quest’ultima possibilit` a pu` o capitare solo se λ = 0 e 0 non `e autovalore. Seguendo l’esempio (3) in esempi 3.12, troviamo che: λP (λ)ψ = λPλ ψ , σ(T )
λ∈σ(T )
per ogni ψ ∈ H. D’altra parte, per il teorema 4.18, vale anche: λPλ = T , λ∈σ(T )
dove abbiamo definito P0 = 0 se 0 ∈ σc(T ). L’enunciato del teorema 4.18 precisa che tale decomposizione vale nella topologia operatoriale uniforme se si segue un ordine opportuno nell’etichettare gli autovalori. Seguendo tale ordinamento, vale anche che, per ogni ψ ∈ H: λPλ ψ = T ψ . λ∈σ(T )
366
8 Teoria Spettrale I: operatori limitati
Possiamo interpretare la somma a primo membro nel senso degli integrali rispetto alla misura a valori di proiezione su σ(T ) definita sopra. Ci` o prova anche che la serie a primo membro pu`o essere riordinata a piacimento (quando i proiettori sono applicati su un vettore ψ ∈ H). Si osservi infine che, per costruzione, supp(P ) = σ(T ). Concludiamo che: la misura su σ(T ) definita sopra `e la misura spettrale di T , unicamente associata a T dal teorema spettrale. Inoltre, la decomposizione spettrale di T coincide con la decomposizione di T nella topologia forte sui suoi autospazi : T = sλPλ , λ∈σp (T )
l’eventuale punto 0 ∈ σc (T ) non fornisce contributo all’integrale.
Per concludere il paragrafo enunciamo due teoremi. Il primo `e il seguente notevole risultato, noto come teorema di Fuglede, che stabilisce che affinch`e un operatore B ∈ B(H) commuti con A∗ , con A ∈ B(H) normale, `e sufficiente che commuti con A. Questo risultato non `e affatto ovvio ed ha immediate conseguenze in base ai teoremi provati. Per esempio, in base a (c) del teorema 8.34 di decomposizione spettrale, se B commuta con A allora commuta con tutti gli operatori σ(T ) f(x, y)dP (A) (x, y), per ogni funzione misurabile limitata f : σ(T ) → C. Teorema 8.40. (Di Fuglede.) Sia H spazio di Hilbert. Se A ∈ B(H) `e normale e B ∈ B(H) commuta con A, allora B commuta anche con A∗ . ∗
∗
Dimostrazione. Per s ∈ C, si consideri la funzione Z(s) = e−sA BesA , dove gli esponenziali sono definiti per via spettrale come integrali delle funzioni C s → e∓s(x−iy) rispetto alla misura spettrale di A, P (A) . Al solito porremo (∓s(x−iy))n e che, z = x + iy e z = x − iy. Si osservi ora che e∓s(x−iy) = +∞ n=0 n! per s fissato, la convergenza `e uniforme in (x, y) su ogni compatto, come σ(A). In particolare questo implica che l’insieme delle ridotte della serie `e limitato nella norma || ||∞. Per (c) del teorema 8.32, usando ancora la PVM associata ad A dal teorema spettrale, abbiamo che deve valere: ∓sA∗
e
= s-
+∞ n=0
(∓sA∗ )n . n!
(8.61)
Usando il fatto che A commuta con A∗ e con B, esprimendo Z(s)Aψ usando lo sviluppo di sopra, si trova che AZ(s)ψ = Z(s)Aψ per ogni ψ ∈ H. Concludiamo che Z(s) commuta con A∗ , A e quindi con tutte le sue funzioni per il teorema spettrale 8.38. Quindi: ∗
∗
Z(s) = Z(s)e+sA e−sA = e−sA e+sA BesA e−sA = e−sA ∗
∗
∗
+sA
BesA
∗
−sA
.
Dove abbiamo usato le identit` a e−sA e+sA = e−sA +sA e e+sA e−sA = I che si provano esattamente come per gli esponenziali di numeri, tenendo conto
8.4 Teorema spettrale per operatori normali in B(H)
367
dello sviluppo (8.61) e del fatto che A e A∗ commutano. Con la stessa tecnica ∗ ∗ ∗ si prova subito che Us := e−sA +sA = esA −sA e Us∗ = Us−1 . Quindi Us `e unitario e ||Z(s)|| = ||U BU ∗|| ≤ ||U || ||B|| ||U ∗|| = 1||B||1 = ||B||. La funzione C s → (ψ|Z(s)φ) `e allora limitata su tutto il piano complesso. Se tale funzione fosse intera (cio`e analitica su tutto C), per il teorema di Liouville, potremmo concludere che si tratta di una funzione costante. Assumiamo che la funzione detta sia intera e quindi che sia costante. Di conseguenza, tenendo conto dell’arbitrariet` a di ψ, φ deve essere, Z(s) = Z(0) per ogni s ∈ C. Que∗ ∗ ∗ ∗ sta identit` a si scrive esplicitamente: e−sA BesA = B, cio`e BesA = esA B. ∗ ∗ Conseguentemente (ψ|BesA φ) = (ψ|esA Bφ) per ogni ψ, φ ∈ H. L’identit` a ∗ ∗ appena trovata pu` o essere riscritta (B ∗ ψ|esA φ) = (ψ|esA Bφ) e poi, in base alle propriet` a delle PVM e dal teorema spettrale: esz dμB∗ ψ,φ = esz dμψ,Bφ , K
K
dove K ⊂ R2 ≡ C `e un compatto abbastanza grande da contenere i supporti delle misure dei due integrali. Possiamo derivare entrambi i membri in s, per s = 0, passando la derivata sotto il segno di integrale, applicando il teorema C.8 in Appendice (tenendo conto che le derivate degli integrandi sono funzioni di (s, (x, y)) continue e quindi limitate sul compatto C × K, con C un secondo compatto che contiene nel suo interno s = 0). Il risultato `e: zdμB∗ ψ,φ = zdμψ,Bφ , K
K
che pu` o essere scritto (ψ|BA∗ φ) = (ψ|A∗ Bφ). Per l’arbitrariet` a di ψ e φ, questo significa che B commuta con A∗ : BA∗ = A∗ B. Rimane da provare che C s → (ψ|Z(s)φ) sia una funzione analitica, cosa che proviamo ora. Usando lo sviluppo dell’esponenziale (8.61) e la continuit` a del prodotto scalare, si ha: (ψ|Z(s)φ) =
+∞ +∞ (−s)n+m (ψ|(A∗ )n B(A∗ )m φ) . n!m! n=0 m=0
(8.62)
Possiamo interpretare questa doppia serie come un integrale doppio iterato nella misura che conta i naturali; useremo tale misura su N nel seguito, indicandola con dμ(n). Dato che, dalla disuguaglianza di Schwarz e da note propriet` a della norma operatoriale:
(−s)n+m
(|s| ||A||)n (|s| ||A||)m ∗ n ∗ m
(ψ|(A ||B|| ||ψ|| ||φ|| ) B(A ) φ)
n!m!
≤ n! m! e che la funzione positiva su N×N a secondo membro `e integrabile nella misura prodotto (l’integrale `e ovviamente e|s| ||A||e|s| ||A||||B|| ||ψ|| ||φ||), per il teoren+m ma di Fubini-Tonelli, la funzione (n, m) → (−s) (ψ|(A∗ )n B(A∗ )m φ) =: n!m!
368
8 Teoria Spettrale I: operatori limitati
fs (n, m) `e L1 nella misura prodotto e la (8.62) pu` o essere riscritta: fs (n, m)dμ(n) ⊗ dμ(m) . (ψ|Z(s)φ) =
(8.63)
N×N
Usando il teorema della convergenza dominata abbiamo infine che: fs (n, m)dμ(n) ⊗ dμ(m) N×N
=
lim
N→+∞
N×N
χ{(n,m)∈N×N | n+m≤N} fs (n, m)dμ(n) ⊗ dμ(m) .
Esplicitando il secondo membro in termini di somme: (ψ|Z(s)φ) =
lim
N→+∞
N
M =0 n+m=M
(−s)n+m (ψ|(A∗ )n B(A∗ )m φ) , n!m!
cio`e, possiamo scrivere: (ψ|Z(s)φ) =
+∞
CN sN
∀s ∈ C ,
(8.64)
N=0
dove: CN = (−1)N
n+m=N
(ψ|(A∗ )n B(A∗ )m φ) . n!m!
La (8.64) afferma che (ψ|Z(s)φ) `e esprimibile come una serie di potenze in s, con s che varia in tutto il piano complesso. Conseguentemente C s → (ψ|Z(s)φ) `e una funzione intera come volevamo. Osservazione 8.41. Il teorema ammette un’estensione al caso in cui l’operatore normale A della tesi non sia limitato, ma L’operatore B, che commuta con A, sia limitato. Questa `e la formulazione originale data da Fuglede [Fug50] che per`o richiede la teoria spettrale per operatori normali non limitati che noi non svilupperemo. Il secondo teorema `e un diretto corollario del teorema di decomposizione spettrale e del teorema 8.32. La dimostrazione `e lasciata per esercizio al lettore. Teorema 8.42. Siano H spazio di Hilbert e T ∈ B(H) operatore normale. L’applicazione ΨT : Mb (σ(T )) → B(H), dove: f(x, y) dP (T ) (x, y) per ogni f ∈ Mb (σ(T )), ΨT (f) = σ(T )
∗
`e l’unico -omomorfismo continuo, dalla C ∗ -algebra commutativa con unit` a, Mb (σ(T )) riferita alla norma || ||∞, alla C ∗ -algebra con unit` a B(H), tale che:
Esercizi
369
(i) vale l’identit` a ΨT (z) = T ,
dove z `e la funzione σ(T ) (x, y) → z := x + iy ,
(8.65)
(ii) se {fn }n∈N ⊂ Mb (σ(T )) `e limitata e converge puntualmente a f : σ(T ) → C, allora: ΨT (f) = w- lim ΨT (fn ) . n→+∞
Esercizi 8.1. Si supponga che valgano le ipotesi del teorema 8.4 con X = H spazio di Hilbert. Mostrare che se Rλ (T ) `e un operatore compatto per λ = λ0 ∈ ρ(T ), allora `e compatto per ogni λ ∈ ρ(T ). Suggerimento. Si usi l’equazione risolvente e le propriet` a dello spazio degli operatori compatti. 8.2. Sia H = 2 (N) e si consideri l’operatore: T : (x0 , x1 , x2, . . .) → (0, x0 , x1, . . .) . Determinare lo spettro di T . 8.3. Siano H spazio di Hilbert e T = T ∗ ∈ B(H) compatto. Mostrare che se dim(RanT ) non `e finita, allora σc (T ) = ∅ ed `e costituito da un punto solo. Suggerimento. Decomporre T come nel teorema 4.18, tenere conto del teorema 4.17 ed infine del fatto che σ(T ) `e chiuso per il teorema 8.4. 8.4. Costruire un operatore autoaggiunto con spettro puntuale denso in [0, 1]. Suggerimento. Si consideri lo spazio di Hilbert H = 2 (N), si numerino i razionali in [0, 1] secondo un ordine qualsiasi: r0 , r1 , . . . e si definisca l’operatore T : (x0 , x1 , x2 , . . .) → (r0 x0 , r1 x1 , r2 x2 , . . .) con dominio D(T ) dato dalle successioni (x0 , x1 , x2, . . .) ∈ 2 (N) tali che +∞
|rn xn |2 < +∞ .
n=0
8.5. Mostrare che se T `e autoaggiunto sullo spazio di Hilbert H e λ ∈ ρ(T ), allora Rλ (T ) `e un operatore normale di B(H) che soddisfa: Rλ (T )∗ = Rλ (T ) .
370
8 Teoria Spettrale I: operatori limitati
8.6. Dimostrare che lo spettro residuo di un operatore unitario `e vuoto in modo diretto, senza cio`e ridursi a considerare gli operatori unitari come operatori normali. Soluzione. Se λ ∈ σr (U ), allora Ran(U − λI) non `e denso, per cui esiste f = 0 normale a Ran(U − λI). Allora, per ogni g ∈ H: (f|λg) = (f|U g) e quindi (λf|g) = (U ∗ f|g) per ogni g ∈ H. Di conseguenza: U ∗ f = λf. Facendo agire U membro a membro, troviamo f = λU f, che implica U f = λf perch´e, essendo |λ| = 1, vale 1/λ = λ. Quindi λ ∈ σp (U ) e ci`o `e assurdo, essendo lo spettro puntuale e lo spettro residuo disgiunti; pertanto σr (U ) = ∅. 8.7. Mostrare che se U : H → H, con H spazio di Hilbert, `e operatore isometrico non suriettivo, allora σr (U ) = ∅. Suggerimento. Provare che 0 ∈ σ(U ). U − 0I `e iniettivo, ma Ran(U − 0I) = RanU non `e denso. Se fosse denso accadrebbe che, per ogni f ∈ H, esisterebbe {fn }n∈N ⊂ H con U fn → f. Conservando U la norma, {fn } sarebbe di Cauchy perch´e lo `e {U fn }, ma allora, se fn → g, avremmo U g = f. Dato che f ∈ H `e arbitrario, avremmo che U `e suriettivo, cosa esclusa a priori. 8.8. Se P : X → B(H) `e una PVM, provare che (1) l’insieme delle funzioni f : X → C Borel misurabili essenzialmente limitate rispetto a P `e uno spazio (P ) vettoriale e (2) che || ||∞ `e una norma su tale spazio. 8.9. Sia A un operatore nello spazio di Hilbert H con dominio D(A) e sia U : H → H un’isometria suriettiva tra spazi di Hilbert. Provare che, se A := U −1 AU : D(A ) → H , con D(A ) = U −1 D(A), allora σp (A) = σp (A ), σp(A) = σp (A ), σr (A) = σr (A ). 8.10. Si consideri l’operatore posizione Xi definito in definizione 5.21. Mostrare che σ(Xi ) = σc (Xi ) = R. 8.11. Si consideri l’operatore impulso Xi definito in definizione 5.26. Mostrare che σ(Pi ) = σc (Pi ) = R. Suggerimento. Usare la proposizione 5.30. 8.12. Se σ(A) = σ(B), per due operatori A e B in uno spazio di Hilbert, allora `e vero che σp (A) = σp (B)? Suggerimento. Considerare l’operatore dell’esercizio 8.4 e l’operatore moltiplicativo per la coordinata x in L2 ([0, 1], dx), dove dx `e la misura di Lebesgue su R. 8.13. Si consideri l’operatore di Volterra A : L2 ([0, 1], dx) → L2 ([0, 1], dx): x f(t)dt , (Af)(x) = 0
e se ne studi lo spettro e si provi che σ(A) = σc (A) = {0}.
Esercizi
371
Traccia della soluzione. Si ricordi che, essendo [0, 1] di misura di Lebesgue finita, L2 ([0, 1], dx) ⊂ L1 ([0, 1], dx) in modo da poter applicare la teoria dell’integrale di Lebesgue come funzione dell’estremo superiore d’integrazione (in particolare il teorema C.6). Si osservi anche che lo spettro di A non pu` o essere vuoto per il teorema 8.4 dato che A `e limitato e dunque chiuso. Se λ = 0, (λ−1 A)n , se `e n abbastanza grande, `e un operatore di contrazione come provato nell’esercizio 4.18. Per il teorema del punto fisso λ = 0 non pu` o essere autovalore, perch´e l’unica soluzione ψ dell’equazione agli autovalori λ−1 Aψ = ψ pu` o solo essere ψ = 0, inaccettabile come autovettore. Tenendo conto che A `e compatto, il lemma 4.47 assicura che, se 0 = λ (e quindi anche λ ∈ σp (A)), allora Ran(A − λI) = H (lo spazio di Hilbert L2 ([0, 1], dx)) e, dato che A − λI `e biettivo, (A − λI)−1 : H → H `e limitato per il teorema dell’operatore inverso limitato. Pertanto λ ∈ σ(A) se λ = 0. Dunque l’unico punto dello spettro `e λ = 0. Da (b) del teorema C.6 segue che non esistono vettori non nulli che soddisfano Aψ = 0. Concludiamo che 0 ∈ σr (A) ∪ σc(A). Se fosse 0 ∈ σr (A) avremmo che Ran(A) non `e denso in L2 ([0, 1], dx), cio`e Ker(A∗ ) = {0}, dato che H = Ran(A) ⊕ Ker(A∗ ) Questo fatto `e impossibile 1 dato che (A∗ f)(x) = x f(t)dt (vedi l’esercizio 3.18) e applicando nuovamente (b) del teorema C.6 troveremmo una contraddizione. 8.14. Considerare l’operatore T limitato ed autoaggiunto su H := L2 ([0, 1], dx) che moltiplica le funzioni per x2 : (T f)(x) := x2 f(x) . Trovarne la misura spettrale. Suggerimento. Costruire una trasformazione unitaria da H a L2 ([0, 1], dy) che trasformi l’operatore moltiplicativo per x2 nell’operatore moltiplicativo per y. 8.15. Considerare l’operatore T limitato ed autoaggiunto su H L2 ([−1, 1], dx) che moltiplica le funzioni per x2 :
:=
(T f)(x) := x2 f(x) . Trovarne la misura spettrale. Suggerimento. Ragionare come nell’esercizio 8.14, dopo avere decomposto: L2 ([−1, 1], dx) = L2 ([−1, 0], dx) ⊕ L2 ([0, 1], dx) . 8.16. Se T ∈ B(H), con H spazio di Hilbert, `e un operatore normale, dimostrare che, per ogni α ∈ C, αT e = eα(x+iy) dP (T )(x, y) , σ(T )
372
8 Teoria Spettrale I: operatori limitati
dove il primo membro `e definito come, rispetto alla topologia operatoriale uniforme: +∞ n n α T αT . e := n! n=0 +∞ n n Suggerimento. La serie n=0 α n!z converge assolutamente ed uniformemente in ogni cerchio chiuso di raggio finito centrato nell’origine di C. Inoltre, per ogni polinomio p(z) (dove z = x + iy), vale: p(T ) = p(x + iy) dP (T )(x, y) . σ(T )
Usare il primo punto del teorema 8.30. 8.17. Dimostrare il teorema 8.42. Suggerimento. L’unica cosa da dimostrare `e l’unicit` a dello ∗ -omomorfismo continuo che soddisfa (i) e (ii). A tal fine si osservi che ogni siffatto ∗ a coinomomorfismo coincide con ΨT sui polinomi p(z, z). Quindi, per continuit` a prosegue cide con ΨT su C(σ(T )). A questo punto la dimostrazione di unicit` come per la parte corrispondente della prova del teorema 8.18.
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni Il linguaggio della matematica si rivela irragionevolmente efficace nelle scienze naturali, un dono meraviglioso che non comprendiamo n´ e meritiamo. Eugene Paul Wigner
In questo capitolo, che probabilmente `e il pi` u tecnico del libro, esamineremo varie questioni matematiche legate pi` u o meno direttamente alla teoria spettrale per operatori autoaggiunti non limitati. Nella prima sezione, estenderemo il teorema spettrale provato nel capitolo precedente, al caso di operatori autoaggiunti non limitati. Per fare ci` o, estenderemo la procedura di integrazione di rispetto a misure spettrali, al caso di funzioni non limitate. Con questa estensione e facendo uso della trasformata di Cayley, dimostreremo il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Daremo quindi due esempi fisicamente importanti di operatori autoaggiunti non limitati e della loro decomposizione spettrale: l’hamiltoniano dell’oscillatore armonico e gli operatori posizione ed impulso. Enunceremo infine un teorema di rappresentazione spettrale per operatori autoaggiunti non limitati ed introdurremo la nozione di PVM congiunta (joint spectral measure). La seconda, molto breve, sezione sar`a dedicata alla procedura di esponenziazione di operatori non limitati, in relazione alla nozione di vettore analitico introdotto precedentemente. Nella terza ci concentreremo sulla teoria dei gruppi ad un parametro fortemente continui di operatori unitari. In primo luogo proveremo l’equivalenza delle varie richieste di continuit` a. Quindi proveremo il teorema di von Neumann sulla continuit` a delle dei gruppi ad un parametro misurabili di operatori unitari, e successivamente dimostreremo il teorema di Stone e qualche importante conseguenza. In particolare daremo un utile criterio, basato sui gruppi unitari ad un parametro generati da operatori autoaggiunti, per stabilire quando le misure spettrali di due operatori autoaggiunti commutano. La quarta sezione sar`a dedicata alla nozione di prodotto tensoriale hilbertiano di spazi di Hilbert ed a quella di prodotto tensoriale di operatori (in generale non limitati) ed alle relative propriet` a spettrali. Come esempio ed applicazione studieremo gli operatori associati al momento angolare orbitale di una particella quantistica. Moretti V.: Teoria spettrale e meccanica quantistica. c Springer-Verlag Italia 2010, Milano
374
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
La quinta sezione riguarder`a l’estensione del teorema di decomposizione polare al caso di operatori non limitati, chiusi e densamente definiti. In tale sede discuteremo anche le propriet`a notevoli degli operatori della forma A∗ A, con A densamente definito e chiuso, e delle radici quadrate di operatori autoaggiunti positivi non limitati. L’ultima sezione riguarder`a l’enunciato, la dimostrazione e qualche diretta applicazione del teorema di Kato-Rellich, che stabilisce criteri affinch´e un operatore autoaggiunto, perturbato additivamente tramite un operatore simmetrico, dia ancora luogo ad un operatore autoaggiunto.
9.1 Teorema spettrale per operatori autoaggiunti non limitati Ci occuperemo ora di generalizzare parte delle definizioni e dei risultati ottenuti nella sezione precedente. In particolare vogliamo dimostrare il teorema di decomposizione spettrale nel caso di operatori autoaggiunti non limitati. L’importanza in fisica di tale teorema risiede nel fatto che, nella Meccanica Quantistica, la maggior parte degli operatori autoaggiunti che rappresentano osservabili di concreto interesse fisico sono operatori non limitati. Il caso tipico `e dato dall’operatore posizione introdotto nel capitolo 5. 9.1.1 Integrazione di funzioni non limitate rispetto a misure spettrali Nel seguito faremo spesso uso della seguente naturale definizione. Definizione 9.1. Sia X spazio m vettoriale complesso, T operatore in X con dominio D(T ) e p(x) = k=0 ak xk un polinomio di grado m a coefficienti complessi. (a) L’operatore p(T ) nello spazio X `e definito sostituendo T alla variabile x, con T 0 := I, T 1 := T , T 2 := T T , ecc. (b) Il dominio D(p(T )) di p(T ) `e, in conformit` a con la definizione 5.1: D(p(T )) :=
m 0
D(ak T k ) ,
(9.1)
k=0
con D(ak T · · · T ) dato in definizione 5.1. L’estensione dei risultati del capitolo precedente al caso di operatori non limitati necessita prima di tutto la definizione di integrazione di funzioni non limitate rispetto a PVM. Se P `e una misura spettrale sullo spazio topologico a base numerabile X, nel senso della definizione 8.21, e se f : X → C `e una funzione misurabile (rispetto all’algebra di Borel di X), ma non necessariamente limitata, la scrittura: X f(x)dP (x) non ha alcun senso fino ad ora. Cerchiamo quindi di dare un significato a tale integrale.
9.1 Teorema spettrale per operatori autoaggiunti non limitati
375
Consideriamo un vettore ψ ∈ H, spazio di Hilbert della PVM P , tale che: |f(x)|2 dμψ (x) < +∞ , (9.2) X
dove la misura spettrale rispetto a ψ, μψ , `e quella definita in (c) del teorema 8.30. Possiamo sempre trovare una successione di funzioni misurabili e limitate, fn , tali che fn → f per n → +∞ nel senso della norma di L2 (X, μψ ). Per esempio, come si prova facilmente dal teorema della convergenza dominata di Lebesgue, basta considerare la successione di funzioni fn := χFn · f, dove χFn `e la funzione caratteristica dell’insieme Fn := {x ∈ X | |f(x)| < n}. Usando (iii) di (a) e (b) del teorema 8.32, si ricava immediatamente che vale l’identit`a:
2
fn (x)dP (x)ψ − fm (x)dP (x)ψ
= |fn (x) − fm (x)|2 dμψ (x) . (9.3)
X
X
X
Pertanto la successione di vettori X fn (x)dP (x)ψ converge a qualche vettore, che indicheremo con X f(x)dP (x)ψ: f(x)dP (x)ψ := lim fn (x)dP (x)ψ . (9.4) n→+∞
X
X
Potremmo usare la (9.4) per definire l’integrale, rispetto a P ,della funzione misurabile non limitata f. La definizione `e ben posta perch´e X f(x)dP (x)ψ non dipende dalla successione {fn }n∈N. Se infatti {gn }n∈N `e un’altra successione di funzioni misurabili limitate che converge a f nel senso della norma di L2 (X, μψ ), procedendo come sopra, otteniamo:
2
fn (x)dP (x)ψ − gn (x)dP (x)ψ
= |fn (x) − gn (x)|2 dμψ (x)
X
X
e pertanto:
X
lim
n→+∞
X
fn (x)dP (x) = lim
n→+∞
X
gn (x)dP (x) .
Se usiamo la (9.4) come definizione di integrale di una funzione non limitata, dobbiamo tenere conto del fatto che l’operatore ottenuto non `e definito su tutto lo spazio di Hilbert, ma solo su quei vettori che soddisfano (9.2). Ovviamente dobbiamo anche controllare che i vettori che soddisfano (9.2) formino un sottospazio di H. Per provare ci`o e molto altro, abbiamo ancora bisogno di un lemma che lega le propriet` a della misura spettrale μψ a quelle delle misure μφ,ψ quando `e rispettata la condizione (9.2), per ψ ∈ H. Lemma 9.2. Sia X spazio topologico a base numerabile, P : B(X) → B(H) una PVM, con H spazio di Hilbert, e f : X → C una funzione misurabile. Se, per φ, ψ ∈ H, le misure μψ e μφ,ψ sono definite come nel teorema 8.30 e vale: |f(x)|2 dμψ (x) < +∞ , X
376
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
allora f ∈ L1 (X, |μφ,ψ |) e !
X
|f(x)|d|μφ,ψ (x)| ≤ ||φ||
X
|f(x)|2 dμψ (x) .
(9.5)
Dimostrazione. Se f `e limitata, da (iv) in (c) nel teorema 8.30:
φ |f(x)|dP (x)ψ = |f(x)|dμφ,ψ (x) . X
X
Come conseguenza del teorema di Radon-Nikodym (vedi (1) in esempi 2.58), esiste una funzione h : X → C con |h(x)| = 1 su X, tale che dμφ,ψ = hd|μφ,ψ |, e quindi:
−1 |f(x)|d|μφ,ψ (x)| = |f(x)|h (x)dμφ,ψ (x) = φ
|f (x)|h−1 (x)dP (x)ψ . X
X
X
Usando (b) del teorema 8.32 e notando che ||f(x)|h−1 (x)|2 = |f(x)|2 , abbiamo:
−1
|f(x)|d|μφ,ψ (x)| ≤ ||φ||
|f(x)|h (x)dP (x)ψ
X
X
! = ||φ||
X
|f(x)|2 dμψ (x) .
Sia ora f non limitata. Definiamo le funzioni limitate fn := χFn · f come detto sopra, in modo tale che 0 ≤ |fn (x)| ≤ |fn+1 (x)| → |f(x)| per n → +∞. Per il teorema della convergenza monotona, tenendo conto del fatto che f ∈ L2 (X, dμψ ), troviamo: |f(x)|d|μφ,ψ (x)| = lim |fn (x)|d|μφ,ψ (x)| X
≤ ||φ|| lim
n→+∞
n→+∞
X
X
!
! |fn
(x)|2 dμ
ψ (x)
Questo prova la tesi nel caso generale.
= ||φ||
X
|f(x)|2 dμψ (x) < +∞ .
Il seguente teorema mette insieme i risultati tecnici della precedente discussione, enunciando le prime propriet` a generali degli integrali di funzioni non limitate rispetto ad una misura spettrale. Teorema 9.3. Sia X spazio topologico a base numerabile, B(X) la sua σalgebra di Borel di X, H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C Borel misurabile si definisca:
Δf := ψ ∈ H
|f(x)|2 dμψ (x) < +∞ . (9.6) X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
Valgono allora i seguenti fatti. (a) Δf `e un sottospazio denso di H. (b) L’applicazione: f(x)dP (x) : Δf ψ → f(x)dP (x)ψ , X
377
(9.7)
X
con secondo membro definito in (9.4), per una qualsiasi successione di funzioni misurabili limitate {fn }n∈N convergente a f in L2 (X, μψ ), definisce un operatore lineare. (c) Se fsupp(P ) `e limitata allora: Δf = H
e
f(x)dP (x) = X
supp(P )
f(x)dP (x) ∈ B(H) ,
dove il secondo membro della seconda identit` a `e l’operatore definito in (c) di definizione 8.27. Dimostrazione. (a) e (b). Dobbiamo per prima cosa provare che, per ogni fissata f : X → C misurabile, se φ, ψ ∈ Δf allora φ + ψ ∈ Δf e cφ ∈ Δf per c ∈ C arbitrario. Si osservi che Δf contiene almeno il vettore nullo di H per cui `e non vuoto. Se φ, ψ ∈ Δf e E ∈ B(X) si ha: ||PE (φ + ψ)||2 ≤ (||PE φ|| + ||PE ψ||)2 ≤ 2||PE φ||2 + 2||PE ψ||2 , da cui, essendo μχ (E) = (χ|PE χ) = (χ|PE PE χ) = (PE χ|PE χ) = ||PE χ||2, si ha: μφ+ψ (E)2 ≤ 2(μφ (E) + μψ (E)) . Questa identit` a implica che, se L2 (X, μφ) f e L2 (X, μψ ) f, allora vale 2 anche L (X, μφ+ψ ) f. Cio`e, se φ, ψ ∈ Δf allora φ + ψ ∈ Δf . D’altra parte, essendo μcφ(E) = |c|2 (PE φ|φ) = |c|2 μφ (E), `e chiaro che f ∈ L2 (X, μcφ) se f ∈ L2 (X, μφ ) e c ∈ C. Cio`e, se φ∈ Δf allora cφ ∈ Δf . Quindi Δf `e un sottospazio. Il fatto che l’applicazione X f(x)dP (x) : Δf ψ → X f(x)dP (x)ψ sia lineare segue immediatamente dal fatto che l’integrale di una funzione limitata rispetto ad una PVM `e un operatore lineare. Passiamo a provare che Δf `e denso in H. Fissata f come nelle ipotesi, si definisca: En := {x ∈ X | n − 1 ≤ |f(x)| < n} ,
per ogni n ∈ N con n ≥ 1.
Si osservi che En ∩ Em = ∅ se n = m e ∪n En = X. Della definizione 8.21 segue immediatamente che i sottospazi chiusi Hn := P (En )H sono a due a due ortogonali e, per la propriet` a (d) della suddetta definizione, le combinazioni lineari finite di elementi di tutti gli spazi Hn definiscono un sottospazio denso
378
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
in H. Mostriamo che Δf contiene tali combinazioni lineari. Dal teorema della convergenza monotona, se ψ ∈ H: X
2
|f(x)| dμψ (x) = lim
k→+∞
k n=1
X
|χEn (x)f(x)|2 dμψ (x) ≤ +∞ .
(9.8)
L’integrale nella sommatoria pu` o essere trascritto, usando (b) in teorema 8.32:
χEn (x)f(x)dP (x)ψ χEn (x)f(x)dP (x)ψ . X
X
D’altra parte, visto che x → χEn (x)f(x) `e limitata e χEn = χEn · χEn , usando (iii) in (a) di teorema 8.32 si ha: χEn (x)f(x)dP (x)ψ = χEn (x)f(x)dP (x) χEn (x)dP (x)ψ X
X
= X
X
χEn (x)f(x)dP (x) ◦ P (En )ψ .
a: Se quindi ψ ∈ Hn , essendo i proiettori P (Em ) ortogonali a due a due, varr` χEk (x)f(x)dP (x)ψ = 0, se k = n . X
Di conseguenza, nelle ipotesi dette per ψ, la serie in (9.8) si riduce a: 2 2 |f(x)| dμψ (x) = |χEn (x)f(x)| dμψ (x) ≤ n2 dμψ (x) = n2 ||ψ||2 < +∞. X
X
X
Concludiamo che Hn ⊂ Δf , per ogni n = 1, 2, . . .. Dato che Δf `e un sottospazio conterr`a anche il sottospazio denso delle combinazioni lineari finite di elementi di tutti gli spazi Hn . Pertanto Δf `e denso. (c). Per f : X → C, definiamo: Fk := {x ∈ X | |f(x)| < k} .
(9.9)
Supponiamo ora che f supp(P ) sia limitata. Definiamo le funzioni misurabili limitate: fn := χsupp(P ) · f + gn dove gn = χFn · χX\supp(P ) · f. In tal caso, essendo supp(μψ ) ⊂ supp(P ) per (v) del teorema 8.30, per ogni ψ ∈ H, avremo f ∈ L2 (X, μψ ), e quindi Δf = H, dato che μf `e finita, e: |fn (x) − f(x)|2 dμψ (x) = |f(x) − f(x)|2 dμψ (x) = 0 . X
supp(P )
Di conseguenza, banalmente, fn → f nel senso di L2 (X, μψ ) per ogni ψ ∈ H e quindi: f(x)dP (x)ψ := lim fn (x)dP (x)ψ = lim χsupp(P ) fn (x)dP (x)ψ X
n→+∞
X
n→+∞
X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
= lim
n→+∞
379
X
χsupp(P ) f(x)dP (x)ψ =
X
χsupp(P ) f(x)dP (x)ψ
f(x)dP (x)ψ ,
=: supp(P )
dove l’ultimo integrale `e definito nel senso di (c) di definizione 8.27 e pertanto l’operatore supp(P ) f(x)dP (x) `e in B(H). Passiamo al successivo teorema che, in particolare, precisa le varie propriet`a di composizione degli integrali di misure spettrali, caratterizzando in modo molto preciso i domini degli operatori coinvolti. In riferimento all’enunciato, ricordiamo che, per una coppia di operatori A e B la notazione A ⊂ B significa che l’operatore B `e un’estensione dell’operatore A (vedi definizione 5.2). Teorema 9.4. Sia X spazio topologico a base numerabile, B(X) la sua σalgebra di Borel di X, H spazio di Hilbert e P : B(X) → B(H) una PVM. Per ogni f : X → C Borel misurabile, usando le stesse notazioni del teorema 9.3, valgono i seguenti fatti. (a) X f(x)dP (x) : Δf → H `e un operatore chiuso. (b) X f(x)dP (x) `e autoaggiunto se f `e reale e pi` u in generale:
∗ f(x)dP (x) = f(x)dP (x) e risulta Δf = Δf . (9.10) X
X
(c) Se f : R → C e g : R → C sono misurabili, D denota il dominio naturale (definizione 5.1) e f · g il prodotto punto per punto: f(x)dP (x) + g(x)dP (x) ⊂ (f + g)(x)dP (x) (9.11) X
D
X
X
f(x)dP (x) + g(x)dP (x) = Δf ∩ Δg
X
dove = sostituisce ⊂ in (9.11) se e solo se Δf+g = Δf ∩ Δg . f(x)dP (x) g(x)dP (x) ⊂ (f · g)(x)dP (x) X
D
(9.12)
X
X
f(x)dP (x) g(x)dP (x) = Δf·g ∩ Δg
X
(9.13)
X
(9.14)
X
dove = sostituisce ⊂ in (9.13) se e solo se Δf·g ⊂ Δg . In particolare: f(x)dP (x) f(x)dP (x) = |f(x)|2 dP (x) (9.15) X
D
X
X
f(x)dP (x) f(x)dP (x) = Δ|f|2 .
X
X
(9.16)
380
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Inoltre:
X
f(x)dP (x) g(x)dP (x) Δf ∩Δg ∩Δf·g
=
X
X
g(x)dP (x) f(x)dP (x) Δf ∩Δg ∩Δf·g .
(9.17)
X
Infine, se f `e limitata sul boreliano E ⊂ X, allora ΔχE ·f = H e: χE (x)dP (x) f(x)dP (x) ⊂ f(x)dP (x) χE (x)dP (x) X
X
X
X
= (χE · f)(x)dP (x) ∈ B(H). X
(d) Se X = R, p : R → C `e un polinomio di grado m ∈ N e T := allora: p(T ) = p(x)dP (x) e vale D(p(T )) = D(T m ) = Δp .
(9.18) X
xdP (x),
(9.19)
R
(e) Definita μφ,ψ come in (c) del teorema 8.30, X f(x)dP (x) `e l’unico operatore in H con dominio Δf tale che, per ogni ψ ∈ Δf e φ ∈ H:
f(x)dμφ,ψ (x) . (9.20) φ f(x)dP (x)ψ = X
X
(f ) Per ogni ψ ∈ Δf si ha:
2
f(x)dP (x)ψ
= |f(x)|2 dμψ (x) .
X
(g) L’operatore
X
(9.21)
X
f(x)dP (x) `e positivo per f positiva, cio`e:
ψ
f(x)dP (x)ψ ≥ 0 per ogni ψ ∈ Δf , se f(x) ≥ 0 per x ∈ X. (9.22) X
(h) Se X `e uno spazio topologico a base numerabile e φ : X → X `e Borelmisurabile (cio`e φ−1 (E ) ∈ B(X) se E ∈ B(X )), allora B(X ) E → P (E ) := P (φ−1 (E )) `e una PVM su X e, per ogni funzione Borel-misurabile f : X → C: f(x )dP (x ) = (f ◦ φ)(x)dP (x) e vale Δf = Δf◦φ , X
X
avendo indicando con Δf il dominio dell’operatore di sinistra.
(9.23)
9.1 Teorema spettrale per operatori autoaggiunti non limitati
381
Dimostrazione. Prima di tutto notiamo che (f) segue immediatamente per continuit` a dalla analoga propriet` a, valida per funzioni limitate, stabilita in (b) del teorema 8.32, usando la nostra definizione di integrale di funzioni non limitate. Nello stesso modo (b) del teorema 8.30 implica (g). Infatti se f ≥ 0, ψ ∈ Δf , la successione di funzioni χFn · fn ≥ 0 converge a f in L2 (X, μψ ) per cui:
0 ≤ ψ (χFn · f(x))dP (x)ψ → ψ f(x)dP (x)ψ , se n → +∞, X X e quindi ψ X f(x)dP (x)ψ ≥ 0. Passiamo ai rimanenti punti. (a). Mostriamo che T := X f(x)dP (x) definito su Δf `e un operatore chiuso. Per dimostrare questo cominciamo con il notare che, se definiamo gli operatori limitati (con gli Fk definiti in (9.9)): χFk (x)f(x)dP (x) , (9.24) Tk := X
allora, per ogni ψ ∈ Δf , vale: (1) T PFk ψ = PFk T ψ = Tk ψ e (2) Tk ψ → T ψ per k → +∞. La dimostrazione di (1) si ottiene similmente a quella di (c) del teorema 9.3, mentre quella di (2) segue dalla discussione che precede l’enunciato del lemma 9.2. Sia quindi {ψn }n∈N ⊂ Δf tale che ψn → ψ ∈ H e T ψn → φ, per n → +∞. Mostriamo che ψ ∈ Δf e T ψ = φ dimostrando, in tal modo, la chiusura di T . Vale, per (1) e per il fatto che PFk → I in senso forte se k → +∞: Tk ψ = lim Tk ψn = lim PFk T ψn = PFk φ → φ in H se k → +∞. n→+∞
n→+∞
Se definiamo φk := Tk ψ e teniamo conto di quanto abbiamo appena trovato, abbiamo che: χFk (x)f(x)dP (x)ψ = φk → φ in H se k → +∞. (9.25) X
Quindi, da (b) del teorema 8.32: χFk (x)|f(x)|2 dμψ (x) = ||φk ||2 → ||φ||2 < +∞ X
se n → +∞.
Il teorema della convergenza monotona assicura allora che f ∈ L2 (X, μψ ), cio`e che ψ ∈ Δf . Riscrivendo l’identit` a in (9.25) come Tk ψ = φk e calcolando il limite per k → +∞ usando (2), abbiamo infine che: T ψ = φ, che `e quanto volevamo provare. (b). Il fatto che Δf = Δf `e una ovvia conseguenza della definizione di Δf e ∗ del fatto che |f| = |f |. Mostriamo ora che X f(x)dP (x) ⊂ X f(x)dP (x) . Infatti, se ψ ∈ Δf , φ ∈ Δf e fn → f in L2 (X, μφ ) e quindi fn → f in L2 (X, μψ ), dove le fn sono limitate, vale:
ψ
f(x)dP (x)φ = lim ψ
fn (x)dP (x)φ X
n→+∞
X
382
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
= lim
n→+∞
X
fn (x)dP (x)ψ
φ = f(x)dP (x)ψ
φ X
dove abbiamo usato la definizione dell’integrale di f e f rispetto a P e la propriet` a (iv) in (a) del teorema 8.32 degli integrali di funzioni limitate fn . ∗ Quanto trovato significa che X f(x)dP (x) ⊂ X f(x)dP (x) . Mostriamo ora ∗ che vale anche l’inclusione: X f(x)dP (x) ⊃ X f(x)dP (x) provando che: ∗ ⊂ Δf . Definiamo T := X f(x)dP (x) e gli operatori D X f(x)dP (x) limitati Tk come in (9.24). Fissiamo ψ ∈ D(T ∗ ). Allora esiste h ∈ H tale che, per ogni φ ∈ Δf : (ψ|T φ) = (h|φ). Scegliendo φ = Tk∗ ψ otteniamo (ψ|Tk Tk∗ ψ) = (h|Tk∗ ψ), dove abbiamo usato T Tk∗ = Tk Tk∗ che si prova da Tk∗ = PFk Tk∗ , che segue subito da T PFk = Tk vista sopra. Abbiamo trovato che: ||Tk∗ ψ||2 = (h|Tk∗ ψ). Allora ||Tk∗ψ||2 ≤ ||Tk∗ψ|| ||h||, cio`e ||Tk∗ψ|| ≤ ||h||. Di conseguenza, usando (b) del teorema 8.32: χFk (x)|f(x)|2 dμψ (x) ≤ ||h||2 per ogni k ∈ N, X
che implica che ψ ∈ Δf , per il teorema della convergenza monotona. Abbiamo provato che D(T ∗ ) ⊂ Δf che era quanto volevamo provare. (c). Le formule (9.11), (9.12) ed il commento sotto di esse seguono banalmente dalle definizioni date e dalla definizione di dominio naturale. Passiamo a dimostrare (9.13) e (9.14). Assumiamo inizialmente che f sia limitata in modo tale che Δf·g ⊂ Δg , e ψ ∈ Δg . Sia {gn }n∈N una successione di funzioni misurabili limitate che converge a g in L2 (X, dμg ). Allora f · gn → f · g in L2 (X, dμg ) e quindi, tenendo conto che gli integrali di f, gn , f · gn sono tutti nel senso della definizione 8.27 e che vale (iii) di (a) del teorema 8.32, abbiamo subito che per n → +∞: f(x)dP (x) gn (x)dP (x)ψ = (f · gn )(x)dP (x)ψ → (f · g)(x)dP (x)ψ. X
Dato che
X
X
X
X
fdP `e continua, abbiamo provato che se f `e limitata e ψ ∈ Δg : f(x)dP (x) g(x)dP (x)ψ = (f · g)(x)dP (x)ψ . (9.26)
X
X
X
Se ora φ := X gdP ψ, tenendo conto di (f), l’identit` a trovata mostra che: |f(x)|2 dμφ (x) = |(f · g)(x)|2 dμψ (x) se f `e limitata e ψ ∈ Δg . (9.27) X
X
Sia ora f misurabile arbitraria e quindi, eventualmente, illimitata. Dato che (9.27) vale per ogni funzione limitata, varr` a anche per quelle illimitate. Dato che
D
f(x)dP (x) X
g(x)dP (x) X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
383
contiene tutti i vettori ψ ∈ Δg tali che φ ∈ Δf e che questo succede, per (9.27), se e solo se ψ ∈ Δf·g , noi concludiamo che:
D f(x)dP (x) gdP (x) = Δg ∩ Δf·g . X
X
Se ora φ ∈ Δg ∩ Δf·g , se ψ = X g(x)dP (x)φ, e se fn := χFn · f (con gli insiemi Fn definiti come fatto precedentemente), allora fn → f in L2 (X, μψ ), fn · g → f · g in L2 (X, μφ) e ora (9.26) e (f) (con fn al posto di f) implicano che: f(x) dP (x) g(x) dP (x)φ = f(x) dP (x)ψ = lim fn (x) dP (x)ψ = X
X
= lim
n→+∞
n→+∞
X
X
(fn · g)(x) dP (x)φ =
X
X
(f · g)(x) dP (x)φ .
Questo conclude la dimostrazione di (9.13) e (9.14). L’inclusione (9.13) unitamente al fatto che in essa = si sostituisce a ⊂ se e solo se Δg ⊃ Δf·g , implica facilmente (9.17) e (9.18). Riguardo a (9.17), vale Δf ⊃ Δf·f = Δ|f|2 dal momento che, essendo μψ finita, se ψ ∈ Δ|f(x)|2 X
|f(x)|2 dμψ (x) =
! ≤
X
X
|f(x)|2 · 1dμψ (x)
! |f(x)|4 dμψ (x)
X
12 dμψ (x) < +∞ .
(d). Cominciamo a notare che, in base a (9.13) e (9.11), vale: p(x) dP (x) . p(T ) ⊂ X
Di conseguenza, la tesi `e vera quando D(p(T )) = Δp . Dimostriamo questa identit` a cominciando a provare che vale: D(T n ) = Δxn
per n ∈ N.
(9.28)
La prova si ottiene per induzione come segue. Per n = 0, 1, l’identit` a `e vera: D(T 0 ) = Δ1 = H, D(T ) = Δx. Assumiamo che sia vera per n e proviamo che lo `e per n + 1: D(T n+1 ) = Δxn+1 . Dobbiamo cio`e provare che D(T T n ) = Δx◦xn . Usando la specificazione sui domini subito dopo (9.14), sappiamo che questo `e vero se e solo se Δx◦xn ⊂ Δxn . Questa inclusione `e verificata dal momento che μψ `e sempre una misura positiva finita e |xn+1 | > |xn | fuori da un compatto J ⊂ R per cui, se ψ ∈ Δxn+1 , allora: 2n 2n |x| dμψ (x) = |x| dμψ (x) + |x|2ndμψ (x) R
R\J
J
384
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
≤ ≤
R
R\J
|x|
|x|2n+2dμψ (x) + sup |x|2n J
2n+2
dμψ (x) + sup |x|
2n
J
1dμψ (x) J
R
1dμψ (x) < +∞ .
Si osservi che, dato che sar`a utile tra poco, abbiamo in particolare verificato che: D(T n+1 ) = Δxn+1 ⊂ Δxn = D(T n ) . Per concludere la dimostrazione di D(p(T )) = Δp , calcoliamo separatamente i due membri e proviamo che coincidono. Sia am = 0 il coefficiente di grado massimo del polinomio p. Dato che D(T n+1 ) ⊂ D(T n ) e che, nel caso generale, D(A + B) = D(A) ∩ D(B), abbiamo immediatamente che: D(p(T )) = D(T m ) .
(9.29)
Passiamo a calcolare Δp . Dato che Δxn+1 ⊂ Δxn si ha subito che Δxm ⊂ Δp . Dimostriamo l’inclusione opposta. Dato che |p(x)|/|x|m → |am | se |x| → +∞, risulta che: |p(x)|/|x|m ≤ |am | + > 0, per ogni > 0, se x `e fuori da un certo compatto sufficientemente grande J ⊂ R. Pertanto, se ψ ∈ Δp , allora: |x|2mdμψ R
|p(x)|2 2m ≤ |x| dμψ + |x| dμψ ≤ dμψ + sup |x| dμψ 2 J R\J J R\J (|am | + ) R 1 2 2m ≤ |p(x)| dμ + sup |x| dμψ < +∞ , ψ (|am | + )2 R J R
2m
2m
e quindi ψ ∈ Δxm . Concludiamo che Δp ⊂ Δxm e quindi Δp = Δxm . Da (9.28) e (9.29) abbiamo infine che Δp = Δxm = D(T m ) = D(p(T )) e questo conclude la dimostrazione. (e). Definiamo le solite funzioni limitate fn := χFn · f che tendono a f nel senso di L2 (X, μψ ). Abbiamo allora che, tenendo conto della definizione di integrale di f, ma anche di (iv) in (c) nel teorema 8.30:
φ
f(x)dP (x) ψ = lim φ
fn (x)dP (x) ψ n→+∞
X
X
= lim
n→+∞
X
fn (x)dμφ,ψ (x) .
Per concludere, proviamo che: lim (fn (x) − f(x))dμφ,ψ (x) = 0 . n→+∞
X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
385
Infatti dal lemma 9.2 (usando le stesse notazioni usate nella dimostrazione del lemma):
(fn (x) − f(x))dμφ,ψ (x) = (fn (x) − f(x))h(x)d|μφ,ψ (x)|
X
X
!
≤
X
|fn (x) − f(x)|d|μφ,ψ (x)| ≤ ||φ||
X
|fn (x) − f(x)|2 dμψ (x) → 0
per n → +∞, dalla definizione di X f(x)dP (x)ψ. La propriet` a di unicit` a segue ora immediatamente. Se T : Δf → H soddisfa la stessa propriet`a di f(x)dP (x), allora T := T − X f(x)dP (x) verifica (φ|T ψ) = 0 per ogni X φ ∈ H, qualunque sia ψ ∈ Δf . Pertanto, scegliendo φ = T ψ, risulta ||T ψ|| = 0 e dunque T = X f(x)dP (x). (f). Diamo solo una traccia della dimostrazione, dal momento che `e elementare anche se lunga. Il fatto che P sia un PVM si verifica subito, controllando che tutte le richieste siano soddisfatte. Se f `e una funzione semplice, l’asserto (9.23) vale banalmente. Usando la definizione 8.27, si generalizza facilmente (9.23) alle funzioni misurabili limitate e quindi, facendo uso della definizione di integrale che abbiamo dato sopra nel caso di f misurabile non limitata, (9.23) si estende al caso generale. Corollario 9.5. Nelle ipotesi del teorema 9.3, se f : X → C `e Borel misurabile, i seguenti fatti sono equivalenti. (a) Δf = H. (b) f `e essenzialmente limitata rispetto alla PVM P (vedi definizione 8.22). (c) X f(x)dP (x) ∈ B(H). Se vale (a),(b) e (c) allora:
(P ) ||f||∞ ≤
fdP
. X
Dimostrazione. Si noti che (a) e (c) u del teorema sono equivalenti in virt` 2.104 del grafico chiuso, dato che X fdP `e chiuso per (a) del teorema 9.4. Dimostriamo che (b) implica (c). Definiamo Fn := {x ∈ X | |f(x)| < n}. Allora, se fn := χFn · f, vale fn → f puntualmente per n → +∞. Se f `e essenzialmente limitata allora, se n `e abbastanza grande f − fn `e diverso da 0 su un insieme Gn ∈ B(X) con P (Gn ) = 0. Pertanto: f + (−fn )dP = χGn (f − fn )dP = f − fn dP χGn dP X
X
=
X
f − fn dP
X
X
P (Gn ) = 0 .
Dunque, per (c) del teorema 9.4, X f(x)dP (x) = − X (−fn (x))dP (x) che `e in B(H) (essendo −fn ) limitata, per (c) del teorema 9.3. Proviamo ora che
386
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
se vale (c) allora vale (b). Consideriamo ora f : X → C Borel sommabile, senza ipotesi di limitatezza ed assumiamo che valga (c) (che `e equivalente ad (a)). Consideriamo la solita successione di funzioni definite sopra fn ∈ Mb (X). Vale, per (8.40):
(P )
||fn ||∞ =
fχn dP
=
fdP χFn dP
≤
fdP
χFn dP
X
X
X
≤
fdP
=: M < +∞ .
X
X
X
Si osservi ora che, per costruzione: {x ∈ X | |f(x)| ≥ M } ⊂ ∪n∈N {x ∈ X | |fn (x)| ≥ M }. Pertanto, per isotonia e subadditivit` a: (ψ|P ({x ∈ X | |fn (x)| ≥ M })ψ) = 0 , (ψ|P ({x ∈ X | |f(x)| ≥ M }ψ) ≤ n∈N (P )
che significa che ||f||∞ ≤ M < +∞ come volevamo.
Possiamo ora dare la seguente definizione basata sulla (9.7), che estende la nozione di integrale di una funzione rispetto ad una PVM. Possiamo anche sfruttare la propriet` a (e) del teorema 9.4 per dare una definizione equivalente pi` u elegante. Definizione 9.6. Siano X uno spazio topologico a base numerabile, H uno spazio di Hilbert e P : B(X) → B(H) una misura a valori di proiezione. (a) Se f : X → C `e una funzione misurabile con Δf definito come in (9.6), l’operatore X
f(x)dP (x) : Δf → H
definito in (9.7) `e detto integrale di f rispetto alla misura a valori di proiezione P . Equivalentemente, X f(x)dP (x) `e definibile come l’unico operatore S : Δf → H che soddisfa: (φ |Sψ ) = f(x)dμφ,ψ (x) , per ogni φ ∈ H e ogni ψ ∈ Δf , X
dove la misura complessa spettrale μφ,ψ `e definita in (c) del teorema 8.30. (b) Per ogni E ⊂ B(X) e per ogni f : X → C Borel misurabile oppure g : E → C Borel misurabile, gli integrali: f(x) dP (x) := χE (x)f(x) dP (x) e g(x) dP (x) := g0 (x) dP (x) , E
X
E
X
dove g0 (x) := g(x) se x ∈ E oppure g0 (x) := 0 se x ∈
E, sono detti, rispettivamente, integrale di f su E e integrale di g su E (rispetto PVM P ).
9.1 Teorema spettrale per operatori autoaggiunti non limitati
387
Osservazioni 9.7. (1) Per (c) del teorema 9.3, la definizione data estende quella gi` a data in definizione 8.27 per il caso di funzioni limitate. (2) Con la definizione data, per ogni f : X → C Borel misurabile, vale: f(x)dP (x) = f(x)dP (x) e quindi f(x)dP (x) = 0 . X
supp(P )
X\supp(P )
(9.30) La prova `e immediata: dato che χsupp(P ) `e limitata, possiamo calcolarne l’integrale usando la definizione valida per funzioni limitate per le quali, direttamente dalla definizione (usando il fatto che χsupp(P ) `e una funzione semplice): 1dP := χsupp(P ) dP = P (supp(P )) = I , supp(P )
X
dove abbiamo usato (c) di proposizione 8.23 nell’ultimo passaggio. A questo punto usando la seconda identit` a in (9.18): f(x)dP (x) = f(x)dP (x) χsupp(P ) (x)dP (x)
X
= supp(P )
X
X
χsupp(P ) (x)f(x)dP (x) =:
f(x)dP (x) . supp(P )
L’altra identit` a in (9.30) segue nello stesso modo usando P (X \ supp(P )) = 0. Esempi 9.8. (1) Consideriamo la misura spettrale: P : B(N ) E → PE =
z(z| )
z∈E
introdotta in (2) di esempi 8.29 su una base hilbertiana N di uno spazio di Hilbert separabile H, dotando N di struttura di spazio topologico a base numerabile con la topologia banale dell’insieme delle parti. Ci interessa arrivare a scrivere una formula esplicita per l’integrale di funzioni f : N → C non limitate, facendo uso della 2 definizione (9.4). Nel caso che stiamo studiando, la condizione |f(z)| dμψ (z) < +∞ si specializza nella richieN 2 2 sta |f(z)| |(z|ψ)| < +∞. Vogliamo mostrare che, anche nel caso di z∈N funzioni f illimitate, si ottiene ancora la formula: f(z)dP (z) = sf(z)z(z| ) , N
z∈N
provata in (2) di esempi 8.29 per funzioni f limitate. Infatti, se {Nn }n∈N `e una classe di sottoinsiemi finiti di N con Nn+1 ⊃ Nn e ∪n∈N Nn = N , la successione
388
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
di funzioni limitate fn := nel senso della norma L2 (N, μψ ), χNn · f2 converge 2 per ogni ψ ∈ H tale che z |f(z)| |(z|ψ)| < +∞, come semplice applicazione del teorema della convergenza dominata di Lebesgue. Pertanto, in base alla definizione (9.4) adottata per l’integrale di una funzione non limitata rispetto ad una PVM, abbiamo che, se z∈N |f(z)|2 |(z|ψ)|2 < +∞, allora: f(z)dP (z)ψ := lim fn (z)dP (z)ψ . (9.31) n→+∞
N
N
D’altra parte, dato che fn `e limitata, per quanto provato in (2) di esempi 8.29: fn (z)dP (z)ψ = sfn (z)(z|ψ) = f(z)z(z|ψ) , N
z∈N
z∈Nn
dove, nella seconda identit` a la somma `e finita, dato che Nn contiene un numero finito di punti. La definizione (9.31) si riduce allora a: f(z)dP (z)ψ = lim f(z)z(z|ψ) , n→+∞
N
cio`e:
f(z)dP (z) = sN
z∈Nn
f(z)z(z| ) .
(9.32)
z∈N
Nella prossima sezione vedremo un esempio concreto di operatore autoaggiunto non limitato costruito con questo tipo di misura spettrale. (2) In riferimento a (1) in esempi 8.29, consideriamo la stessa misura spettrale definita in quell’esempio. Consideriamo quindi uno spazio di Hilbert H = L2 (X, μ), dove X `e uno spazio topologico a base numerabile e μ `e una misura sulla σ-algebra di Borel di X. La misura spettrale su H che vogliamo prendere in considerazione si ottiene definendo, per ogni ψ ∈ L2 (X, μ) e E ∈ B(X): (P (E)ψ)(x) := χE (x)ψ(x) ,
per quasi ogni x ∈ X .
(9.33)
Si osservi che in questo caso, se ψ ∈ H, la misura μψ risulta: |ψ(x)|2 dμ(x) , per ogni E ∈ B(X) . μψ (E) = (ψ|P (E)ψ) = E
Di conseguenza, se g : X → C `e Borel misurabile, risulta che: g(x)dμψ (x) = g(x)|ψ(x)|2 dμ(x) . X
X
Abbiamo provato in (1) in esempi 8.29, che se f : X → C `e Borel misurabile e limitata, allora:
f(y) dP (y)ψ (x) = f(x)ψ(x) per ogni ψ ∈ L2 (X, μ), X
9.1 Teorema spettrale per operatori autoaggiunti non limitati
per quasi ogni x ∈ X.
389
(9.34)
Mostriamo che il risultato si generalizza a funzioni Borel misurabili non limitate, purch`e ψ ∈ Δf . Se f : X → C `e misurabile non limitata, consideriamo una successione di funzioni misurabili limitate fn tali che fn → f per n → +∞ nel senso di L2 (X, μψ ), quando ψ ∈ Δf . In altre parole, in base all’espressione esplicita della misura μψ ottenuta sopra, deve essere: |fn (x) − f(x)|2 |ψ(x)|2 dμ(x) → 0 per n → +∞. X
Tenendo conto di (9.34) risulta allora immediatamente che: |f(x) − fn (x)|2 |ψ(x)|2 dμ(x) → 0 per n → +∞. ||f · ψ − fn · ψ||2H = X
Conseguentemente, in base alla definizione di integrale di f rispetto a P , concludiamo che: per ogni ψ ∈ Δf , dove f : X → C `e misurabile anche non limitata, vale sempre:
f(x)dP (x)ψ (y) = f(y)ψ(y) per quasi ogni y ∈ X. (9.35) X
9.1.2 Teorema di decomposizione spettrale per operatori autoaggiunti non limitati Siamo ora in grado di enunciare e provare il teorema di decomposizione spettrale per operatori autoaggiunti non limitati. Ci limiteremo ad enunciare e provare tale teorema per il caso di operatori non limitati autoaggiunti. Tuttavia `e possibile estendere il risultato agli operatori non limitati normali [Rud91]. Teorema 9.9. (Decomposizione spettrale per operatori autoaggiunti non limitati.) Sia T operatore autoaggiunto (non necessariamente limitato) nello spazio di Hilbert H. Valgono i seguenti fatti. (a) Esiste ed `e unica una PVM, P (T ) : B(R) → B(H), tale che: λ dP (T )(λ) . (9.36) T = R
(b) Vale l’identit` a:
supp(P (T ) ) = σ(T )
(9.37)
e valgono, in particolare, i seguenti fatti: (i) λ ∈ σp (T ) se e solo se P (T )({x}) = 0, (ii) λ ∈ σc (T ) se e solo se P (T ) ({x}) = 0 e, per ogni aperto Ax ⊂ R con Ax x, risulta P (T )(Ax ) = 0, (iii) se λ ∈ σ(T ) `e un punto isolato, allora λ ∈ σp (T ), (iv) se λ ∈ σc (T ), allora, per ogni > 0, esiste φ ∈ D(T ) con ||φ|| = 1 e 0 < ||T φ − λφ || ≤ .
390
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Dimostrazione. (a) Sia V la trasformata di Cayley di T . V `e un operatore unitario per il teorema 5.33, dato che T `e autoaggiunto. Se S1 := {(x, y) ∈ R2 | x2 +y2 = 1}, definiamo X := S1 \{(1, 0)} e nel seguito z = x+iy. Dotiamo X della topologia indotta da R2 (o, che `e lo stesso, da S1 ) e consideriamone (V ) la σ-algebra di Borel B(X) ⊂ B(S1 ). Sia infine P0 la misura spettrale di 1 V in S , che esiste per (a)’ nel teorema 8.34 di decomposizione spettrale. Se z = x + iy, vale dunque: (V ) V = zdP0 (x, y) . (9.38) S1
I − V `e iniettiva per (i) in (b) del teorema 5.33 e di conseguenza 1 = 1 + (V ) (V ) i0 ∈ σp (V ) = supp(P0 ). A sua volta questo implica che P0 ({(1, 0)}) = 0 per (ii) in (b) di teorema 8.34. Consideriamo allora la classe di proiettori ortogonali: (V ) P (V ) : B(X) E → P0 (E) ∈ P(H) , dove abbiamo tenuto conto del fatto che B(X) ⊂ B(S1 ). Si verifica subito che P (V ) `e una PVM su X, dato che tutte le richieste della definizione di PVM (definizione 8.21) sono automaticamente soddisfatte per costruzione, eccetto (V ) P (V ) (X) = I che comunque `e vera dato che P0 ({(1, 0)}) = 0: (V )
P (V ) (X) := P0 (V )
= P0
(V )
(X) = P0
(V )
(S1 ) − P0
(S1 \ {(1, 0)})
({(1, 0)}) = I − 0 = I .
Per lo stesso motivo, l’integrale di una funzione s semplice su S1 rispetto a (V ) P0 coincide banalmente con quello di sX rispetto a P (V ) . Dalla costruzione dell’integrale di funzioni limitate, segue immediatamente che, se f ∈ Mb (S1 ), (V ) e quindi fX ∈ Mb (X), allora X fX dP (V ) = X fdP0 . Tenendo infine conto del fatto che, con ovvie notazioni, comunque scegliamo φ, ψ ∈ H e E ⊂ B(S1 ): (P (V ) )
μφ,ψ
(V )
(E \ {(1, 0)}) = (φ|P (V ) (E \ {(1, 0)})ψ) = (φ|P0 (V )
= (φ|P0
(P
(V )
(E)ψ) = μφ,ψ0
)
(E \ {(1, 0)})ψ)
(E) ,
applicando la definizione di integrale di funzioni misurabili si trova che deve (V ) valere X f X dP (V ) = X fdP0 per ogni f : S1 → C Borel misurabile. In particolare quindi, da (9.38) e omettendo di scrivereX per semplicit`a: V = zdP (V ) (x, y) . (9.39) X
Definiamo ora la funzione a valori in R, misurabile non limitata su X: f(z) := i
1+z 1−z
z ∈X,
(9.40)
9.1 Teorema spettrale per operatori autoaggiunti non limitati
391
e quindi integriamola rispetto alla misura spettrale P (V ) su X, ottenendo l’operatore (non limitato in generale): T := f(z)dP (V ) (x, y) . (9.41) X
Dato che f assume valori reali (quando (x, y) ∈ X), l’operatore T `e necessariamente autoaggiunto per (b) di teorema 9.4. L’identit`a f(z)(1−z) = i(1+z), in virt` u di (c) del teorema 9.4, implica (si tenga conto che la condizione perch´e valga = al posto di ⊂ nella (9.13) `e soddisfatta, come si prova facilmente): T (I − V ) = i(I + V ) .
(9.42)
In particolare (9.42) implica che Ran(I − V ) ⊂ Δf =: D(T ). Dal teorema 5.33 sappiamo per`o che vale anche: T (I − V ) = i(I + V )
e D(T ) = Ran(I − V ) ⊂ Δf .
Per confronto con (9.42), concludiamo che T deve essere un’estensione autoaggiunta di T . Dato che T = T ∗ e quindi non ammette estensioni autoaggiunte proprie ((c) in proposizione 5.16), deve essere T = T . Abbiamo ottenuto che: T = f(z)dP (V ) (x, y) . (9.43) X
La funzione f : X → R `e in realt` a biettiva e pertanto ricopre tutto R. Applicando allora (h) del teorema 9.4, abbiamo finalmente che: B(R) E → P (T )(E) := P (V ) (f −1 (E)) `e una PVM su R ed inoltre (9.43) pu` o essere riscritta come la (9.36): λdP (T ) (λ) .
T = R
Questo `e lo sviluppo spettrale che volevamo provare esistere. Passiamo all’unicit` a della misura spettrale che soddisfa (9.36). Sia P una PVM su R con: T = λdP (λ) . R
La trasformata di Cayley si pu`o allora scrivere, in base a (c) del teorema 9.4: λ−i V = (T − iI)(T + iI)−1 = dP (λ) . λ + i R Usando (h) dello stesso teorema e dove f : X → R `e la stessa funzione biettiva misurabile con inversa misurabile, definita in (9.40): V = zdP (f(x, y)) , X
392
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dove B(X) F → Q(F ) := P (f(F )) risulta essere una PVM su X, che possiamo estendere in modo ovvio ad una PVM su S1 definendo Q0 (F ) := Q(F \ {(1, 0)}) per ogni F ∈ B(S1 ) e quindi ottenere: V = zdQ0 (x, y) . S1
Dato che vale anche (9.38), per l’unicit` a della misura spettrale associata ad un operatore normale limitato per il teorema 8.34, deve accadere che: (V ) Q0 (F ) = P0 (F ) per ogni boreliano di S1 e quindi Q(F ) = P (V ) (F ) per ogni boreliano di X. Di conseguenza per ogni E ∈ B(R) dovr` a anche valere: Q(f −1 (E)) = P (V ) (f −1 (E)), cio`e P (E) = P (T ) (E), che `e quanto volevamo dimostrare. (b). Passiamo a dimostrare che σ(T ) = supp(P (T )). Dimostreremo equivalentemente che λ0 ∈ ρ(T ) se e solo se λ0 ∈ supp(P (T ) ). Per prima cosa proviamo che λ0 ∈ supp(P (T ) ) implica λ0 ∈ ρ(T ). Infatti, nell’ipotesi fatta su λ0 , esiste un intervallo aperto (a, b) ⊂ R \ supp(P (T ) ) con λ0 ∈ (a, b). Di conseguenza: I = R χR\(a,b)dP da cui usando l’ultimo risultato in (c) del teorema 9.4: 1 1 dP (T ) (λ) = dP (T ) (λ) χR\(a,b)dP = R λ − λ0 R λ − λ0 R 1 χR\(a,b)(λ) dP (T )(λ) . λ − λ0 R Applicando (c) del teorema 9.4, dato che nell’ultimo integrale la funzione integranda `e limitata concludiamo che l’operatore: 1 Rλ0 (T ) := dP (T )(λ) ∈ B(H) . λ − λ0 R Inoltre, sempre per (c) del teorema 9.4, prestando attenzione ai domini su cui ha senso definire il prodotto di operatori, otteniamo: Rλ0 (T )(T − λ0 I) = ID(T ) ,
(T − λ0 I)Rλ0 (T ) = I .
Si osservi che la seconda identit`a vale su tutto H e pertanto abbiamo da essa che deve anche valere: Ran(T − λ0 I) = H. L’operatore Rλ0 (T ) `e quindi, come la notazione suggerisce, il risolvente di T associato a λ0 , per (a) del teorema 8.4 e quindi, per definizione, λ0 ∈ ρ(T ). Passiamo ora a provare che λ0 ∈ ρ(T ) implica λ0 ∈ supp(P (T )). Nelle ipotesi dette per λ0 , P (T )({λ0 }) = (T ) 0, altrimenti esisterebbe ψ ∈ P{λ0} (H) \ {0} che implicherebbe (per (c) del teorema 9.4): (T ) Tψ = λdP (T )(λ)P{λ0 } ψ = λdP (T ) (λ) χ{λ0 } (λ)dP (T ) (λ)ψ = R
R
λχ{λ0 } (λ)dP (T ) (λ)ψ =
R
R
R
(T )
λ0 χ{λ0 } (λ)dP (T ) (λ)ψ = λ0 P{λ0} ψ = λ0 ψ
9.1 Teorema spettrale per operatori autoaggiunti non limitati
393
e dunque ψ ∈ σp (T ), che `e impossibile, dato che λ0 ∈ ρ(T ). Ulteriormente, nelle stesse ipotesi su λ0 esiste l’operatore risolvente cio`e (essendo T chiuso e valendo (a) e (b) in teorema 8.4) l’operatore Rλ0 (T ) ∈ B(H), che soddisfa: (T − λ0 I)Rλ0 (T ) = I
e
Rλ0 (T )(T − λ0 I) = ID(T ) .
D’altra parte, da (c) del teorema 9.4 e tenendo conto che, P (T ) ({λ0 }) = 0, si trova subito (facendo attenzione ai domini sui quali valgono le identit` a):
1 dP (T ) (λ) (T − λ0 I) = ID(T ) , λ − λ 0 R 1 (T − λ0 I) dP (T )(λ) = I . λ − λ0 R 1 Si osservi che dalla prima identit` a si evince anche che il dominio di R λ−λ 0 (T ) dP (λ) `e D(T − λ0 I), cio`e con tutto lo spazio H, per quanto detto sopra. 1 Non `e importante come abbiamo definito la funzione λ → λ−λ esattamente 0 (T ) per λ = λ0 , dato che P ({λ0 }) = 0. Per l’unicit` a dell’operatore inverso deve allora essere: 1 dP (T )(λ) = Rλ0 (T ) , λ − λ 0 R dunque l’operatore a primo membro deve essere limitato. Supponiamo allora, per assurdo, che sia λ0 ∈ supp(P (T )), allora ogni aperto che contiene λ0 e quindi, in particolare, ogni intervallo In := (λ0 −1/n, λ0 +1/n), deve soddisfare (T ) P (T )(In ) = 0. Sia allora ψn ∈ PIn (H) \ {0} per ogni n = 1, 2, . . .. Senza perdere generalit`a supponiamo anche che: ||ψn|| = 1. Con questa scelta ed usando (f) del teorema 9.4, si ottiene che:
2
1 1 ||Rλ0 (T )ψn ||2 =
dP (T )(λ)ψn
= dμψn (λ) λ − λ |λ − λ0 |2 0 R In 1 1 ≥ inf dμψn (λ) ≥ inf = n2 → +∞ se n → +∞. In |λ − λ0 |2 I In |λ − λ0 |2 n o essere limitato. Pertanto abbiamo raggiunto l’assurdo che Rλ0 (T ) non pu` Quindi deve valere λ0 ∈ supp(P (T ) ). Dimostriamo ora che vale (i). Come visto nella dimostrazione appena conclusa, se P (T ) ({x}) = 0, allora x ∈ σp(T ). Supponiamo ora che x ∈ σp(T ). Dalla definizione di trasformata di Cayley V di T , segue facilmente che ((x − i)/(x + i)) ∈ σp (V ). Possiamo allora applicare (i) in (b) del teorema 8.34 per l’operatore normale V (dato che `e unitario) sostituito a T nell’enunciato di quel teorema. Concludendo che P (V ) ({ x−i x+i }) = 0. Per come abbiamo ricavato la PVM associata a T da quella associata a V , segue immediatamente che P (T ) (x) = P (V ) ({ x−i x+i }) = 0. Passiamo a dimostrare (ii). Per (a) in proposizione 8.15, x ∈ σc (T ) significa che (1) x ∈ σ(T ), ma (2) x ∈ σp (T ). L’affermazione (1) equivale a x ∈ supp(P (T ) )
394
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
e quindi ogni aperto Ax che include x deve verificare P (T ) (Ax ) = 0, la (2) equivale quindi a dire P (T )({x}) = 0 (altrimenti, per (i) avremmo un assurdo). La prova di (iii) `e immediata, se x ∈ supp(P (T ) ) ed `e un punto isolato, deve essere P (T ) ({x}) = 0, altrimenti x non potrebbe appartenere a supp(P (T ) ), applicando (i) segue la tesi. Per concludere dimostriamo (iv). Se x ∈ σc (T ), allora applicando (ii) per la classe di intervalli In := (x − 1/n, x + 1/n), con n = 1, 2, . . ., deve risultare (T ) P (T )(In ) = 0. Scegliamo pertanto ψn ∈ PIn (H), per ogni n e tale che ||ψn|| = 1. Avremo allora che:
||T ψn − xψn ||2 = (λ − x)dP (T )(λ)ψn
(λ − x)dP (T )(λ)ψn = R
R
R
(T ) (λ − x)dP (T )(λ)PIn ψn
(λ − x)dP (T )(λ)ψn . R
Applicando (c) in teorema 9.4, l’ultimo prodotto scalare si scrive χIn (x)(λ − x)2 dμψn (λ) ≤ sup(λ − x)2 dμψn (λ) = R
In In
= n−2
dμψn (λ) = n−2
In
R
dμψn (λ) = n−2 ||ψn ||2 .
Abbiamo trovato che, per ogni n = 1, 2, . . ., esiste ψn = 0, con ||ψn || = 1 e tale che: ||T ψn − xψn || ≤ 1/n. Questo implica immediatamente la tesi in quanto x ∈ σp (T ) per ipotesi e dunque 0 < ||T ψn − xψn ||. Dopo il teorema spettrale, possiamo dare una utile definizione per le applicazioni in meccanica quantistica. Definizione 9.10. Si consideri un operatore autoaggiunto T nello spazio di Hilbert H e sia f : R → C una funzione Borel misurabile. L’operatore: f(T ) := f(x)dP (T )(x) , (9.44) R (T )
con dominio, se μψ (E) := (ψ|P (T ) (E)ψ) per ogni E ∈ B(R): D(f(T )) = Δf := ψ ∈ H
|f(x)|2 dμ(T ) (x) < +∞ ψ
R
`e detto funzione f dell’operatore T . Osservazioni 9.11. (1) Il teorema spettrale consente una differente decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H. Un decomposizione `e quella in
9.1 Teorema spettrale per operatori autoaggiunti non limitati
395
spettro discreto, σd (T ), e spettro essenziale, σess (T ) := σ(T ) \ σd (T ), dove: σd (T ) :=
) (
(T ) u numerabile per qualche > 0 . λ ∈ σ(T ) dim P(λ−,λ+)(H) al pi` Si dimostra facilmente che λ ∈ σd (T ) se e solo se λ `e un punto isolato di σ(T ). Di conseguenza, per il teorema 9.9, σd (T ) ⊂ σp (T ). Tuttavia, in generale, non `e vera l’inclusione opposta, perch´e possono esserci punti di σp (T ) non isolati (si pensi al caso in cui 0 `e un autovalore ed anche punto di accumulazione dello spettro di alcuni operatori compatti autoaggiunti). (2) Una terza decomposizione dello spettro di un operatore autoaggiunto T : D(T ) → H, si ottiene decomponendo lo spazio di Hilbert nel sottospazio chiuso Hp generato dagli autovettori e nel suo ortogonale: H = Hp ⊕ H⊥ p . Si ⊂ D(T ) e tali spazi sono invarianti sotto l’azione vede facilmente che Hp , H⊥ p di T . Con ovvie notazioni: T = T Hp ⊕T H⊥ . p Vale ovviamente σp (T ) := σ(T Hp ), mentre si definisce lo spettro puramente continuo σpc (T ) := σ(T H⊥ ). Risulta σ(T ) = σp (T ) ∪ σpc (T ). Si noti che p questa decomposizione non `e necessariamente in due insieme disgiunti e nel caso generale σpc (T ) = σc(T ). (3) Una quarta decomposizione dello spettro, per un operatore, T : D(T ) → H sullo spazio di Hilbert H (ma la definizione si pu`o dare per un generico spazio normato), `e quella in spettro puntuale approssimato, σpa (T ) e spettro residuo puro σrp (T ) := σ(T ) \ σps (T ), dove: σpa (T ) := 1
2 λ ∈ σ(T ) | (T − λI)−1 : Ran(T − λI) → D(T ) non esiste o non `e limitato.
Osservando che la non limitatezza di (T − λI)−1 `e equivalente al fatto che esiste δ > 0 con ||(T − λI)ψ|| ≥ δ||ψ|| per ogni ψ ∈ D(T ), si dimostra immediatamente il seguente risultato che giustifica la terminologia. λ ∈ σpa (T ) se e solo se, per ogni > 0, esiste ψ ∈ D(T ) con ||ψ|| = 1 tale che: ||T ψ − λψ|| ≤ . Dato che, per gli operatori autoaggiunti, la propriet` a di sopra vale per ogni λ ∈ σc (T ) per (b) del teorema 8.34, ma anche per λ ∈ σp (T ) banalmente, e tenendo conto che σ(T ) = σp (T ) ∪ σc (T ) nel caso in esame, concludiamo che σpa(T ) = σ(T ) e σrp (T ) = ∅ per tutti gli operatori autoaggiunti. (4) Dato che supp(P (T ) ) = σ(T ), la definizione (9.44) pu` o equivalentemente essere scritta: f(T ) := f(x)dP (T ) (x) . (9.45) σ(T )
396
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Nello stesso modo, dato che supp(μφ,ψ ) ⊂ supp(P (T ) ), possiamo equivalentemente scrivere per il dominio di f(T ):
(T ) 2 D(f(T )) = ψ ∈ H |f(x)| dμψ (x) < +∞ .
σ(T ) Si osservi infine che, se f : R → R `e Borel misurabile, decomponendo f(T ) (che `e autoaggiunto per (b) del teorema 9.4) con il teorema spettrale 9.9 , segue che: (f(T )) (T ) λdP (λ) = f(λ)dP (λ) = λdP (T ) (f −1 (λ)) . (9.46) σ(f(T ))
σ(T )
σ(f(T ))
L’ultima identit` a segue da (h) del teorema 9.4. Per l’unicit` a della PVM associata a f(T ) segue che, nelle ipotesi dette su f: P f(T ) (E) = P (T )(f −1 (E))
per ogni E ∈ B(σ(f(T ))).
(9.47)
(5) Da (d) del teorema 9.4 risulta che, per ogni operatore autoaggiunto T , il dominio naturale di un polinomio p(T ) ed il dominio dello stesso operatore pensato come funzione di T coincidono. Dalla definizione di dominio naturale si ha anche che, per ogni operatore autoaggiunto T : D(T m ) ⊂ D(T n )
per 0 ≤ n ≤ m, con n, m ∈ N.
(9.48)
Le funzioni di un operatore godono delle propriet` a che seguono immediatamente dai teoremi 9.3 e 9.4. La seguente proposizione specifica ulteriori propriet` a in relazione allo lo spettro dell’operatore autoaggiunto T . Ricordiamo (vedi anche (1) in esempi 2.118) che f : X → Y, con X, Y spazi normati, `e detta essere localmente lipschitziana se, per ogni x ∈ X, esistono un intorno aperto Ix e una costante LIx ≥ 0 (che diremo di Lipschitz) tali che: ||f(z) − f(z )||Y ≤ LIx ||z − z ||X per ogni z, z ∈ X . Le funzioni derivabili sono banalmente localmente lipschitziane, per cui (a)’ sotto, in particolare, si applica al caso di f `e derivabile. Proposizione 9.12. Sia T operatore autoaggiunto nello spazio di Hilbert H e sia f : R → C Borel misurabile. L’operatore f(T ) gode delle seguenti propriet` a. (a) σ(f(T )) ⊂ f(σ(T )) dove la barra indica la chiusura topologica. (a)’σ(f(T )) = f(σ(T )) se f `e localmente lipschitziana. (a)”σ(f(T )) = f(σ(T )) se f `e continua e f(R) ⊂ R. (b) f(σp (T )) ⊂ σp (f(T )). Dimostrazione. (a), (a)’ e (a)”. Sia x0 ∈ f(σ(T )). Allora la funzione σ(T ) 1 x → f(x)−x `e limitata. Dato che supp(P (T )) = σ(T ) per il teorema 9.9, 0
9.1 Teorema spettrale per operatori autoaggiunti non limitati
397
applicando (c) del teorema 9.3, dobbiamo allora concludere che l’operatore 1 (T ) dP (x) sia limitato e con dominio dato da tutto H. Vale inoltre, R f(x)−x0 applicando (c) del teorema 9.4 e tenendo conto dei domini degli operatori: 1 (T ) dP (x) (f(x) − x0 )dP (T )(x) = ID(f(T )−x0 I) , f(x) − x 0 R R e anche che:
R
(f(x) − x0 )dP (T )(x)
R
1 dP (T )(x) = I . f(x) − x0
Dalla seconda si evince che ) − x0 I) = H. Da (a) in teorema 8.4 Ran(f(T 1 (T ) abbiamo che l’operatore R f(x)−x dP (x) `e il risolvente di f(T ) associato 0 a x0 ; di conseguenza x0 ∈ ρ(f(T )), cio`e x0 ∈ σ(f(T )). Abbiamo provato che, se x0 ∈ σ(f(T )), allora x0 ∈ f(σ(T )). In altre parole: σ(f(T )) ⊂ f(σ(T )). Mostriamo ora che, se f `e localmente lipschitziana oppure se `e continua con immagine in R: f(σ(T )) ⊂ σ(f(T )). Questo concluder`a la dimostrazione di (a)’ e (a)”, in quanto essendo lo spettro chiuso, f(σ(T )) ⊂ σ(f(T )). Nelle ipotesi di (a)’, supponiamo dunque che x0 = f(λ0 ), dove λ0 ∈ σ(T ) pu` o non essere unico, e proviamo che x0 ∈ σ(f(T )). Nelle ipotesi su x0 , se qualche λ0 ∈ σp(T ), la dimostrazione si conclude per l’asserto (b) di questa proposizione (la cui dimostrazione non dipende da quella che stiamo facendo), valendo x0 = f(λ0 ) ∈ σp (f(T )) ⊂ σ(f(T )). Se per ogni λ0 che individua il fissato x0 tramite f vale λ0 ∈ σp (T ), allora per ciascuno di tali λ0 deve essere P (T ) ({λ0 }) = 0 per (ii) in (b) del teorema 9.9. Assumiamo di essere in questo caso e, per assurdo, che x0 ∈ σ(f(T )). Di conseguenza x0 ∈ ρ(f(T )) e questo significa che l’operatore chiuso f(T ) − x0 I `e una biezione da D(f(T )) a tutto H, per (a) del teorema 8.4. In virt` u di (c) del teorema 9.4: 1 dP (T )(λ)(f(T ) − x0 I) f(λ) − x 0 R f(λ) − x0 (T ) dP (λ)D(f(T )) = ID(f(T )) . = R f(λ) − x0 Si osservi che la definizione della funzione 1/(f(λ) − x0 ) in (ogni) λ0 `e del (T ) tutto irrilevante dato che P a operatoriale trovata dice 0 }) = 0. L’identit` ({λ 1 (T ) anche che il dominio di R f(λ)−x dP (λ) deve essere tutto H, dato che 0 Ran(f(T ) − x0 I) = H nelle nostre ipotesi:
1 D dP (T )(λ) = H . (9.49) R f(λ) − x0 Dimostriamo che (9.49) `e falsa se f `e localmente lipschitziana, arrivando ad 1 (T ) un assurdo. Se λ0 ∈ σ(T ), l’operatore D( R λ−λ dP (λ)) = H (altrimenti, 0 ragionando come sopra, T − λ0 I sarebbe una biezione da D(T ) a tutto H
398
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
ed avremmo un assurdo). Dato che, per ogni intervallo aperto limitato I che include λ0 , la funzione 1/(λ − λ0 ) `e limitata su R \ I,deve accadere che, (T ) 1 (T ) dP (λ) . per ogni detto I, esista ψI ∈ PI (H) tale che ψI ∈ D R λ−λ 0 (Altrimenti potremmo decomporre ortogonalmente ogni ψ ∈ H come:
1 (T ) (T ) (T ) dP (T )(λ) ψ = PI ψ + PR\I ψ con PI ψ ∈ D R λ − λ0 ed avremmo, spezzando l’integrale nei due contributi su I e su R \ I, che (T ) (scriviamo μψ in luogo di μψ nel seguito): 1 dμψ (λ) 2 R |λ − λ0 | 1 1 = dμ dμP (T ) ψ (λ) < +∞ (T ) (λ) + 2 P ψ 2 I R\I I |λ − λ0 | R\I |λ − λ0 | 1 e quindi ψ ∈ D R λ−λ dP (T )(λ) che pertanto coinciderebbe con tutto H, 0 contro le ipotesi.) Se f `e localmente lipschitziana, sia L > 0 una costante di Lipschitz nell’intervallo I λ0 . Allora, in I: |f(λ) − f(λ0 )|2 ≤ L2 |λ − λ0 |2 . Pertanto, dato che ψI ∈ D( X dP (λ)/(λ − λ0 )): dμψI (λ) dμψI (λ) dμψI (λ) 1 ≥ ≥ 2 = +∞ . 2 2 |f(λ) − f(λ )| |f(λ) − f(λ )| L |λ − λ0 |2 0 0 R I I Dove, nell’ultimo passaggio abbiamo usato il fatto che ψI ∈ 1 1 D R λ−λ dP (T )(λ) . Abbiamo provato che ψI ∈ D R f(λ)−x dP (T )(λ) , 0 0 in contraddizione con (9.49), concludendo la dimostrazione di (a)’. Consideriamo ora f : R → R continua e proviamo che f(σ(T )) ⊂ σ(f(T )), provando (a)”. Usando (h) del teorema 9.4, passando alla misura spettrale P (T ) (E) = P (T ) (f −1 (E)), se E ∈ B(R), trasformiamo la funzione integrale di partenza, che definisce un operatore autoaggiunto T = f(T ), essendo f reale, nello sviluppo spettrale di T : f(λ)dP (T ) (λ) = xdP (T ) (x) . R
R
Sia ora x = f(λ) con λ ∈ σ(T ). Se I x `e un intervallo aperto, vale P (T ) (I) = P (T )(f −1 (I)) = 0, dato che f −1 (I) `e un aperto che include λ ∈ σ(T ) = supp(P (T )). Ma allora x ∈ supp(P (T ) ) = σ(T ) = σ(f(T )). Quindi f(σ(T )) ⊂ σ(f(T )). (T ) (b) Se λ0 ∈ σp (T ), allora
= 0 per (i) di (b) del teorema 9.9. P ({λ0 }) (T ) Valendo P ({λ0 }) = R χ{λ0 } (x)dP (T )(x), applicando (c) del teorema 9.4, prestando attenzione ai domini di validit` a delle identit` a, si trova che: f(T )P (T ) ({x0 }) = f(x)dP (T ) (x) χ{x0 } (x)dP (T )(x) R
R
9.1 Teorema spettrale per operatori autoaggiunti non limitati
=
399
f(x0 )χ{x0 } (x)dP (T )(x) f · χ{x0 } (x)dP (T )(x) = R R (T ) = f(λ0 ) χ{x0 } (x)dP (x) = f(x0 )P (T ) ({x0 }) R
che `e la tesi. 9.1.3 Un esempio a spettro puntuale: l’hamiltoniano dell’oscillatore armonico
Nello spazio di Hilbert complesso L2 (R, dx) (dove dx indica la misura di Lebesgue su R), consideriamo l’operatore: H0 := −
2 mω2 2 1 P S(R) + XS(R) , 2m 2
dove X e P sono l’operatore posizione ed impulso per la particella sulla retta reale introdotti nel capitolo 5. In altre parole: H0 := −
2 d2 mω2 2 x , + 2 2m dx 2
dove il termine x2 si deve intendere come l’operatore moltiplicativo per la funzione R x → x2 e , ω, m sono costanti strettamente positive; infine D(H0 ) := S(R), dove S(R) `e lo spazio di Schwartz su R delle funzioni complesse infinitamente differenziabili che si annullano all’infinito, con tutte le derivate, pi` u velocemente di ogni potenza negativa di x (vedi capitolo 3). Le costanti , ω, m non hanno alcun interesse matematico e possono essere poste tutte uguali ad 1 nel seguito, tuttavia hanno un significato fisico importante. L’operatore H0 si dice hamiltoniano dell’oscillatore armonico unidimensionale e frequenza caratteristica ω/(2π), per una particella di di massa m; h := 2π `e la costante di Planck. Dal punto di vista fisico, H0 rappresenta l’osservabile energia per il sistema considerato, tuttavia, in questa sezione, non ci occuperemo delle motivazioni fisiche per introdurre tale operatore che studieremo esclusivamente da un punto di vista matematico, rimandando ogni commento di carattere fisico ai capitoli 11 e 12. H0 `e evidentemente simmetrico dato che `e hermitiano e S(R) `e denso in L2 (R, dx). H0 ammette estensioni autoaggiunte per il criterio di von Neumann (teorema 5.42), dato che commuta con l’operatore antinunitario dato dalla coniugazione complessa delle funzioni di L2 (R, dx). Mostreremo che H0 `e essenzialmente autoaggiunto, daremo la sua espressione esplicita in termini dello sviluppo spettrale della sua unica estensione autoaggiunta H0 e, contestualmente, preciseremo la forma del suo spettro. Introduciamo tre operatori, detti rispettivamente operatore di creazione, operatore di distruzione e operatore numero di occupazione: 3 3
d d mω mω A := x+ , A := x− , N := A A . 2 mω dx 2 mω dx
400
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Anche in questo caso assumiamo che gli operatori siano densamente definiti con dominio D(A) = D(A ) = D(N ) := S(R). Deve essere chiaro che A ⊂ A∗ , e questo giustifica la notazione, inoltre N `e simmetrico. Si osservi anche che S(R) `e uno spazio denso e invariante per H0 , A e A . Usando A e A costruiremo un insieme di autovettori per N e H0 che formano una base hilbertiana di L2 (R, dx). Dato che gli autovettori sono ovviamente vettori analitici, questo fatto prova, in base al criterio di Nelson (teorema 5.46), che H0 e N sono essenzialmente autoaggiunti sul loro dominio S(R). Cominciamo con il notare che, in base alle definizioni date per A e A , valgono le relazioni di commutazione: [A, A] = I ,
(9.50)
dove i due membri sono valutati sugli elementi dello spazio denso invariante S(R). La verifica delle relazioni di sopra `e immediata dalle definizioni date. Ulteriormente, dalla definizione di A e A , con qualche calcolo risulta che:
1 1 (9.51) H0 = ω A A + I = N + I . 2 2 Consideriamo l’equazione in S(R): Aψ0 = 0 .
(9.52)
Una soluzione si ottiene facilmente essere: 1
3
2
x − (2s) 2
ψ0 (x) = 1/4 √ e π s
,
s :=
, mω
dove abbiamo scelto il fattore davanti alla funzione in modo tale che ||ψ0 || = 1. Notiamo che questa funzione altro non `e che la prima funzione di Hermite introdotta in (4) di esempi 3.33, quando si passa alla variabile x = x/s e √ si tiene conto del fattore 1/ s per non alterare la normalizzazione. Se ora definiamo i nuovi vettori, per n = 1, 2, . . .: (A )n ψn := √ ψ0 , n!
(9.53)
si prova facilmente per induzione, usando solamente (9.52), (9.50) che, per n, m ∈ N: √ √ Aψn = nψn−1 , A ψn = n + 1ψn+1 , (ψn |ψm ) = δnm . (9.54) Infatti, la seconda identit` a segue immediatamente dalla definizione dei vettori ψn , la prima si prova come segue: 1 1 1 Aψn = √ A(A )n ψ0 = √ [A, (A )n ]ψ0 + √ (A )n Aψ0 n! n! n!
9.1 Teorema spettrale per operatori autoaggiunti non limitati
401
1 = √ [A, (A )n ]ψ0 + 0 ; n! d’altra parte, da (9.50) segue subito che: [A, (A )n ] = n(A )n−1 , che inserita sopra produce la prima identit` a in (9.54). La terza identit`a si dimostra come segue, assumendo n ≥ m (l’altro caso `e analogo): 1 1 (ψm−1 |A(A )n ψ0 ) = √ (ψm−1 |[A, (A)n ]ψ0 ) n!m n!m 3 n n n−1 = √ ψ0 ) = (ψm−1 |(A ) (ψm−1 |ψn−1 ) = · · · m n!m ! n! (ψ0 |ψn−m) . = m!(n − m)!
(ψm |ψn ) = √
Se n = m il risultato `e 1, altrimenti il risultato `e 0, dato che: (ψ0 |ψn−m ) = (n − m)−1/2 (ψ0 |Aψn−m−1 ) = (n − m)−1/2 (Aψ0 |ψn−m−1 ) = 0 . La seconda identit`a in (9.54) (passando alla variabile x = x/s che √ non altera la normalizzazione delle funzioni a causa dell’ulteriore fattore 1/ s) altro non `e che la relazione di ricorrenza tra le funzioni di Hermite citata in (4) di esempi 3.33. Concludiamo che le funzioni ψn sono (a parte un fattore ed un cambio di variabile) le funzioni di Hermite e quindi formano una base hilbertiana di L2 (R, dx). Dall’ultima relazione in (9.54) risulta che {ψn }n∈N `e, come deve essere, un insieme di vettori ortonormali di L2 (R, dx), mentre usando le prime due si ottiene subito che: N ψn = nψn , (9.55) e quindi, da (9.51), abbiamo che i vettori ψn formano una base hilbertiana di autovettori di H0 , dato che vale:
1 ψn . H0 ψn = ω n + (9.56) 2 Per inciso questo mostra che H0 (ma anche N ) `e un operatore illimitato, dato che l’insieme {||H0ψ|||ψ ∈ D(H0 ), ||ψ|| = 1} include tutti i numeri ω(n+1/2) con n ∈ N. Concludiamo anche che, per il criterio di Nelson (teorema 5.46), gli operatori simmetrici N e H0 sono entrambi essenzialmente autoaggiunti, dato che nel loro dominio c’`e un insieme di vettori analitici, {ψn }n∈N , le cui combinazioni lineari finite sono dense in L2 (R, dx). Per ottenere la decomposizione spettrale di H0 consideriamo spazio topologico dato dalla base hilbertiana N = {ψn }n∈N dotata dalla topologia dell’insieme delle parti, e costruiamo la misura spettrale: P : B(N ) E → PE = ψn (ψn | ) ψn ∈E
402
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
come in (1) in esempi 9.8. Costruiamo un’analoga misura spettrale su R che abbia supporto sull’insieme degli autovalori associati agli autovettori ψn di H0 : ψn (ψn | ) per F ∈ B(R). PF := sω(n+1/2)∈F
Quindi consideriamo la funzione misurabile φ : N ψn → ω n + 12 . Applicando (c) del teorema 9.4, abbiamo che, per ogni funzione f : R → C misurabile:
1 ψn (ψn | ) f(x)dP (x) = f(φ(z))dP (z) = sf ω n + 2 R N n∈N
dove l’ultima identit`a non `e altro che la (9.32). Specializzando la funzione f a R x → x, abbiamo l’espressione esplicita dell’operatore autoaggiunto:
1 ψn (ψn | ) . H0 := xdP (x) = sω n + (9.57) 2 R n∈N
Mostriamo ora che H0 = H0 . Sia < N > lo spazio denso delle combinazioni lineari finite dei vettori ψn . H0 `e ancora essenzialmente autoaggiunto per il criterio di Nelson. Questo significa che H0 = H0 , cio`e H0 e H0 hanno la stessa (unica) estensione autoaggiunta (pari alla loro chiusura). D’altra parte H0 `e sicuramente un’estensione autoaggiunta di H0 , dato che, come si prova immediatamente da (9.57),
1 H0 ψn = ω n + ψn = H0 ψn 2 per ogni n, e quindi H0 = H0 . Concludiamo che l’operatore autoaggiunto H0 deve essere l’unica estensione autoaggiunta di H0 e quindi anche di H0 . Concludiamo anche che la misura spettrale, associata a H0 dal teorema 9.9 di decomposizione spettrale `e: PF := sψn (ψn | ) per F ∈ B(R); ω(n+1/2)∈F
ma anche che la decomposizione spettrale di H0 `e:
1 ψn (ψn | ) . H0 = sω n + 2 n∈N
Infine, usando (b) nel teorema 9.9, dalla misura spettrale trovata per H0 si evince facilmente che:
1
σ(H0 ) = σp (H0 ) = ω n + n ∈ N . 2
9.1 Teorema spettrale per operatori autoaggiunti non limitati
403
Si deve notare che lo spettro di H0 `e completamente puntuale e gli autospazi sono tutti finito-dimensionali, anche se l’operatore in questione non `e compatto, dato che `e illimitato. Tuttavia le prime due potenze intere inverse di H0 sono compatte, essendo rispettivamente un operatore di Hilbert-Schmidt e uno di classe traccia (lo si provi per esercizio). I numeri in σp (H0 ) sono, dal punto di vista fisico, gli unici valori dell’energia meccanica totale che un oscillatore quantistico, con dati valori di ω ed m, pu` o assumere, al contrario del caso classico in cui i valori dell’energia sono continui. 9.1.4 Un esempio a spettro continuo: gli operatori posizione e impulso Torniamo sugli operatori posizione Xi (5.12)-(5.13) ed impulso Pi (5.18)(5.19), per i = 1, 2, 3, sullo spazio di Hilbert H = L2 (R3 , dx), dove dx `e la misura di Lebesgue su R3 . Nel seguito x = (x1 , x2 , x3 ). Abbiamo visto che gli operatori suddetti sono autoaggiunti. Ora ne determineremo lo sviluppo spettrale e lo spettro. Cominciamo con l’operatore posizione X1 . Quanto diremo per esso vale anche per X2 e X3 , dato che la loro definizione `e completamente simmetrica scambiando i nomi degli operatori. Una PVM su R a valori in B(H) = B(L2 (R3 , dx)) si ottiene definendo: (P (E)ψ)(x1 , x2 , x3 ) = χE (x1 )ψ(x1 , x2 , x3 ) per ogni E ∈ B(R) e ogni ψ ∈ L2 (R3 , dx).
(9.58)
In questo modo si vede facilmente che, se ψ ∈ L2 (R3 , dx), la misura μψ su B(R) `e definita come: μψ (E) = |ψ(x1 , x2 , x3 )|2 dx per ogni E ∈ B(R), E×R2
conseguentemente, se g : R → C `e misurabile: g(y)dμψ (y) = f(x1 )ψ(x1 , x2, x3 )dx . R
(9.59)
E×R2
Procedendo similmente a quanto fatto in (2) in esempi 9.8, si verifica facilmen te che, se f : R → C `e misurabile e ψ ∈ Δf (cio`e R |f(x1 )ψ(x1 , x2 , x3 )|2 dx < +∞), allora
f(y)dP (y)ψ (x1 , x2 , x3) = f(x1 )ψ(x1 , x2 , x3 ) R
q.o. per (x1 , x2 , x3 ) ∈ R3 .
(9.60)
404
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Possiamo allora definire l’operatore autoaggiunto X1 come l’operatore associato, nello sviluppo (9.60), alla funzione f := f1 con f1 : R y → y. Tale operatore `e autoaggiunto per (b) del teorema 9.4, dato che questa funzione `e reale. Inoltre, per confronto con la (5.13) abbiamo immediatamente che Δf1 = D(X1 ) e, da (9.60) troviamo subito che: X1 ψ = X1 ψ
per ogni ψ ∈ D(X1 ).
Concludiamo, dall’unicit` a della misura spettrale sancita nel teorema di decomposizione spettrale 9.9, che (9.58) `e la misura spettrale associata all’operatore posizione X1 . Lo sviluppo spettrale di Xi , per i = 1, 2, 3, deve dunque essere:
(Xi ) ydP (y)ψ (x1 , x2 , x3 ) = (Xi ψ)(x1 , x2, x3 ) R
q.o. per (x1 , x2 , x3 ) ∈ R3 ,
(9.61)
dove: (P (Xi ) (E)ψ)(x1 , x2 , x3) = χE (xi )ψ(x1 , x2 , x3) ∀E ∈ B(R) e ∀ψ ∈ L2 (R3 , dx).
(9.62)
Questa misura spettrale consente di individuare lo spettro di Xi , per i = 1, 2, 3. Applicando (ii) in (b) del teorema 9.9, si trova immediatamente che: σ(Xi ) = σc(Xi ) = R .
(9.63)
Passiamo agli operatori impulso. La discussione `e abbastanza diretta in virt` u della proposizione 5.30, tenendo conto del fatto che la trasformata di FourierPlancherel `e una trasformazione unitaria. Prima di tutto, dato che le trasformazioni unitarie, conservano gli spettri degli operatori (vedi in esercizio 8.9), abbiamo immediatamente che (indicando gli operatori posizione con Ki come nella proposizione 5.30): σ(Pi ) = σ(Fˆ −1 Ki Fˆ ) = R = R , cio`e: σ(Pi ) = σc(Pi ) = R .
(9.64)
La misura spettrale di Pi deve dunque avere supporto su tutto R. Il lettore pu` o facilmente dimostrare che, in base alla proposizione 5.30, e tenendo conto degli esercizi 9.1-9.5, la PVM associata all’operatore impulso Pi `e semplicemente definita come P (Pi ) (E) = Fˆ −1 P (Ki ) Fˆ
per ogni E ∈ B(R)
(9.65)
dove P (Ki ) `e la misura spettrale dell’operatore posizione, ora indicato con Ki .
9.1 Teorema spettrale per operatori autoaggiunti non limitati
405
9.1.5 Teorema di rappresentazione spettrale per operatori autoaggiunti non limitati e misure congiunte Per concludere presentiamo due teoremi connessi alla teoria delle misure spettrali per operatori autoaggiunti. Il seguente teorema di rappresentazione spettrale generalizza il teorema 8.38 al caso di un operatore autoaggiunto non limitato. I dettagli della dimostrazione sono lasciati per esercizio, dato che si tratta essenzialmente della stessa prova gi`a discussa per il teorema 8.38. Teorema 9.13. (Di rappresentazione spettrale per operatori autoaggiunti non limitati.) Siano H spazio di Hilbert e T : D(T ) → H operatore autoaggiunto in H e P (T ) la PVM di T secondo il teorema 9.9. ` possibile decomporre H come una somma diretta hilbertiana (definizio(a) E ne 8.36) H = ⊕α∈A Hα (con A al pi` u numerabile se H `e separabile), dove i sottospazi Hα sono chiusi ed ortogonali a due a due, e valgono le propriet` a seguenti: (i) per ogni α ∈ A, vale T (Hα ) ⊂ Hα , (ii) per ogni α ∈ A esiste una misura di Borel positiva finita μα , su σ(T ) ⊂ R2 ed un operatore isometrico suriettivo Uα : Hα → L2 (σ(T ), μα ), tali che, se la funzione f : σ(T ) → C `e misurabile: Uα in particolare vale:
f(x)dP (T )(x)
σ(T )
Hα Uα−1 = f· ,
Uα T Hα Uα−1 = x· ,
dove f· `e l’operatore moltiplicativo per f su L2 (σ(T ), μα ): (f · g)(x) = f(x)g(x) q.o. su σ(T ) se g ∈ L2 (σ(T ), μα ) . (b) Vale: σ(T ) = supp{μα }α∈A , dove supp{μα }α∈A `e il complemento dell’insieme dei numeri λ ∈ R per cui esiste un aperto Aλ ⊂ R tale che Aλ λ e μα (Aλ ) = 0 per ogni α ∈ A. (c) Se H `e separabile, esistono uno spazio con misura (MT , ΣT , μT ), dove vale μT (MT ) < +∞, una funzione FT : MT → R, un operatore UT : H → L2 (MT , μT ) unitario, tali che: UT T UT−1 f (m) = FT (m)f(m) , per ogni f ∈ H. (9.66) Dimostrazione. La dimostrazione si ottiene seguendo la prova del teorema 8.38, per T autoaggiunto, ed in riferimento ad ogni spazio Hψ . A parte semplici riadattamenti, `e sufficiente rimpiazzare sistematicamente lo spazio Mb (σ(T )), delle funzioni misurabili limitate su σ(T ), con lo spazio L2 (σ(T ), μψ ).
406
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
L’ultimo teorema concerne la nozione di misura spettrale congiunta, detta anche joint spectral measure, di un insieme di operatori autoaggiunti con misure spettrali commutanti. Teorema 9.14. Sia A := {A1 , A2 , . . . , An } un insieme di operatori autoaggiunti (in generale non limitati) nello spazio di Hilbert H separabile e si supponga che le misure spettrali, P (Ak ) , rispettivamente associate agli operatori suddetti, commutino a due a due: P (Ak ) (E)P (Ah ) (E ) = P (Ah) (E )P (Ak ) (E) se E, E ∈ B(R) e h, k ∈ {1, 2, . . . , n}. Allora esiste un’unica PVM P (A) : B(Rn ) → B(H) tale che: P (A)(E (1) × · · · × E (n)) = P (A1) (E (1) ) · · · P (An) (E (n) ) se E (k) ∈ B(R) e k = 1, . . . , n.
(9.67)
(A)
`e detta misura spettrale congiunta di A1 , A2 , . . . , An e supp(P (A) ) P si dice spettro congiunto della classe di operatori A. Per ogni f : R → C Borel misurabile, vale l’identit` a: f(xk (x))dP (A) (x) = f(xk )dP (Ak ) (xk ) = f(Ak ) Rn
R
se k = 1, 2, . . ., n,
(9.68)
dove xk (x) `e la k-esima componente di x = (x1 , x2, . . . , xk . . . , xn ) ∈ R . n
Dimostrazione. Premettiamo due lemmi tecnici. Lemma 9.15. Sia H uno spazio di Hilbert separabile e {Pα }α∈A ⊂ P(H) una famiglia infinita di proiettori ortogonali tali che, se α, α ∈ A, vale Pα Pα = Pα Pα = Pβ per qualche β ∈ A dipendente da α, α . Se Ma := Pα (H), M := ∩α∈AMα e PM denota il proiettore ortogonale su M, valgono i fatti seguenti. (a) Esiste una sottofamiglia numerabile {Mαm }m∈N tale che: ∩m∈N Mαm = M. (b) (ψ|PM ψ) = inf α∈A (ψ|Pα ψ) per ogni ψ ∈ H. Dimostrazione. Proviamo (a). Vale H \ M = ∪α∈A(H \ Mα ), dove gli H \ Mα sono insiemi aperti che formano un ricoprimento di H \ M. Dato che H `e separabile, come spazio topologico `e uno spazio a base numerabile (vedi (2) in osservazioni 2.92, notando che la topologia di H `e la topologia indotta dalla distanza associata alla norma). Per il teorema 8.20, possiamo allora estrarre un sottoricoprimento numerabile: H \ M = ∪m∈N (H \ Mαm ). Prendendo i complementi rispetto a H ad ambo membri otteniamo (a). Passiamo a (b). Essendo M ⊂ Mα , per (a) in proposizione 7.18, vale PM ≤ PMα e, di conseguenza, (ψ|PM ψ) ≤ inf α∈A {(ψ|Pα ψ)} per ogni ψ ∈ H. D’altra parte, in base ad (a) tenendo conto della seconda equazione in (b) del teorema 7.20, abbiamo
9.1 Teorema spettrale per operatori autoaggiunti non limitati
407
che (ψ|PMψ) = limN→+∞ (ψ|Pα1 · · · PaN ψ) = limN→+∞ (ψ|PβN ψ), dove, per costruzione, vale che: 0 ≥ PβN ≥ PβN+1 , per per (a) in proposizione 7.18. Di conseguenza (ψ|PMψ) = inf N∈N (ψ|PβN ψ) ≥ inf α∈A {(ψ|Pα ψ)}. Dato che vale anche la disuguaglianza opposta, concludiamo che vale (b). Lemma 9.16. Se A `e un’algebra (vedi Appendice) di insiemi o una σ-algebra di insiemi, sottoinsiemi di X e M : A → P(H), con H spazio di Hilbert `e, un’applicazione a valori di proiezione che soddisfa le richieste (a), (c) e (d) (quest’ultima se ∪n Bn ∈ A , nel caso A sia un’algebra) della definizione 8.21, allora soddisfa anche (b) nella stessa definizione. Dimostrazione. Dalla propriet` a (d), se S1 , S2 ∈ A e S1 ∩ S2 = ∅ si ha subito che M (S1 ∪ S2 ) = M (S1 ) + M (S2 ). Moltiplicando membro a membro per M (S1 ∪ S2 ) = M (S1 ) + M (S2 ), e tenendo conto che stiamo lavorando con proiettori e che dunque sono idempotenti, si trova: M (S1 )M (S2 ) + M (S2 )M (S1 ) = 0 e quindi M (S1 )M (S2 ) = −M (S2 )M (S1 ); applicando M (S1 ) ad ambo membri e tenendo conto ancora di M (S1 )M (S2 ) = −M (S2 )M (S1 ), si ha M (S1 )M (S2 ) = M (S2 )M (S1 ). Concludiamo che, di conseguenza, M (S1 )M (S2 ) + M (S2 )M (S1 ) = 0 implica che M (S1 )M (S2 ) = 0 se S1 ∩ S2 = ∅. Se ora poniamo B = R ∩ S, T1 = R \ B, T2 = S \ B e teniamo conto del fatto che: T1 ∩ T2 = T1 ∩ B = T2 ∩ B = ∅, troviamo, per R, S ∈ A : M (R)M (S) = (M (T1 ) + M (B))(M (T2 ) + M (B)) = M (B)M (B) = M (B) = M (R ∩ S)
che `e la propriet` a (b) della definizione 8.21.
Prova della tesi del teorema. Si prova facilmente che la famiglia di unioni finite di prodotti E (1) × · · · × E (n) , con E (k) ∈ B(R) `e un’algebra di insiemi (vedi appendice), che indicheremo con B0 (Rn ), e che si ottiene la stessa algebra considerando unioni disgiunte e finite di prodotti suddetti (basta decomporre ulteriormente gli insiemi in caso di intersezioni non vuote). Si osservi ancora che la σ-algebra generata da B0 (Rn ) include le unioni numerabili di prodotti di palle aperte di R, dato che Rn `e a base numerabile, questo significa che tale σ-algebra include tutti gli aperti di Rn e quindi include la σ-algebra di Borel B(Rn ) e pertanto deve coincidere con essa. (1) (n) (1) (n) (1) Se S = ∪N ∈ B0 (Rn ) con (Ej × · · · × Ei ) ∩ (Ei × · · · × j=1 Ej × · · · × Ej (n)
Ej ) = ∅ per i = j, definiamo: Q(S) :=
N
(1)
(n)
P (A1 ) (Ej ) · · · P (An ) (Ej ) .
j=1 (k)
Tenendo conto che i P (Ak ) (Ej ) sono proiettori ortogonali e commutano a due a due, segue immediatamente che ogni Q(S) `e un proiettore orto` facile provare gonale e commuta con ogni altro Q(S ) dello stesso tipo. E
408
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
n n che B0 (R ) S → Q(S) soddisfa: Q(∅) = 0, Q(R ) = I ed esiste sn∈S Q(Sn ) ∈ P(H) quando Sk ∩ Sh = ∅ se h = k, e il risultato coincide con Q(∪k∈NSk ) se ∪k∈N Sk ∈ B0 (Rn ). Applicando il lemma 9.16 abbiamo che vale anche Q(S1 )Q(S2 ) = Q(S1 ∩ S2 ) se S1 , S2 ∈ B0 (Rn ). Se R ∈ B(Rn ) definiamo infine P (A) (R) come il proiettoreortogonale sull’intersezione degli spazi su cui proiettano tutti i proiettori k Q(Sk ), al variare di tutte le famiglie {Sk }k∈N ⊂ B0 (Rn ) tali che Sk ∩ Sh = ∅ se h = k e ∪n∈N Sk ⊃ R. Per costruzione P (A)(Rn ) = I: se ∪k∈NSk = Rn , per σn additivit` a, dato che R ∈ B0 (R ): k Q(Sk ) = Q(Rn ) = I che dunque proietta su H , conseguentemente P (Rn ) = I. Inoltre, applicando il lemma 9.15, se ψ ∈ H, allora:
(A) (ψ|P (R)ψ) = inf ψ Q(Sk )ψ Sk ⊃ R , {Sk }k∈N ⊂ B0 (Rn ) ,
k∈N
k∈N
Sk ∩ Sh = ∅ se k = h
.
Come conseguenza del teorema C.1, se ψ ∈ H, B(Rn ) E → (ψ|P (A)(R)ψ) definisce una misura positiva σ-additiva finita su B(Rn ) che `e l’unica estensione di B0 (Rn ) S → (ψ|Q(S)ψ). In altre parole `e l’unica misura σ-additiva (1) (n) (1) positiva νψ su B(Rn ) che soddisfa: νψ (Ej × · · · × Ej ) = (φ|P (A1) (Ej ) · · · (n)
a di polaP (An) (Ej )ψ) per ogni scelta degli E (k) ∈ B(R). Usando l’identit` rizzazione, abbiamo anche che, se ψ, φ ∈ H, allora B(Rn ) E → (ψ|P (R)φ) `e una misura complessa su B(Rn ). Conseguentemente, abbiamo anche che B(Rn ) E → P (R) soddisfa le richieste (a),(b),(c) e (d) della definizione di PVM (definizione 8.21). (a) vale perch´e P (A) (R) `e proiettore ortogonale, (c) vale per costruzione e (d) segue dalla σ-additivit` a di B(Rn ) E → (A) (ψ|P (R)φ). La propriet` a (b) segue infine dal lemma 9.16. Dall’identit` a P (A)(E (1) × · · · × E (n) ) = P (A1 ) (E (1)) · · · P (An ) (E (n)) segue immediatamente che, se Πk : Rn → R `e la proiezione canonica di Rn = R × · · · × R sul k-esimo fattore R, vale P (A) (Πk−1 (E (k))) = P (Ak ) (E (k) ) per ogni E (k) ∈ B(R). Allora, applicando (h) del teorema 9.4 usando φ := Πk e tenendo conto del teorema spettrale 9.9 per Ak , segue immediatamente che: f(Πk (x))dP (A) (x) = f(xk )dP (Ak ) (xk ) = f(Ak ) per k = 1, 2, . . . , n. Rn
R
Per concludere, osserviamo infine che ogni PVM P : B(R) → P(H) che soddisfa P (E (1) × · · · × E (n) ) = P (A1 ) (E (1)) · · · P (An ) (E (n)) per ogni scelta degli E (k) ∈ B(R) deve soddisfare (ψ|P (E (1) × · · · × E (n))ψ) = (ψ|P (A1 ) (E (1) ) · · · P (An) (E (n) )ψ), ma per quanto detto sopra sull’unicit` a delle misure positive che soddisfano questa identit` a, deve risultare (ψ|P (R)ψ) = (ψ|P (A)(R)ψ) per ogni R ∈ B(Rn ) e ogni ψ ∈ H. Quindi deve essere P (A) = P , dato che la precedente identit` a, dall’identit` a di polarizzazione, implica (ψ|P (R)φ) = (A) (ψ|P (R)φ) se ψ, φ ∈ H.
9.2 Esponenziale di operatori non limitati: vettori analitici
409
Una discussione piuttosto esaustiva delle varie propriet`a delle joint spectral measures e delle propriet`a degli integrali rispetto ad esse si trova in [Pru81].
9.2 Esponenziale di operatori non limitati: vettori analitici In questa breve sezione tecnica torniamo sulla nozione di vettore analitico, introdotta alla fine del capitolo 5, per precisarne ulteriori propriet` a alla luce dei risultati ottenuti. I risultati che otterremo saranno a loro volta adoperati in vari punti nel resto del libro. Una questione generale interessante `e la seguente. Se A `e un operatore autoaggiunto nello spazio di Hilbert H, l’esponenziale ezA pu` o essere definito come funzione dell’operatore A nel senso della definizione 9.10. Tuttavia ci si aspetta che, in qualche caso, definendo il primo membro con la definizione 9.10, si possa usare lo sviluppo di Taylor: ezA =
+∞ n=0
zn n A . n!
Se A ∈ B(H), l’identit` a scritta sopra vale effettivamente, interpretando lo sviluppo di Taylor nella topologia operatoriale uniforme, come si dimostra facilmente (esercizio 8.16). Se A non `e limitato, la questione `e pi` u sottile e l’identit` a scritta sopra non ha senso, interpretando la serie nella topologia uniforme. Come ha chiarito Nelson, ha comunque significato, nella topologia operatoriale forte, lavorando su un sottospazio denso dello spazio di Hilbert, che `e anche un core per A: lo spazio dei vettori analitici di A, come vedremo nella proposizione 9.18, unitamente ad altri risultati. Ricordiamo che (definizione 5.43), se A `e un operatore sullo spazio di Hilbert H con dominio D(A), un vettore ψ ∈ D(A) tale che, An ψ ∈ D(A) per ogni n ∈ N (A0 := I), `e detto vettore C ∞ per A ed il sottospazio vettoriale di H dei vettori C ∞ per A si indica con C ∞ (A). ψ ∈ C ∞ (A) `e detto vettore analitico per A, se vale: +∞ n=0
||An ψ|| n t < +∞ , n!
per qualche t > 0.
(9.69)
Ricordiamo infine il teorema 5.46 di Nelson, che prova che un operatore simmetrico in uno spazio di Hilbert `e essenzialmente autoaggiunto se il suo dominio contiene un insieme di vettori analitici, le cui combinazioni lineari finite sono dense nello spazio di Hilbert. Notazione 9.17. Se A `e un operatore sullo spazio di Hilbert H con dominio D(A), nel seguito A (A) indicher` a il sottoinsieme di C ∞ (A) degli elementi che soddisfano (9.69).
410
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
La seguente proposizione riguarda alcune utili propriet`a elementari dei vettori analitici ed, in particolare, l’esponenziale di operatori (autoaggiunti) non limitati. Proposizione 9.18. Sia A operatore nello spazio di Hilbert H. Vale quanto segue. (a) A (A) `e uno spazio vettoriale. (b) Se A `e chiudibile allora: A (A) ⊂ A (A) . (c) (i) Per ogni c ∈ C, definendo A + cI sul suo dominio naturale, vale: A (A + cI) = A (A) . (ii) Per ogni c ∈ C \ {0}, definendo cA sul suo dominio naturale, vale: A (cA) = A (A) . (iii) Se A `e hermitiano, definendo A2 sul suo dominio naturale, vale: A (A2 ) ⊂ A (A) . (d) Se A `e autoaggiunto e ψ ∈ A (A) ∩ D(ezA ), interpretando ezA nel senso della definizione 9.10, vale: ezA ψ =
+∞ n z n A ψ n! n=0
per ogni z ∈ C con |z| ≤ t che verifica (9.69) per ψ .
(9.70) se Rez = 0, la (9.70) vale per ogni ψ ∈ A (A), se |z| ≤ t verifica (9.69) per ψ. (e) Se A `e autoaggiunto allora, interpretando ezA nel senso della definizione 9.10: eisA (A (A)) ⊂ A (A) per ogni s ∈ R. (f ) Se A `e autoaggiunto, allora D(A) contiene un sottoinsieme denso i cui elementi sono in A (p(A)) per ogni valore t > 0 in (9.69) e per ogni polinomio complesso (finito) p(A) dell’operatore A. Dimostrazione. (a). La tesi segue dalla maggiorazione, se ψ, φ ∈ A (A): ||An (aψ + bφ)|| ≤ |a| ||An ψ|| + |b| ||Anφ|| , scegliendo t > 0 abbastanza piccolo da accontentare sia ψ che φ in (9.69). (b). La tesi segue immediatamente dalle definizioni, tenendo conto che A `e n un’estensione di A e pertanto A `e un’estensione di An . (c). Per provare la prima propriet` a notiamo che, se t > 0 soddisfa (9.69) per ψ:
+∞ +∞ +∞ k
k
t A ψ |tc|p
tk Ak ψ
|tc| +∞ > M ≥ e = . k! p! k! p=0 k=0
k=0
9.2 Esponenziale di operatori non limitati: vettori analitici
411
Usando il teorema di Fubini-Tonelli per la misura prodotto delle due misure che contano i punti di N, possiamo calcolare il prodotto delle due serie che appare in fondo (interpretato come un integrale nella misura prodotto), come l’integrale doppio iterato, che appare sotto dopo M :
n
n +∞ +∞ |tc|n−k
tk Ak ψ
tn
n!cn−k Ak ψ
M ≥ ≥
(n − k)! k! n!
k!(n − k)!
n=0 k=0
n=0
=
k=0
+∞ n n=0
t ||(A + cI)n ψ|| . n!
Quanto ottenuto dimostra che A (A+cI) ⊃ A (A). Definiamo ora A := A+cI, per cui A = A + c I con c = −c. In base a quanto provato: A (A + c I) ⊃ A (A ): Ma questo equivale a A (A) ⊃ A (A+cI) e quindi A (A) = A (A+cI). La propriet` a (ii) `e ovvia per definizione. Passiamo a (iii). Si osservi prima di tutto che, √ per costruzione C ∞ (A) = C ∞ (A2 ). Inoltre, essendo A hermitiano e valendo x ≤ 1 + x per x ≥ 0, deve essere, su C ∞ (A): ||An ψ|| = (ψ|A2n ψ) ≤ ||ψ|| ||A2n ψ|| ≤ ||ψ||(1 + ||(A2 )n ψ||) . La tesi `e allora vera dato che, per t > 0, +∞ n n=0
+∞ +∞ tn tn t ||An ψ|| ≤ ||ψ|| ||(A2 )n ψ|| + ||ψ|| n! n! n! n=0 n=0
=
+∞ tn 2 n t . ||ψ|| ||(A ) ψ|| + e n! n=0
(d) Per un φ ∈ H, μφ,ψ `e la misura complessa μφ,ψ (E) := φ|P (A)(E)ψ e, per ogni χ ∈ H, μχ (E) := χ|P (A)(E)χ `e la solita misura spettrale positiva finita. Usando la decomposizione (vedi esempi 2.58) dμφ,ψ = hd|μφ,ψ | con |h| = 1 ovunque, si ha subito che, se ψ ∈ D(f(A)), allora:
f d|μφ,ψ | = fh dμφ,ψ = φ fh dP (A)ψ
R
R
R
!
|f|2 dμψ . ≤ ||φ||
fh dP (A)ψ
= ||φ|| R
R
Se z ∈ C e |z| ≤ t allora, usando il lemma 9.2 ed (e) del teorema 9.4:
n +∞ +∞ n
z n
z
x d|μφ,ψ (x)| =
|xn |d|μφ,ψ(x)|
n!
n! σ(A) σ(A) n=0 n=0 1/2 +∞ +∞ n t tn 2n ||φ|| x dμψ (x) = ||φ|| ||An ψ|| < +∞ , ≤ n! n! σ(A) n=0 n=0
412
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dove abbiamo usato la (9.69) nell’ultimo passaggio. Conseguentemente, Il teorema di Fubini-Tonelli implica che, se |z| ≤ t, possiamo scambiare il simbolo di serie con quello di integrale in:
+∞ n z n x dμφ,ψ (x) . σ(A) n=0 n!
Allora, se |z| ≤ t e se ψ appartiene al dominio di ezA (cfr definizione 9.10) e valendo (e) nel teorema 9.4, si ha subito: (φ|ezA ψ) =
ezx dμφ,ψ =
σ(A)
=
+∞ n z n x dμφ,ψ σ(A) n=0 n!
+∞ n +∞ n z z (φ|An ψ) . xn dμφ,ψ = n! n! σ(A) n=0 n=0
Dato che in virt` u di (9.69) la serie: +∞ n z n A ψ n! n=0
converge in H ed il prodotto scalare `e continuo, l’identit` a ottenuta sopra pu` o essere trascritta come: +∞
z n
zA n (φ|e ψ) = φ A ψ .
n! n=0 Per l’arbitrariet` a di φ questa equivale a (9.70). Nel caso in cui Rez = 0, cio`e z = is e s ∈ R, la funzione R x → eisx `e banalmente limitata e pertanto eisA ∈ B(H) (quindi con dominio dato da tutto H) per il corollario 9.5. (e). Se A `e autoaggiunto, da (c) di teorema 9.4 segue subito che, se s ∈ R, eisA(eisA )∗ = (eisA)∗ eisA = I, per cui eisA `e unitario. Usando (c) del teorema 9.4, segue immediatamente che se ψ ∈ C ∞ (A) ⊂ C ∞ (A) e An eisA ψ = eisAAn ψ, ma, dato che eisA `e unitario ||eisAAn ψ|| = ||An ψ|| da cui segue immediatamente la tesi. (f). Consideriamo la decomposizione spettrale A = R xdP (A)(x), quindi decomponiamo la retta reale R = ∪n∈Z (n, n + 1] ed infine consideriamo i sottospazi chiusi, a due a due ortogonali, Hn = Pn (H), dove abbiamo definito i proiettori ortogonali: Pn := (n,n+1] 1dP (A)(x). Scegliendo una base hilber(n)
tiana {ψk }k∈Kn ⊂ Hn per ogni n, l’unione di tali base forma ovviamente una base hilbertiana di H. Si osservi che supp(μψ(n) ) ⊂ (n, n + 1] come sek gue subito dalla definizione di μφ (teorema 8.30). Da (e) del teorema 9.4, (n) segue che ogni vettore ψk appartiene a D(A) essendo R |x|2dμψ(n) (x) = k |x|2 dμψ(n) (x) ≤ |n + 1|2 ed `e banalmente soddisfa (9.69) per ogni (n,n+1] k
9.3 Gruppi unitari a un parametro fortemente continui
(n)
413
(n)
t > 0, dato che ||Am ψk ||2 = (n,n+1] |x|2mdμψ(n) (x) ≤ |n + 1|2m||ψk ||2 . Le k combinazioni lineari finite di tali vettori sono, per costruzione, un sottospazio vettoriale denso in H, e sono anche vettori analitici per A (per ogni t > 0) in virt` u di (a). Consideriamo ora Nun polinomio di grado N a coefficienti generalmente complessi, pN (x) = k=0 xn , e definiamo pN (A) sul dominio D(pN (A)) = D(AN ) (n) ((d) di teorema 9.4). Vogliamo verificare che ciascuno dei vettori ψk determinati sopra `e un vettore analitico per l’operatore chiuso (autoaggiunto se pN `e reale) pN (A) per il teorema 9.4. Scegliamo uno dei vettori suddetti, di norma unitaria, che indicheremo con ψ, e supponiamo che la sua misura spettrale μψ abbia supporto in qualche intervallo finito (−L, L]. Abbiamo allora che ||Ak ψ|| ≤ Lk ||ψ|| = Lk come detto sopra. Conseguentemente:
N N N
k
ak A ψ ≤ |ak |||Ak ψ|| = |ak |Lk . ||pN (A)ψ|| =
k=0
k=0
k=0
Con la stessa procedura troviamo:
N
||pN (A)n ψ|| =
ak1 · · · akn Ak1 +···+kn ψ
k1 ,...,kn =0
≤
N
k1+···+kn
|ak1 | · · · |akn |||A
ψ|| ≤
k1 ,...,kn =0
N
|ak1 | · · · |akn |Lk1+···+kn .
k1 ,...,kn =0
Concludiamo che, se ML :=
N
k k=0 |ak |L ,
||pN (A)n ψ|| ≤ MLn
e
allora deve essere:
+∞ n t ||pN (A)n ψ|| ≤ etML n! n=0
e pertanto ψ (ma anche, per (a), ogni combinazione lineare di tali vettori) `e un vettore analitico per pN (A) per ogni valore di t > 0.
9.3 Gruppi unitari a un parametro fortemente continui Il fine di questa sezione `e la dimostrazione del teorema di Stone, che `e uno dei teoremi pi` u importanti per le applicazioni in meccanica quantistica (e non solo). Per enunciarlo discuteremo qualche risultato preliminare sui gruppi ad un parametro di operatori unitari ed, in particolare, un importante teorema di von Neumann. Discuteremo anche qualche utile propriet` a dei gruppi unitari ad un parametro in relazione alla continuit` a.
414
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
9.3.1 Gruppi unitari a un parametro fortemente continui, teorema di von Neumann Definizione 9.19. Sia H `e spazio di Hilbert. Una classe {Ut }t∈R ⊂ B(H) `e detta gruppo ad un parametro (di operatori) in H se vale U0 = I
e
Ut Us = Ut+s per ogni coppia t, s ∈ R .
(9.71)
Un gruppo ad un parametro {Ut }t∈R ⊂ B(H) `e detto: (a) gruppo unitario ad un parametro se Ut `e unitario per ogni t ∈ R, (b) debolmente continuo in t0 ∈ R oppure fortemente continuo in t0 ∈ R se l’applicazione t → Ut `e continua in t0 nella topologia operatoriale debole o, rispettivamente, in quella operatoriale forte, dotando R della topologia standard; (c) debolmente continuo oppure fortemente continuo se `e rispettivamente tale in ogni punto di R. Dalla condizione (9.71), se gli operatori Ut sono unitari, si ha: (Ut )∗ = Ut−1 = U−t ,
per ogni t ∈ R .
(9.72)
Proposizione 9.20. Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). I seguenti fatti sono equivalenti. (a) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (b) {Ut }t∈R `e debolmente continuo in t = 0. (c) {Ut }t∈R `e debolmente continuo. (d) {Ut }t∈R `e fortemente continuo in t = 0. (e) {Ut }t∈R `e fortemente continuo. Dimostrazione. Prima di tutto rietichettiamo come segue le proposizioni precedenti. (1) {Ut }t∈R `e debolmente continuo in t = 0. (2) (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H. (3) {Ut }t∈R `e fortemente continuo in t = 0. (4) {Ut }t∈R `e fortemente continuo. (5) {Ut }t∈R `e debolmente continuo. Infine mostriamo che (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (5) ⇒ (1). (1) ⇒ (2) e (2) ⇒ (3). La continuit` a per t = 0 nella topologia debole implica in particolare che, se t → 0, allora (ψ|Ut ψ) → (ψ|U0 ψ) = (ψ|ψ) ed anche, prendendo il complesso coniugato, (Ut ψ|ψ) → (U0 ψ|ψ) = (ψ|ψ). Viceversa, la continuit`a forte in t = 0 equivale a dire che, per ogni ψ ∈ H, se t → 0: ||Ut ψ − U0 ψ|| → 0 . Ricordando che U0 = I, prendendo il quadrato ed esprimendo la norma in termine del prodotto scalare, tale identit`a equivale a: (Ut ψ|Ut ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ|ψ) → 0 .
9.3 Gruppi unitari a un parametro fortemente continui
415
La condizione di unitariet` a per Ut implica che (Ut ψ|Ut ψ) = (ψ, ψ), da cui, l’identit` a di sopra si pu` o ancora riscrivere come: (ψ|ψ) − (ψ|Ut ψ) − (Ut ψ|ψ) + (ψ, ψ) → 0 ,
se t → 0 .
Come precisato all’inizio della dimostrazione, questa identit`a `e banalmente verificata nelle nostre ipotesi. (3) ⇒ (4). Se ψ ∈ H, vale: Ut ψ − Ut0 ψ = Ut (ψ − Ut−1 Ut0 ψ) = Ut (ψ − Ut0 −t ψ) , dove abbiamo sfruttato l’identit` a (9.72). In definitiva, usando il fatto che Ut `e unitario, per ogni ψ ∈ H troviamo: ||Us ψ − Ut0 ψ|| = ||Us (ψ − Ut0 −s ψ)|| = ||ψ − Ut0 −s ψ|| . Nelle ipotesi di forte continuit`a in t = 0, tenendo conto che t0 − s → 0 per s → t0 si ha che ||Us ψ − Ut0 ψ|| → 0. Quindi la continuit` a forte per t = 0 implica la continuit`a forte per ogni t0 ∈ R. ` ovvia dal fatto che la convergenza nella topologia forte implica (4) ⇒ (5). E quella nella topologia debole. ` banalmente vera per definizione. (5) ⇒ (1). E Un’altra utile propriet` a dei gruppi unitari ad un parametro `e la seguente. Proposizione 9.21. Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). Sia H ⊂ H un sottoinsieme tale che: (a) lo spazio < H > finitamente generato da H `e denso in H, (b) {Ut }t∈R soddisfa (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H, allora {Ut }t∈R `e un gruppo unitario ad un parametro fortemente continuo. Dimostrazione. Usando la stessa dimostrazione fatta per la proposizione 9.20, si ha subito che (φ0 |Ut φ0 ) → (φ0 |φ0 ) per t → 0 con φ0 ∈ H, implica che ||Ut φ0 −φ0 || → 0 per t → 0. Se pi` u in generale φ ∈< H > allora φ = i∈I ci φ0i dove I `e finito e φ0i ∈ H. Di conseguenza, se t → 0,
ci φ0i − ci φ0i
=
ci (Ut φ0i − φ0i )
||Ut φ − φ|| =
Ut
i
≤
i
i
|ci |||Ut φ0i − φ0i || → 0 .
i
Per la proposizione 9.20, per dimostrare la tesi `e allora sufficiente estendere il risultato a tutto H. Dobbiamo cio`e provare che ||Ut φ − φ|| → 0 per t → 0 per ogni φ ∈< H > implica ||Ut ψ − ψ|| → 0 se t → 0 per ogni ψ ∈ H. Dato che < H > `e denso, per ogni ψ ∈ H fissato, esister`a una successione {ψn }n∈N ⊂ H con ψn → φ se n → +∞. Se {tm }m∈N `e una successione di
416
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
reali che tende a 0, vale allora, dalla disuguaglianza triangolare e per n ∈ N fissato: ||Utm ψ − ψ|| ≤ ||Utm ψ − Utm φn || + ||Utm φn − φn || + ||φn − ψ|| . Ossia, tenendo conto che gli Utm sono unitari e che la norma `e non negativa: 0 ≤ ||Utm ψ − ψ|| ≤ ||Utm φn − φn || + 2||φn − ψ|| .
(9.73)
Per n fisso, am := ||Utm φn − φn || → 0 se m → +∞ per ipotesi, per cui: lim sup ||Utm φn − φn || = lim inf ||Utm φn − φn || = m
m
lim ||Utm φn − φn || = 0 .
m→+∞
Di conseguenza, dalla disuguaglianza (9.73) abbiamo che, per ogni n ∈ N: 0 ≤ lim sup ||Utm ψ − ψ|| ≤ 2||φn − ψ|| , 0 ≤ lim inf ||Utm ψ − ψ|| ≤ 2||φn − ψ|| . m
m
D’altra parte, prendendo n sufficientemente grande, possiamo rendere piccolo a piacere ||φn − ψ||. Concludiamo che: lim sup ||Utm ψ − ψ|| = lim inf ||Utm ψ − ψ|| = 0 , m
m
per cui esiste: lim ||Utm ψ − ψ|| = 0 .
m→+∞
Dato che ψ ∈ H e la successione {tm }m∈N con tm → 0 erano arbitrari, concludiamo che, per ogni ψ ∈ H: lim ||Ut ψ − ψ|| = 0 .
t→0
La dimostrazione `e terminata.
La teoria fino ad ora dimostrata consente di provate un importante risultato, dovuto a von Neumann, che mostra come la continuit` a forte dei gruppi unitari ad un parametro sia effettivamente molto debole negli spazi di Hilbert separabili. Teorema 9.22. (Di von Neumann.) Sia {Ut }t∈R un gruppo unitario ad un parametro nello spazio di Hilbert (H, (·|·)). Se H `e separabile, {Ut }t∈R `e fortemente continuo se e solo se la funzione R t → (Ut ψ|φ) `e Borel misurabile per ogni scelta di ψ, φ ∈ H. Dimostrazione. Ovviamente se il gruppo `e fortemente continuo allora ogni funzione R t → (Ut ψ|φ) `e Borel misurabile essendo continua. Mostriamo che vale il viceversa. Assumiamo che ognuna delle funzioni suddette sia Borel misurabile. Di conseguenza sar` a Lebesgue misurabile. Dalla disuguaglianza di
9.3 Gruppi unitari a un parametro fortemente continui
417
Schwarz e da ||Ut || = 1 concludiamo che tali funzioni sono anche limitate. Pertanto, se a ∈ R e e ψ ∈ H sono fissati: a H φ → (Ut ψ|φ)dt 0
`e un funzionale lineare limitato con norma non superiore a |a| ||ψ|| per la disuguaglianza di Schwarz e ||Ut || = 1. Per il teorema 3.17 di Riesz esiste ψa ∈ H tale che: a (Ut ψ|φ)dt , per ogni φ ∈ H. (ψa |φ) = 0
Possiamo allora scrivere che:
(Ub ψa |φ) = (ψa |U−b φ) =
a
= 0
(Ut+b ψ|φ)dt =
0
a
(Ut ψ|U−b φ)dt
a+b
(Ut ψ|φ)dt . b
Quindi, spezzando l’integrale in modo ovvio:
a
a+b
(Ut ψ|φ)dt − (Ut ψ|φ)dt |(Ub ψa |φ) − (ψa |φ)| =
b
0
0
=
(Ut ψ|φ)dt
+
b
a
a+b
(Ut ψ|φ)dt ≤ 2b||φ|| ||ψ||.
Di conseguenza: (Ub ψa |φ) → (ψa |φ) se b → 0 e pertanto, prendendo il complesso coniugato di ambo membri: lim (φ | Ub ψa ) → (φ | ψa ) .
t→0
Se riusciamo a provare che l’insieme dei vettori {ψa | ψ ∈ H, a ∈ R} genera finitamente un sottospazio denso in H, in base alla proposizione precedente e scegliendo φ = ψa , possiamo concludere che il gruppo unitario `e fortemente continuo. Sia φ ∈ {ψa | ψ ∈ H, a ∈ R}⊥ e sia {ψ(n) }n∈N una base hilbertiana numerabile per H, che esiste in quanto H `e separabile. Allora, per ogni n ∈ N, vale: a 0 = (ψa(n) |φ) = (Ut ψ(n) |φ)dt per ogni a ∈ R , 0
che (vedi (b) nel teorema C.6) implica che R t → (Ut ψ(n) |φ) sia nulla quasi ovunque.4Sia Sn ⊂ R l’insieme su cui la funzione non 4 si annulla e si fissi t0 ∈ R \ n∈N Sn . Si osservi che t0 esiste dato che n∈N Sn non pu` o coincidere con R avendo misura nulla essendo unione numerabile di insiemi di misura nulla (in questo punto si usa la richiesta che la base hilbertiana sia
418
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
numerabile e cio`e H sia separabile). Deve allora essere (Ut0 ψ(n) |φ) = 0 per ogni n che implica che φ = 0, dato che Ut0 `e unitario e quindi {Ut0 ψ(n) }n∈N `e ancora base hilbertiana. Essendo {ψa | ψ ∈ H, a ∈ R}⊥ = {0}, lo spazio generato da {ψa | ψ ∈ H, a ∈ R} `e denso come richiesto e ci`o conclude la dimostrazione. Osservazione 9.23. Nel teorema si pu`o sostituire la richiesta di Borel misurabilit` a con la misurabilit` a rispetto alla σ-algebra di Lebesgue. Infatti, se vale la Lebesgue misurabilit` a, la dimostrazione non cambia e mostra che il gruppo `e fortemente continuo. Se il gruppo `e fortemente continuo allora vale la Borel misurabilit` a, e quindi anche la Lebesgue-misurabilit`a, delle funzioni nell’enunciato del teorema. 9.3.2 Gruppi unitari a un parametro generati da operatori autoaggiunti e teorema di Stone In questa sezione enunceremo e proveremo il celebre teorema di Stone, che caratterizza i gruppi unitari ad un parametro fortemente continui, provando che si possono sempre ottenere esponenziando operatori autoaggiunti. Useremo successivamente tali tipi di gruppi per dare una condizione necessaria e sufficiente per la commutativit`a delle misure spettrali di operatori autoaggiunti. Abbiamo bisogno di un risultato tecnico preliminare che enunciamo separatamente visto che si tratta di una costruzione utile in vari contesti. Nell’enunciato, come al solito, dx `e la misura di Lebesgue su Rn e χ[a,b] `e la funzione caratteristica di [a, b]. Proposizione 9.24. Sia H spazio di Hilbert complesso e {Vt }t∈Rn ⊂ B(H) una classe di operatori che soddisfi le due seguenti condizioni: (i) valga s-limt→t0 Vt = Vt0 , per ogni t0 ∈ Rn , (ii) esista C ≥ 0 tale che ||Vt || ≤ C per ogni t ∈ Rn . 1 n Allora, per ogni f ∈ L (R , dx) esiste un unico operatore in B(H), indicato con Rn f(t)Vt dt, tale che:
φ
Rn
f(t)Vt dt ψ
= Rn
f(t) (φ|Vt ψ) dt
per ogni φ, ψ ∈ H.
(9.74)
compatto, la validit` a della sola Se f ∈ L1 (Rn , dx) ha supporto (essenziale) condizione (i) assicura l’esistenza di Rn f(t)Vt dt suddetto. Tale operatore soddisfa in ogni caso le propriet` a seguenti. (a) per ogni ψ ∈ H:
Rn
f(t)Vt dtψ
≤
Rn
|f(t)| ||Vt ψ|| dt .
(9.75)
9.3 Gruppi unitari a un parametro fortemente continui
(b) Se A ∈ B(H): A f(t)Vt dt = Rn
f(t)AVt dt
Rn
e Rn
419
f(t)Vt dtA =
Rn
f(t)Vt Adt .
(9.76) (c) Se, per n = 1, definiamo s f(τ )Vτ dτ := R g(τ )f(τ )Vτ dτ dove g = χ[s,t] se s ≥ t e g = −χ[t,s] se t ≤ s allora:
t
(i) R2 (s, t) →
t
f(τ )Vτ dτ s
(ii) se f `e continua, allora
`e continua nella topologia uniforme, d t f(τ )Vτ dτ = f(t)Vt ∀s, t ∈ R . sdt s (9.77)
Dimostrazione. Siano ψ, φ ∈ H e f : Rn → C una funzione in L1 (Rn , dx). Consideriamo l’integrale: I(φ, ψ) := f(t) (φ|Vt ψ) dt . Rn
Tale integrale `e ben definito, dato che Rn t → (φ|Vt ψ) `e continua essendo {Vt }t∈Rn debolmente continuo ed `e limitata per (ii) dalla disuguaglianza di Schwarz. Da ci` o segue banalmente che: |I(φ, ψ)| ≤ ||f||1C||ψ||||φ|| . Dato che H ψ → I(φ, ψ) `e lineare e vale la disuguaglianza scritta sopra, l’applicazione diretta del teorema di Riesz prova che, per ogni φ ∈ H esiste un unico vettore Φφ ∈ H che soddisfa: I(φ, ψ) = (Φφ |ψ) ,
per ogni ψ ∈ H.
Si verifica subito che l’applicazione H φ → T φ := Φφ `e lineare, inoltre, per costruzione vale: |(ψ|T φ)| = |(T φ|ψ)| = |(Φφ|ψ)| = |I(φ, ψ)| ≤ ||f||1 C||ψ||||φ|| ,
se φ, ψ ∈ H.
Scegliendo ψ = T φ si ha subito che T `e limitato e quindi lo `e il suo aggiunto che indichiamo con Rn f(t)Vt dt. Per costruzione vale allora (9.74) e la procedura assicura l’unicit`a dell’operatore costruito. Dall (9.74) si ha anche:
φ
f(t)V dt ψ ≤ |f(t)| |(φ|V ψ)| dt ≤ |f(t)| ||Vt ψ|| dt ||φ|| t t
Rn
Rn
Rn
a (9.76) e quindi, scegliendo φ = Rn f(t)Vt dtψ si arriva alla (9.75). L’identit` segue facilmente dalla (9.74). Nel caso in cui il supporto essenziale di f sia incluso in un compatto K si pu` o, equivalentemente, definire I(ψ, φ) integrando
420
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
su tale insieme e procedere con il resto della dimostrazione come fatto sopra. In tal caso, l’esistenza della costante C in (ii) (con t ∈ K) `e automaticamente garantita. Infatti, per continuit` a, comunque scegliamo ψ ∈ H, esiste Cψ ≥ 0 tale che ||Vt ψ|| ≤ Cψ se t ∈ K. Per il teorema di Banach-Steinhaus questo implica che esiste C ≥ 0 tale che ||Vt|| ≤ C se t ∈ K. Passiamo a provare (c). Sia [a, b] grande a sufficienza in modo che [a, b] × [a, b] includa un intorno aperto di (t, s) e (t , s ) appartenga a tale intorno. Da (a) segue facilmente che:
s
s
f(τ )V (τ )dτ ψ − f(τ )V (τ )dτ ψ
t
t ≤ (|t − t | + |s − s |) sup |f(τ )| sup ||Vτ ψ|| . τ∈[a,b]
τ∈[a,b]
Prendendo l’estremo superiore su ||ψ|| ≤ 1, tenendo conto che ||Vτ || ≤ C < s s t s s +∞ se τ ∈ [a, b] come osservato sopra, ed essendo t − t = t + t − t = t s + s , vale: t
s
s
f(τ )V (τ )dτ − f(τ )V (τ )dτ
≤ (|t − t | + |s − s |) sup |f(τ )|C ,
t τ∈[a,b] t da cui la continuit` a nella topologia uniforme. Riguardo alla seconda propriet` a, notiamo che, dalla continuit` a in senso forte della funzione t → f(t)Vt , nel caso in cui h → 0 vale:
" #
1 τ+h
1
τ+h
f(t)Vt dt ψ − f(τ )Vτ ψ
=
(f(t)Vt − f(τ )Vτ )dt ψ
h τ
h τ
≤
τ+h dt
τ |h| =
sup |t −τ|≤h
sup |t −τ|≤h
||f(t )Vt ψ − f(τ )Vτ ψ||
||f(t )Vt ψ − f(τ )Vτ ψ|| → 0 .
Ecco il teorema di Stone. In realt`a il risultato dovuto a Stone nel teorema seguente `e la parte (b), che `e la meno banale dell’enunciato. Teorema 9.25. (Di Stone.) Sia H uno spazio di Hilbert. Vale quanto segue. (a) Se A : D(A) → H, con D(A) denso in H, `e un operatore autoaggiunto e P (A) `e la sua misura spettrale, gli operatori: eiλt dP (A)(λ) con t ∈ R , Ut = eitA := σ(A)
costituiscono un gruppo unitario ad un parametro fortemente continuo. Inoltre:
9.3 Gruppi unitari a un parametro fortemente continui
421
(i ) esiste in H il limite: s-
Ut ψ − ψ dUt
ψ := lim t→0 dt t=0 t
(9.78)
se e solo se ψ ∈ D(A), (ii ) se ψ ∈ D(A) vale:
dUt
ψ = iAψ . sdt t=0
(9.79)
(b) Se {Ut }t∈R `e un gruppo unitario ad un parametro fortemente continuo in H esiste, ed `e unico, un operatore autoaggiunto A : D(A) → H (con D(A) denso in H) tale che: eitA = Ut ,
per ogni t ∈ R.
(9.80)
Dimostrazione. (a). Se t ∈ R, R λ → eitλ `e banalmente limitata e quindi vale eitA ∈ B(H) per il corollario 9.5. Da (c) di teorema 9.4 segue subito che (con t ∈ R): eitA (eitA )∗ = (eitA )∗ eitA = I, per cui eitA `e unitario. Per provare che il gruppo `e fortemente continuo `e sufficiente verificare che (ψ|Ut ψ) → (ψ|ψ) per t → 0 e per ogni ψ ∈ H, in virt` u della proposizione 9.20. Questo fatto `e vero dato che, per (f) del teorema 9.4, tenendo conto che il dominio di eitA `e tutto H: (ψ|Ut ψ) = eitλ dμψ (λ) → 1dμψ (λ) = (ψ|ψ) per t → 0 . σ(A)
σ(A)
Sopra abbiamo tenuto conto del fatto che eitλ → 1 e quindi possiamo applicare il teorema della convergenza dominata di Lebesgue, dato che |eitλ | = 1 per ogni t e la funzione che vale costantemente 1 `e integrabile perch´e μψ `e finita. Passiamo ora a provare le propriet`a (i) e (ii). Se ψ ∈ D(A), allora usando (c) del teorema 9.4, si calcola facilmente:
iλt
2
2
Ut − I
e − 1
=
dμψ (λ) . ψ − iAψ − iλ
t
t σ(A)
(9.81)
D’altra parte: |eiλt − 1| = 2| sin(λt/2)| ≤ |λt| e quindi:
iλt
2
e − 1
− iλ
≤ 4|λ|2 .
t La funzione R λ → |λ|2 `e integrabile rispetto a μψ per definizione di D(A) ψ. Infine:
iλt
2
e − 1
→ 0 se t → 0 per ogni λ ∈ R. − iλ
t
422
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Possiamo allora applicare il teorema della convergenza dominata al secondo membro di (9.81) ottenendo che:
Ut − I
→ 0 se t → 0 per ogni ψ ∈ D(A). ψ − iAψ
t
Per concludere la prova di (i) e (ii), mostriamo che se Ut ψ−ψ → φψ ∈ H, per t t → 0, allora ψ ∈ D(A). Si verifica subito che l’insieme dei vettori ψ ∈ H per cui esiste il limite suddetto formano un sottospazio D(B) di H che contiene, ovviamente, D(A) ed `e quindi denso. L’applicazione ψ → iBψ := φψ definisce un operatore con dominio D(B) denso. Se ψ, ψ ∈ D(B) vale, usando il fatto che Ut∗ = U−t :
Ut ψ − ψ
Ut ψ − ψ = −i lim ψ
(ψ|Bψ ) = ψ
−i lim t→0 t→0 t t
U−t ψ − ψ
U−t ψ − ψ
= −i lim lim
ψ = −i t→0
ψ = (Bψ|ψ ) . t→0 t −t Concludiamo che B `e un’estensione simmetrica di A. Tuttavia, dato che A `e autoaggiunto deve essere B = A per (d) di proposizione 5.16 e quindi ogni vettore ψ per cui esiste il limite di Ut ψ−ψ per t → 0 deve appartenere a D(A). t Questo conclude la dimostrazione di (a). (b). Cominciamo a notare che la prova dell’unicit` a di A `e immediata. Se ci sono due operatori autoaggiunti A e A con eitA = Ut = eitA per ogni t ∈ R, in base a (i) e (ii) di (a), deve risultare A = A . Costruiamo ora un operatore autoaggiunto A che soddisfi Ut = eitA per un fissato gruppo unitario ad un parametro fortemente continuo. Specializziamo la situazione discussa nella proposizione 9.24 al caso Vt = Ut gruppo unitario ad un parametro fortemente continuo. Indichiamo con arding, lo spazio vettoriale D, detto spazio di G˚ dei vettori della forma R f(t)Ut dtφ con φ ∈ H con un’arbitraria f ∈ D(R) (spazio delle funzioni su R complesse, infinitamente differenziabili, a supporto compatto). Dalla (9.74) segue facilmente la propriet` a di invarianza Us D ⊂ D per ogni s ∈ R, pi` u precisamente vale: Us f(t)Ut dtψ = f(t)Ut+s dtψ = f(t − s)Ut dtψ per ogni ψ ∈ H. R
R
R
(9.82) Ut ψ−ψ Mostriamo che, se ψ ∈ D allora → ψ ∈ H se t → 0. Supponiamo che 0 t ψ = f(t)U dtφ. Con qualche passaggio, usando (9.82) e la definizione di t R f(t)U dtφ, si vede che: t R
2
Ut ψ − ψ
− f (s)Us dsφ
t R
f(s − t) − f(s) f(r − t) − f(r) = − f (s) Us dsφ
− f (r) Ur drφ t t R R
9.3 Gruppi unitari a un parametro fortemente continui
423
=
ds R
R
drht (s)ht (r) (φ|Ur−s φ) ,
dove
f(s − t) − f(s) − f (s) . t Si osservi che, per ogni t ∈ R, la funzione s → ht (s) ha supporto in un compatto ed `e C ∞ (ed `e quindi limitata). Dato che (r, s) → (φ|Ur−s φ) `e anch’essa una funzione limitata, concludiamo che possiamo interpretare l’integrale di sopra nella misura di Lebesgue prodotto:
2
Ut ψ − ψ
− f (t)Ut dtφ
= dsdrht (s)ht (r) (φ|Ur−s φ) . (9.83)
t R R×R ht (s) :=
Dato che l’integrando tende a 0 puntualmente se t → 0 e che le funzioni (s, r) → ht (s)ht (r) (φ|Ur−s φ) hanno supporto contenuto in un unico compatto abbastanza grande quando t varia in un intervallo limitato attorno a 0 e che ivi sono uniformemente limitate da qualche costante indipendente da t (questo segue dal fatto che la funzione (t, s, r) → ht (s)ht (r) (φ|Ur−s φ) `e continua congiuntamente in tutte le variabili), possiamo applicare il teorema della convergenza dominata, ottenendo che entrambi i membri di (9.83) svaniscono per t → 0. Abbiamo ottenuto che, se ψ ∈ D, allora vale Ut ψ−ψ → ψ0 ∈ H per t → 0. L’applicazione ψ → iSψ := ψ0 t `e lineare come si dimostra facilmente. Procedendo come nella dimostrazione di (a), si verifica facilmente che S `e hermitiano. In realt`a S `e simmetrico dato che D `edenso, come ora verifichiamo. Se φ ∈ H si consideri la successione di vettori R fn (t)Ut dtφ, dove le funzioni fn ∈ D(R) soddisfano: fn ≥ 0, supp fn ⊂ [−1/n, 1/n] e R fn (s)ds = 1. Abbiamo che
fn Ut dtψ − ψ
=
fn Ut dtψ −
fn dtψ
=
fn (Ut − I)dtψ
R
R
R
≤
R
|fn (t)| ||(Ut − I)ψ|| dt
R
dove abbiamo usato (9.75) per la classe di operatori Vt = Ut − I. Dato che: 1/n |fn (t)| ||(Ut − I)ψ|| dt ≤ |fn (t)| dt sup ||(Ut − I)ψ|| R
−1/n
=
sup
t∈[−1/n,1/n]
||(Ut − I)ψ||
t∈[−1/n,1/n]
e supt∈[−1/n,1/n] ||(Ut − I)ψ|| → 0 per n → ∞, essendo la classe degli Ut fortemente continua, concludiamo che: D fn (t)Ut dtφ → φ ∈ H , per n → ∞ R
424
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
e quindi D `e denso in H. Di conseguenza S `e simmetrico. Mostriamo ora che S `e essenzialmente autoaggiunto su D. Se ψ± ∈ Ran(S ± iI)⊥ , allora, per ogni χ ∈ D vale:
Uh Ut χ − Ut χ d (ψ± |Ut χ) = lim ψ±
= (ψ± |iSUt χ) h→0 dt h = i (ψ± |(S ± iI)Ut χ) ± (ψ± |Ut χ) = ± (ψ± |Ut χ) e quindi la funzione F± (t) := (ψ± |Ut χ) ha la forma F±(0)e±t . Dovendo essere limitata (dato che ||Ut || = 1 per ogni t ∈ R), questo `e possibile solo se F±(0) = 0 e quindi ψ± = 0, che implica a sua volta che Ran(S ± iI) = H. Per il teorema 5.18, questo significa che S : D → H `e essenzialmente autoaggiunto. Sia dunque S l’unica estensione autoaggiunta di S. Per concludere la dimostrazione si osservi che se Vt := eitS allora, per ogni coppia ψ, φ ∈ D vale: d d (ψ |(Vt )∗ Ut φ) = (Vt ψ|Ut φ) = (iSVt ψ|Ut φ) + (Vt ψ|iSUt φ) dt dt = − (Vt ψ|iSUt φ) + (Vt ψ|iSUt φ) = 0 . Pertanto (ψ|(Vt )∗ Ut φ) = (ψ|Iφ) e quindi, essendo D denso: (Vt )∗ Ut = I cio`e vale Ut = eitS per ogni t ∈ R. Un collegato elementare, ma utile, risultato tecnico `e il seguente. Proposizione 9.26. Se A `e operatore autoaggiunto nello spazio di Hilbert H, e si definisce Ut := eitA con t ∈ R, allora, per ogni f : σ(A) → C Borel misurabile vale: ∀t ∈ R ∀ψ ∈ D(f(A)). (9.84) Dimostrazione. ψ ∈ D(f(A)) se e solo se σ(A) |f(λ)|2 dμψ (λ) < +∞. D’altra parte, la misura μψ e la misura μUt ψ coincidono, in quanto: Ut f(A)ψ = f(A)Ut ψ ,
(Ut ψ|P (A)(E)Ut ψ) = (ψ|Ut∗ P (A)(E)Ut ψ) , ma Ut∗ P (A)(E)Ut = P (A) (E) come segue immediatamente da (9.13) e (9.14) in (c) del teorema 9.4, tenendo conto che nel caso in esame tutti gli integrali sono riferiti a funzioni limitate e pertanto gli operatori coinvolti hanno tutti dominio dato da tutto lo spazio di Hilbert. Concludiamo che ψ ∈ D(f(A)) se e solo se Ut ψ ∈ D(f(A)). Viceversa vale banalmente f(A)ψ ∈ D(Ut ) = H essendo Ut unitario. In queste ipotesi, usando ancora (9.13) e (9.14) in (c) del teorema 9.4, si ha che Ut f(A)ψ = f(A)Ut ψ per ogni ψ ∈ D(f(A)) e cio`e vale (9.84). Un ulteriore consequente risultato tecnico utile nelle applicazione `e dato nell’esercizio 9.15. Passiamo a dare una definizione che risulter`a fondamentale nelle applicazioni in fisica come vedremo nei capitoli 11 e 12.
9.3 Gruppi unitari a un parametro fortemente continui
425
Definizione 9.27. Sia H uno spazio di Hilbert e {Ut }t∈R ⊂ B(H) un gruppo unitario ad un parametro fortemente continuo. L’unico operatore autoaggiunto su A tale da soddisfare (9.80) `e detto generatore (autoaggiunto) di {Ut }t∈R ⊂ B(H). Il teorema di Stone ha un diversi utili corollari. Uno `e il seguente. Corollario 9.28. Se A : D(A) → H, con D(A) denso in H, `e un operatore autoaggiunto (in generale non limitato) sullo spazio di Hilbert H e se U : H → H1 `e un isomorfismo di spazi di Hilbert (operatore isometrico suriettivo), allora: −1 U eisA U −1 = eisU AU , per ogni s ∈ R . In particolare la tesi `e vera se H = H1 e U `e unitario. Dimostrazione. L’operatore U AU −1 `e evidentemente autoaggiunto su U D(A) come `e facile provare, applicando la definizione. Pertanto il gruppo uni−1 tario ad un parametro fortemente continuo {eisU AU }s∈R `e ben definito. Essendo U un isomorfismo di spazi di Hilbert, si verifica immediatamente che {U eisAU −1 }s∈R `e un secondo gruppo unitario ad un parametro fortemente continuo definito sullo stesso spazio di Hilbert H1 . Ulteriormente, se ψ = U −1 φ ∈ U −1 D(A) allora: U eisA U −1 ψ − ψ U eisA φ − U φ = lim s→0 s→0 s s lim
eisAφ − φ = iU Aφ = U AU −1 ψ . s→0 s
= U lim
In base al teorema di Stone il generatore del gruppo {U eisAU −1 }s∈R `e quindi un’estensione autoaggiunta di U AU −1 che, essendo autoaggiunto, non ha estensioni autoaggiunte proprie. Di conseguenza il generatore del gruppo {U eisAU −1 }s∈R coincide con U AU −1 stesso e quindi: U eisAU −1 = eisU AU
−1
,
per ogni s ∈ R .
Osservazione 9.29. Per certi aspetti, il teorema di Stone pu` o vedersi come sottocaso di un teorema pi` u generale, che deriva dal Teorema di Hille-Yoshida [Rud91], che ha avuto importanti conseguenze in fisica matematica nelle applicazioni della teoria dei semigruppi. Ricordiamo che sullo spazio di Banach (X, ||||), un semigruppo fortemente continuo di operatori, {Qt }t∈[0,+∞) , `e una classe di operatori Qt ∈ B(X) tali che (a) Q(0) = I, (b) Qt+s = Qt Qs se s, t ∈ [0, +∞) e (c) ||Qtψ − ψ|| → 0 se t → 0, per ogni ψ ∈ X. Si dimostra [Rud91] che ogni semigruppo fortemente continuo ammette un unico generatore, cio`e un operatore A in X, completamente individuato dalla richiesta
426
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
che (la derivata `e calcolata rispetto alla norma di X): d Qt ψ = −AQt ψ = −Qt Aψ dt
per ogni ψ ∈ D(A).
Risulta che D(A) ⊂ X `e un sottospazio denso. Specializzandoci al caso di un semigruppo fortemente continuo {Qt }t∈[0,+∞) , su X = H spazio di Hilbert e con operatori Qt normali (limitati), risulta [Rud91] che (1) esiste sempre un generatore A del semigruppo, (2) tale generatore `e un operatore normale (non limitato in generale), (3) vale: Qt = e−tA , dove il secondo membro viene definito come integrale della funzione: σ(A) λ → e−tλ rispetto alla PVM della decomposizione spettrale di A (estendendo il teorema spettrale 9.9 al caso di operatori normali non limitati [Rud91]). Infine, (4) lo spettro di A `e limitato inferiormente nei reali, cio`e: esiste γ ∈ R tale che γ < Re(λ) per ogni λ ∈ σ(A). 9.3.3 Commutativit` a di operatori e misure spettrali Come ultimo risultato possiamo enunciare e provare un teorema riguardante la commutativit` a delle misure spettrali di due operatori autoaggiunti, usando i gruppi ad un parametro da essi generati. Nel caso di operatori autoaggiunti limitati le misure spettrali commutano se e solo se gli stessi operatori commutano come segue facilmente dal teorema spettrale (vedi anche l’osservazione 9.31). Nel caso di operatori non limitati vi sono in generale problemi di dominio e la condizione basata sulla commutativit`a degli operatori non `e utilizzabile. L’uso dei gruppi unitari `e un modo semplice per ovviare il problema dei domini. Il seguente teorema ha larghe applicazioni in Meccanica Quantistica. Teorema 9.30. Siano A e B due operatori (in generale non limitati) sullo spazio di Hilbert H e sia A autoaggiunto. Valgono i fatti seguenti. (i) Assumendo B autoaggiunto e denotando con P (A) e P (B) le misure spettrali di A e B rispettivamente, le seguenti quattro richieste sono equivalenti. (a) Per ogni coppia di boreliani E, E ⊂ R: P (A) (E)P (B) (E ) = P (B) (E )P (A) (E) . (b) Per ogni boreliano E ⊂ R e ogni s ∈ R: P (A)(E)e−isB = e−isB P (A) (E) . (c) Per ogni coppia di numeri reali t, s ∈ R: e−itA e−isB = e−isB e−itA .
9.3 Gruppi unitari a un parametro fortemente continui
427
(d) Per ogni numero reale t ∈ R: e−itABψ = Be−itA ψ ,
e−itAD(B) ⊂ D(B) e
se ψ ∈ D(B).
(ii) Se, nelle ipotesi di (i), vale una delle quattro condizioni precedenti allora vale anche: se ψ ∈ D(AB) ∩ D(BA)
ABψ = BAψ
(Aϕ| Bψ) − (Bϕ|Aψ) = 0 se ψ, ϕ ∈ D(A) ∩ D(B). (iii) Se B ∈ B(H) (non necessariamente autoaggiunto), le due seguenti condizioni sono equivalenti. (e) BAϕ = ABϕ per ogni ϕ ∈ D(A). (f ) Bf(A)ψ = f(A)Bψ per ogni ψ ∈ D(f(A)) e ogni f : σ(A) → R Borel misurabile. Dimostrazione. (i) Facendo uso della definizione 9.10, l’identit` a in (b) pu` o essere trascritta equivalentemente: (A) (A) −itλ −isμ (B) −isμ (B) e dPλ e dPμ = e dPμ e−itλ dPλ R
R
R
R
per ogni t, s ∈ R,
(9.85)
dove abbiamo usato la definizione standard di integrale di funzioni misurabili limitate rispetto ad una misura spettrale facendo uso di (a) del teorema 9.4. Il fatto che (a) implichi (c) `e immediato dalla definizione stessa di integrale di una funzione limitata rispetto ad una misura spettrale introdotta nel capitolo 8, lavorando con la topologia operatoriale forte. Proviamo che (c) implica (b) e che (b) implica (a). Per dimostrare che (c) implica (b), che da (9.85), notiamo
−itλ (A) −isB se Us := e , ψ, φ ∈ H, s ∈ R sono fissati, si ha: ψ R e dPλ Us φ =
(A) Us∗ ψ R e−itλ dPλ φ per ogni t ∈ R, ossia:
−itλ
e R
(A) dμψ,Usφ (λ)
= R
(A)
e−itλ dμU ∗ ψ,φ (λ) ,
(9.86)
s
dove abbiamo introdotto le misure complesse come in (c) del teorema 8.30. Possiamo trasformare gli integrali suddetti in integrali rispetto a misure positive finite usando il teorema Radon-Nykodim (vedere (1) in esempi 2.58). Successivamente, facendo uso del teorema di Fubini-Tonelli in (9.86), concludiamo che, se f `e la trasformata di Fourier di una qualsiasi funzione dello spazio di Schwarz S(R) (vedi capitolo 3), deve risultare: R
R
f(t) e−itλ dt
(A)
dμψ,Usφ (λ) =
R
R
f(t) e−itλ dt
(A)
dμUs∗ψ,φ (λ) .
428
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Dato che la trasformata di Fourier trasforma lo spazio S(R) nello stesso spazio S(R) biettivamente, concludiamo che l’identit`a di sopra pu` o essere riscritta come: (A) (A) g(λ) dμψ,Usφ (λ) = g(λ) dμU ∗ ψ,φ (λ) per ogni g ∈ S(R). (9.87) R
R
s
Se h ∈ Cc (R) (spazio delle funzioni continue a supporto compatto) la successione di funzioni: 3 2 n gn (x) := e−n(x−y) /4 h(y)dy 4π R soddisfa gn ∈ D(R) e converge uniformemente ad h per n → +∞. Dato che gn ∈ D(R) ⊂ S(R) e gn → h ∈ Cc (R) nella norma dell’estremo superiore e le misure sono finite, (9.87) implica che: (A) (A) h(λ) dμψ,Usφ (λ) = h(λ) dμU ∗ ψ,φ (λ) per ogni h ∈ Cc (R). (9.88) R
R
s
Il teorema 2.62 di Riesz per misure complesse implica che le due misure che definiscono i due integrali nei due membri dell’identit`a di sopra sono in realt` a la stessa misura. In altre parole, tenendo conto dell’espressione esplicita di tali misure complesse come in (c) del teorema 8.30:
ψ P (A)(E)Ut φ = Us∗ ψ P (A) (E)φ (9.89) per ogni boreliano E ⊂ R e ogni s ∈ R. tCon ovvi passaggi, data l’arbitrariet` a di ψ e φ, si ricava che vale (b): P (A)(E)e−isB = e−isB P (A)(E)
per ogni boreliano E ⊂ R e ogni s ∈ R. (9.90) Per concludere proviamo che (b) implica (a). Iterando un’altra volta il procedimento per dimostrare che (c) implica (b), dove ora l’operatore e−isB rimpiazza il precedente e−itA e l’operatore unitario Us `e sostituito dal proiettore ortogonale P (A)(E), si ottiene alla fine che (9.90) implica che vale (a): (A) (B) (B) (A) PE PE = PE PE per ogni coppia di boreliani E, E ⊂ R. Per concludere notiamo che, se vale (c), dal teorema di Stone e dalla continuit`a di e−itA segue subito (d). D’altra parte (d) implica (c) per il seguente motivo. Prima di tutto (d) equivale a e−itABeitA = B da cui, esponenziando gli operatori −itA BeitA ) autoaggiunti ad ambo membri, troviamo: e−is(e = e−isB . Dato che, per ogni fissato numero s ∈ R, i gruppi unitari ad un parametro fortemente −itA BeitA ) continui t → e−is(e e t → e−itA e−isB eitA ammettono lo stesso generatore, essi devono coincidere per il teorema di Stone. Conseguentemente dobbiamo avere e−itA e−isB eitA = e−isB , cio`e (c). Proviamo (ii). Per provare la prima affermazione, assumendo ψ ∈ D(AB) ∩ D(BA), partiamo da (c) per cui: e−itA e−isB ψ = e−isB e−itA ψ. Derivando nell’origine in t, dal teorema di Stone: Ae−isB ψ = e−isB Aψ. A questo punto
9.3 Gruppi unitari a un parametro fortemente continui
429
possiamo ancora derivare in s nell’origine. Il secondo membro fornisce immediatamente −iBAψ per il teorema di Stone. Nel primo membro possiamo passare la derivata oltre A, usando il fatto che A = A∗ `e chiuso e tenendo conto del fatto che sappiamo che il limite esiste. In questo modo troviamo, come richiesto −iABψ = −iBAψ. Dimostriamo infine la seconda affermazione assumendo vera la propriet` a (c). Da essa si trova subito, se ψ ∈ D(A) e ϕ ∈ D(B) allora (eitA ψ|e−isB ϕ) = (eisB ψ|e−itA ϕ). Calcolando le derivate in t e s per t = s = 0, dal teorema di Stone abbiamo la tesi. L’affermazione (iii) si prova come segue. Prima di tutto `e ovvio che (f) implica (e). Proviamo che (e) implica (f). Mostriamo per prima cosa che (e) implica che B commuti con e−itA per ogni t ∈ R. A tal fine usiamo (d) ed (f) in proposizione 9.18. Sia ψ `e un vettore analitico per A e per tutte le sue potenze nell’insieme denso che `e provato esistere in (f) in proposizione 9.18, allora, dato che B `e limitato ed usando (d) di proposizione 9.18: Be−itA ψ =
+∞ +∞ (−it)n (−it)n n BAn ψ = A Bψ = e−itA Bψ . n! n! n=0 n=0
Nei due ultimi passaggi abbiamo usato l’ipotesi che BAψ = ABψ ricorsivamente ed il fatto che ||An Bψ|| = ||BAn ψ|| ≤ ||B||||Anψ|| per cui Bψ `e ancora analitico per A. Dato che ψ varia in un insieme denso e gli operatori B e e−itA sono continui, abbiamo ottenuto che Be−itA = e−itAB. Ora usiamo il fatto che, se B `e limitato e commuta con ogni e−itA , allora B commuta con la misura spettrale di A. La prova `e analoga a quella fatta sopra per dimostrare che (c) implica (b): in questo caso bisogna sostituire Us con B e seguire la stessa dimostrazione. Quindi, usando la definizione di g(A), segue facilmente che se g `e limitata (e quindi lo `e g(A)) allora Bg(A) = g(A)B. A questo punto si osserva che (A)
μBψ (E) = (Bψ|P (A) (E)Bψ) = (P (A) Bψ|P (A) (E)Bψ) (A)
= (BP (A) ψ|BP (A) (E)ψ) ≤ ||B||2μψ (E) e pertanto ψ ∈ D(f(A)) implica Bψ ∈ D(f(A)). Applicando infine la definizione di f(A), prendendo una successione di funzioni misurabili limitate fn che convergono a f nel senso di L2 (σ(A), μψ ) si ha immediatamente la tesi prendendo il limite per n → +∞ dell’uguaglianza (vera perch´e tutte le fn sono limitate) Bfn (A)ψ = fn (A)Bψ, per ogni n ∈ N, dato che B `e continuo. Osservazione 9.31. Il teorema provato ha come immediata conseguenza che due operatori autoaggiunti limitati A, B ∈ B(H) commutano se e solo se commutano le loro misure spettrali. Infatti, un’implicazione `e ovvia, mentre da (iii) segue subito che, se (A) (A) (A) AB = BA allora BPE = PE B dato che PE = χE (A), essendo χE la
430
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni (A)
funzione caratteristica del boreliano E. Dato che PE ∈ B(H), possiamo ap(B) (A) (A) (B) plicare nuovamente (iii) ed ottenere PE PE = PE PE per ogni boreliano E ⊂ R.
9.4 Prodotto tensoriale hilbertiano Come vedremo nel capitolo 12, i sistemi quantistici composti vengono descritti in spazi di Hilbert ottenuti prendendo il prodotto tensoriale Hilbertiano degli spazi di Hilbert dei sottosistemi componenti. Chiariamo nel seguito cosa intendiamo qui per prodotto tensoriale Hilbertiano, assumendo, per le motivazioni generali e le notazioni, che il lettore conosca la definizione di prodotto tensoriale nel caso di spazi vettoriali a dimensione finita. 9.4.1 Prodotto tensoriale di spazi di Hilbert Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . In analogia al caso finito dimensionale, potremmo definire il prodotto tensoriale dei vettori vi , indicato con v1 ⊗ · · · ⊗ vn , come il funzionale multilineare: v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn (f1 , · · · , fn ) → f1 (v1 ) · · · fn (vn ) ∈ C , dove Hi `e il duale topologico dello spazio Hi e il puntino ·, a secondo membro, indica il prodotto di numeri complessi. Del tutto equivalentemente, tenendo conto del teorema di Riesz, possiamo definire l’azione di v1 ⊗ · · · ⊗ vn sulle n-ple di vettori di H1 × · · ·× Hn invece che su quelle di H1 × · · ·× Hn . In questo modo teniamo conto dell’identificazione del duale di uno spazio di Hilbert con lo spazio di Hilbert stesso, ottenuta tramite un anti isomorfismo costruito con il prodotto scalare. Con questo approccio v1 ⊗ · · · ⊗ vn agisce su n-ple di vettori (u1 , · · · , un ) ∈ H1 × · · · × Hn per mezzo dei prodotti scalari e definisce un funzionale anti multi-lineare. Sceglieremo questa seconda via per motivi di praticit` a. Definizione 9.32. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e scegliamo un vettore vi per ogni spazio Hi . Il prodotto tensoriale di tali vettori, v1 ⊗ · · · ⊗ vn `e l’applicazione: v1 ⊗· · ·⊗vn : H1 ×· · ·×Hn (u1 , · · · , un ) → (u1 |v1 )1 · · · (un |vn )n ∈ C. (9.91) n Hi indichiamo l’insieme di applicazioni {v1 ⊗ · · · ⊗ vn | vi ∈ Hi , i = Con Ti=1 5n 1, 2, · · ·, n} mentre H denota lo spazio vettoriale su C delle applicazioni i=1
i
multi anti-lineari date da combinazioni lineari finite di elementi v1 ⊗· · ·⊗vn ∈ n Ti=1 Hi .
9.4 Prodotto tensoriale hilbertiano
431
Osservazione 9.33. Con la definizione di prodotti tensoriale che abbiamo dato, `e evidente che l’applicazione v1 ⊗ · · · ⊗ vn : H1 × · · · × Hn → C risulta essere multi antilineare, cio`e, anti lineare separatamente in ogni argomento ui ∈ Hi , come si legge direttamente nella (9.91), tenendo conto che il prodotto scalare `e anti lineare a sinistra. Tuttavia, la funzione (v1 , . . . vn ) → v1 ⊗· · ·⊗vn risulta essere, come si prova subito, multi-lineare. 5n Possiamo definire un prodotto scalare (·|·) su i=1 Hi come segue. Considen n riamo l’applicazione da S : Ti=1 Hi × Ti=1 Hi → C con S(v1 ⊗ · · · ⊗ vn , v1 ⊗ · · · ⊗ vn ) := (v1 |v1 ) · · · (vn |vn ) .
(9.92)
Vale il seguente risultato. n n Proposizione 9.34. L’applicazione S : Ti=1 Hi × Ti=1 Hi → C si estende in maniera univoca, per antilinearit` a nell’argomento di sinistra e per linearit` a in quello di destra, ad un prodotto scalare hermitiano sullo spazio vettoriale 5n complesso H definito da: i=1
i
(Ψ |Φ) :=
i
αi βj S(v1i ⊗ · · · ⊗ vni , u1j ⊗ · · · ⊗ unj )
j
se Ψ = i αi v1i ⊗ · · · ⊗ vni e Φ = j βj u1j ⊗ · · · ⊗ unj (essendo entrambe le somme finite). Dimostrazione. Per semplicit`a di scrittura eseguiamo la prova nel caso n = 2. Per n > 2 la dimostrazione `e concettualmente identica, ma molto pi` u laboriosa 6 2 e valgono da scrivere. Dobbiamo prima di tutto mostrare che se Ψ, Φ ∈ H1 ⊗H decomposizioni differenti per gli stessi vettori: Ψ= αj vj ⊗ vj = βh uh ⊗ uh , Φ = γk wk ⊗ wk = δs zs ⊗ zs , j
h
k
s
allora risulta comunque: αj γk S(vj ⊗ vj , wk ⊗ wk ) = αj δs S(vj ⊗ vj , zs ⊗ zs ) j
e anche: h
j
k
βh γk S(uh ⊗ uh , wk ⊗ wk ) =
k
h
(9.93)
s
βh δs S(uh ⊗ uh , zs ⊗ zs ) . (9.94)
s
6 2 `e ben definita, non Questo prova che l’estensione (anti-) lineare di S a H1 ⊗H dipendendo dalla decomposizione usata per rappresentare gli argomenti di S. Dimostriamo l’indipendenza per l’argomento di sinistra (9.93), per l’argomento di destra (9.94) si procede analogamente. Il primo membro di (9.93) si pu`o riscrivere: αj γk S(vj ⊗ vj , wk ⊗ wk ) j
k
432
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
=
j
γk wk ⊗
wk
(αj vj , vj ) =
Φ(αj vj , vj )
j
k
e, con la stessa procedura, lavorando sul secondo membro di (9.93), si ha ugualmente: αj δs S(vj ⊗ vj , zs ⊗ zs ) j
=
j
s
s
δs zs ⊗
zs
(αj vj , vj ) =
Φ(αj vj , vj ) ,
j
dove abbiamo usato l’ipotesi Φ = k γk wk ⊗ = s δs zs ⊗ zs . Quindi S si estende univocamente ad una applicazione lineare a destra ed antilineare a 6 2 → C. Direttamente dalla definizione di S si ha che vale: sinistra (·|·) : H1 ⊗H wk
(Ψ |Φ) = (Φ|Ψ ) . Per mostrare che in effetti (·|·) definisce un prodotto scalare hermitiano `e ora n sufficiente provare che (·|·) `e positivo. La prova `e semplice. Se Ψ = j=1 αj vj ⊗ vj , dove, per ipotesi n < +∞, possiamo considerare una base Hilbertiana (finita!) u1 , · · · , um (m ≤ n) per il sottospazio generato da v1 , · · · , vn ed una base analoga u1 , · · · , ul , (l ≤ n) per il sottospazio generato da v1 , · · · , vn . Sfruttando la bi-linearit` a di ⊗, possiamo alla fine scrivere m l b u ⊗ u , dove i coefficienti bjk sono opportuni. UsanΨ = k j=1 k=1 jk j do direttamente la definizione di S ed il fatto che le basi considerate sono ortonormali: ⎛ ⎞
l l l m m n
(Ψ |Ψ ) = ⎝ bjk uj ⊗ uk bis ui ⊗ us ⎠ = |bjk |2 .
j=1 k=1
i=1 s=1
j=1 k=1
La positivit` a di (·|·) `e ora evidente.
Definizione 9.35. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·) 5ni) con i = 1, 2, · · · , n. Il prodotto tensoriale hilbertiano degli spazi Hi , i=1 Hi , indicato equivalentemente con H1 ⊗ · · · ⊗ Hn , `e lo spazio di Hilbert ottenu5n to prendendo il completamento hilbertiano dello spazio Hi rispetto al i=1
prodotto scalare (·|·) della proposizione 9.34. ` immediato verificare che la definizione si riduce a quella elementare nel caso E in cui gli spazi Hi siano finito dimensionali. Inoltre sussistono i seguenti utili risultati. Proposizione 9.36. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · ·, n e corrispondenti basi hilbertiane Ni ⊂ Hi con i = 1, 2, · · · , n. L’insieme N := {z1 ⊗ · · · ⊗ zn | zi ∈ Ni , i = 1, 2, · · ·, n}
9.4 Prodotto tensoriale hilbertiano
433
`e una base hilbertiana per H1 ⊗ · · · ⊗ Hn . Quindi, in particolare, H1 ⊗ · · · ⊗ Hn `e separabile se lo sono tutti gli Hi . Dimostrazione. Per costruzione N `e un sistema ortonormale (la verifica `e immediata usando la definizione del prodotto scalare sullo spazio prodotto tensoriale). Bisogna solo provare che < N > `e denso in H1 ⊗ · · · ⊗ Hn . Dato che le combinazioni lineari di elementi del tipo v1 ⊗ · · · ⊗ vn sono dense in H1 ⊗ · · · ⊗ Hn `e sufficiente provare che ogni elemento v1 ⊗ · · · ⊗ vn pu` o essere approssimato a piacimento da combinazioni lineari di elementi z1 ⊗ · · · ⊗ zn di N . Nuovamente, per semplicit`a notazionale lavoriamo nel caso n = 2, dato che il caso n > 2 si dimostra nello stesso modo. Nelle nostre ipotesi, per una opportuna scelta di coefficienti γ e β , valgono gli sviluppi: v = z z 1 z∈N1 γz z e v2 = z ∈N2 βz z , che equivale a dire che valgono (teorema 3.27 e definizione 3.20):
2 2 ||v1 || = sup (9.95) |γz | F1 sottoinsieme finito di N1
z∈F1
e ||v2 ||2 = sup
z ∈F2
|βz |2 F2 sottoinsieme finito di N2 .
(9.96)
Il calcolo diretto, basato sull’ortonormalit` a dei vettori z ⊗z e sulla definizione di prodotto scalare in H1 ⊗ H2 , prova immediatamente che, se F ⊂ N1 × N2 `e finito
2
2 2
v1 ⊗ v2 − z ⊗ z γ β = ||v || ||v || − |γz |2 |βz |2 . z z 1 2
(z,z )∈F (z,z )∈F Valendo (9.95) e (9.96), possiamo rendere piccolo a piacere il secondo membro dell’identit` a scegliendo F sempre pi` u grande. Questo conclude la prova. Proposizione 9.37. Consideriamo n spazi di Hilbert (complessi) (Hi , (·|·)i) con i = 1, 2, · · · , n e corrispondenti sottospazi densi Di ⊂ Hi con i = 1, 2, · · ·, n. Il sottospazio D1 ⊗ · · · ⊗ Dn ⊂ H1 ⊗ · · · ⊗ Hn , formato dalle combinazioni lineari di prodotti tensoriali v1 ⊗ · · · ⊗ vn con vi ∈ Di , i = 1, . . . , n, `e denso in H1 ⊗ · · · ⊗ Hn . Dimostrazione. Al solito svolgiamo la dimostrazione nel caso n = 2, essendo il caso generale solo pi` u complicato da scrivere. Dato che le combinazioni lineari finite di prodotti tensoriali u ⊗ v sono dense in H1 ⊗ H2 , `e sufficiente provare che se ψ := u ⊗ v ∈ H1 ⊗ H2 , esiste una successione di elementi di D1 ⊗ D2 che converge a ψ. Per costruzione esistono due successioni {u1n }n∈N ⊂ D1 e {v1n }n∈N ⊂ D2 che convergono a u e v rispettivamente. Allora: ||un ⊗ vn − u ⊗ v|| ≤ ||un ⊗ vn − un ⊗ v|| + ||un ⊗ v − u ⊗ v|| .
434
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Ma ||un ⊗vn −un ⊗v||2 = ||un ⊗(vn −v)||2 = ||un||21 ||vn −v||22 → 0 se n → +∞, dato che {||un||1 }n∈N `e limitata, essendo convergente la successione degli un . Similmente ||un ⊗ v − u ⊗ v||2 = ||(un − u) ⊗ v||2 = ||un − u||21 ||v||22 → 0 se n → +∞. Esempi 9.38. (1) Esemplificheremo la nozione di spazio prodotto tensoriale, mostrando che lavorando con spazi L2 separabili (spazi delle funzioni d’onda in meccanica quantistica), il prodotto tensoriale pu` o essere visto in un altro modo equivalente, passando alle misure prodotto. Consideriamo una coppia di spazi di Hilbert separabili, L2 (Xi , μi ) con i = 1, 2, e supponiamo che le misure siano entrambe σ-finite in modo tale che sia ben definita la misura prodotto μ1 ⊗ μ2 su X1 × X2 . Abbiamo il seguente utile risultato. Proposizione 9.39. Si consideri una coppia di spazi di Hilbert separabili, L2 (Xi , μi ) con i = 1, 2, con misure σ-finite. In tal caso: L2 (X1 × X2 , μ1 ⊗ μ2 )
e
L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 )
sono isomorfi in modo naturale come spazi di Hilbert. La trasformazione unitaria che identifica tali spazi `e l’unica estensione lineare limitata dell’applicazione: U0 : L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) ψ ⊗ φ → ψ · φ ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) dove (ψ · φ)(x, y) := ψ(x)φ(y) per x ∈ X1 e y ∈ X2 . Dimostrazione. Prima di tutto notiamo che, se N1 := {ψn }n∈N e N2 := {φn }n∈N sono basi hilbertiane in L2 (X1 , μ1 ) e L2 (X1 , μ1 ) rispettivamente, allora l’insieme N := {ψn ·φm }(n,m)∈N×N `e base hilbertiana in L2 (X1 ×X2 , μ1 ⊗μ2 ). Infatti N `e banalmente un insieme ortonormale per propriet`a elementari della misura prodotto, inoltre, se f ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) `e tale che, per ogni ψn · φn , f(x, y)ψn (x)φm (y)dμ1 (x) ⊗ dμ2 (y) = 0 , X×X2
dal teorema di Fubini-Tonelli segue che:
f(x, y)ψn (x)dμ1 (x) φm (y)dμ2 (y) = 0 . X2
X1
Dato che le φm sono una base hilbertiana, questo implica che: f(x, y)ψn (x)dμ1 (x) = 0 , X1
eccetto che per un insieme Sm ⊂ X2 di misura nulla rispetto a μ2 . Allora, per y ∈ S := Um∈N Sm (che `e di misura nulla essendo unione numerabile di insiemi
9.4 Prodotto tensoriale hilbertiano
435
di misura nulla) vale: X1
f(x, y)ψn (x)dμ1 (x) = 0
per ogni ψn ∈ N1 , che implica che f(x, y) = 0, eccetto che per x ∈ B, essendo B di misura nulla rispetto a μ1 . In definitiva vale f(x, y) = 0, escludendo i punti dell’insieme S × B che, per le propriet` a elementari di misura prodotto, `e un insieme di misura nulla rispetto a μ1 ⊗ μ2 . Possiamo concludere che, se f `e pensato come elemento di L2 (X1 ×X2 , μ1 ⊗μ2 ), allora f = 0 e, di conseguenza, N `e una base hilbertiana, essendo insieme ortonormale con ortogonale dato dal solo vettore nullo. Consideriamo infine l’unica applicazione lineare limitata U che associa l’elemento ψn ⊗ φm della base hilbertiana dello spazio di L2 (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) con l’elemento ψn ·φm della base hilbertiana dello spazio di L2 (X1 ×X2 , μ1 ⊗μ2 ). ` inoltre immediato verificare che U associa Per costruzione U `e unitaria. E 2 ogni elemento ψ ⊗ φ ∈ L (X1 , μ1 ) ⊗ L2 (X1 , μ1 ) con il corrispondente elemento ψ · φ ∈ L2 (X1 × X2 , μ1 ⊗ μ2 ) (basta notare che ψ ⊗ φ e ψ · φ hanno le stesse componenti nelle rispettive basi) per cui U `e un’estensione lineare unitaria di U0 . Ogni altra estensione lineare limitata U di U0 , dovendo estendere U0 , deve ridursi a U quando valutata sulle basi ψn ⊗ φm ψn · φm e pertanto deve coincidere con U stessa per linearit`a e per continuit`a. Ovviamente il risultato si generalizza a pi` u prodotti di spazi L2 con misure separabili e σ-finite. (2) Se (Hk , (·|·)k ), con k = 1, 2, . . ., n ≤ +∞, sono spazi di Hilbert, 7n in generale distinti, la somma diretta Hilbertiana di tali spazi, e k=1 Hk , ` definita come lo spazio di Hilbert che si ottiene come segue. Si parte dallo spazio vettoriale i cui elementi sono le n-ple (cio`e le successioni, se n = +∞) (ψ1 , ψ2 , . . .) ∈ ×nk=1 Hk , tali che ψk = 0 per k ≥ k0 , con k0 arbitrariamente grande, ma finito e dipendente dalla n-pla (evidentemente se n < +∞ questa richiesta non ha alcun effetto, dato che siamo liberi di scegliere k0 > n). Le operazioni di spazio vettoriale sono quelle standard di n-ple ed il prodotto scalare `e (si osservi che la somma `e finita anche se n = +∞): ((ψ1 , ψ2 . . .)|(φ1 , φ2 . . .)) :=
n
(ψk |φk )k .
k=1
7n
e, per definizione, lo spazio di Hilbert che si ottiene prendendo il k=1 Hk ` completamento dello spazio con prodotto scalare descritto sopra. Questa definizione `e in accordo 7ncon la definizione 8.36 quando gli spazi Hk sono visti come sottospazi di k=1 Hk , come `e facile provare. Un altro risultato importante sul prodotto tensoriale hilbertiano `e il seguente e riguarda il caso in cui tutti gli Hk di una somma hilbertiana, con n < +∞, coincidono.
436
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Proposizione 9.40. Se H `e uno spazio di Hilbert e7 0 < n ∈ N `e fissato, lo n spazio di Hilbert H ⊗ Cn `e naturalmente isomorfo a k=1 H. La trasformazione unitaria che identifica i due spazi ` e l’unica estensione lineare limitata dell’applicazione: V0 : H ⊗ Cn ψ ⊗ (v1 , . . . , vn ) → (v1 ψ, . . . , vn ψ) ∈
n -
H.
k=1
Dimostrazione. La dimostrazione si esegue come nell’analogo enunciato nell’esempio (1). Si fissa una base hilbertiana N ⊂ H. Per costruzione, i vettori: (ψ, 0, . . . , 0), (0, ψ, 0, . . . , 0), · · · , (0, . . . , 0, ψ) 7n definiscono una base Hilbertiana di k=1 H se ψ variano in N . Si considera l’unica trasformazione lineare limitata che associa ψ ⊗ ei a (0, . . . , ψ, . . . , 0) dove: ψ ∈ N , ei `e l’i-esimo vettore di base della base canonica di Cn e, nella ` n-pla, l’unico posto non nullo, occupato da ψ, `e proprio l’i-esimo posto. E immediato verificare che tale applicazione `e unitaria e si riduce a V0 lavorando su elementi ψ ⊗ (v1 , . . . , vn ). L’unicit` a dell’estensione lineare limitata si prova come nell’esempio (1). (3) Lo spazio di Fock, F (H), generato dallo spazio di Hilbert H, `e lo spazio di Hilbert dato dalla somma diretta hilbertiana infinita, nel senso dell’esempio (2): +∞ F (H) := Hn⊗ n=0 0⊗
dove H
:= C, H
n⊗
:= H ⊗ · · · ⊗ H. Si noti che F (H) `e separabile se lo `e H. 9: ; 8 n volte
9.4.2 Prodotto tensoriale di operatori (generalmente non limitati) e loro propriet` a spettrali Come ultimo argomento matematico introduciamo il prodotto tensoriale di operatori. Se A e B sono operatori con dominio, rispettivamente D(A) e D(B) nei rispettivi spazi di Hilbert H1 e H2 , indicheremo con D(A)⊗D(B) ⊂ H1 ⊗H2 il sottospazio delle combinazioni lineari finite di elementi ψ ⊗ φ con ψ ∈ D(A) e φ ∈ D(B). Possiamo provare a definire un operatore: A⊗B : D(A) ⊗ D(B) → H1 ⊗ H2 come estensione lineare di ψ⊗φ → (Aψ)⊗(Bφ). Il punto da verificare `e se una tale estensione lineare sia effettivamente ben definita. Supponiamo pertanto che, per Ψ ∈ D(A) ⊗ D(B), valgano le due decomposizioni (finite!): Ψ= ck ψk ⊗ φk = ck ψj ⊗ φj , k
j
9.4 Prodotto tensoriale hilbertiano
437
Dobbiamo verificare che: ck (Aψk ) ⊗ (Bφk ) = cj (Aψj ) ⊗ (Bφj ) . j
k
Per verificare ci`o consideriamo una base hilbertiana (finita!) di vettori fr per lo spazio generato da tutti i vettori ψk unitamente ai vettori ψj , ed una analoga base di vettori gs per lo spazio generato da tutti i vettori φk unitamente ai vettori φj . In particolare avremo che: ψi ⊗ φi =
α(i) rs fr ⊗ gs ,
ψj ⊗ φj =
r,s
(j) βrs fr ⊗ gs .
r,s
Inoltre, dato che siamo partiti dallo stesso vettore Ψ decomposto in due modi diversi, deve valere anche: (j) ci α(i) cj βrs . rs = i
j
Usando queste tre identit`a, si trova immediatamente che: A⊗B ci ψi ⊗ φi = ( ci α(i) rs )((Afr ) ⊗ (Bgs )) i
rs
i
(j) ( cj βrs )((Afr ) ⊗ (Bgs )) = (A ⊗ B) cj ψj ⊗ φj . = rs
j
j
Quindi A ⊗ B `e in effetti ben definito. La procedura si estende in modo ovvio al caso di N operatori Ak : D(Ak ) → Hk , con dominio D(Ak ) ⊂ Hk (Hk spazio di Hilbert), Definizione 9.41. Se Ak : D(Ak ) → Hk , per k = 1, 2, . . . , N , sono operatori con dominio D(Ak ) ⊂ Hk (Hk spazio di Hilbert), si definisce l’operatore prodotto tensoriale degli Ak : A1 ⊗ · · · ⊗ AN : D(Ak ) ⊗ · · · ⊗ D(AN ) → H1 ⊗ · · · ⊗ HN , come l’unico operatore lineare che estende le richieste: A1 ⊗ · · · ⊗ AN (v1 ⊗ · · · ⊗ vN ) = (A1 v1 ) ⊗ · · · ⊗ (AN vN ) se vk ∈ D(Ak ), per k = 1, . . . , N . Per le applicazioni `e utile il seguente primo elementare risultato. Proposizione 9.42. Se k = 1, . . . , N , siano Ak : D(Ak ) → Hk operatori sugli spazi di Hilbert Hk . Vale quanto segue.
438
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
(a) Se D(Ak ) = Hk e Ak `e chiudibile per k = 1, . . . , N , allora gli operatori definiti sul dominio D(Ak ) ⊗ · · · ⊗ D(AN ): I,
A1 ⊗I ⊗· · · ⊗I ,
. . . , I ⊗· · ·⊗Ak ⊗· · ·⊗Ah ⊗· · ·⊗I ,
. . . , A1 ⊗· · ·⊗An
e, sullo stesso dominio, le combinazioni lineari finite di tali operatori, sono tutti operatori chiudibili. (b) Se D(Ak ) = Hk e Ak ∈ B(Hk ) per k = 1, . . . , N allora valgono: (i) A1 ⊗ · · · ⊗ AN ∈ B(H1 ⊗ · · · ⊗ HN ) e (ii) ||A1 ⊗ · · · ⊗ AN || = ||A1 || · · · ||AN ||. Dimostrazione. (a). Limitiamoci al caso n = 2, il caso generale `e del tutto analogo. Si osservi che D(A1 ) ⊗ D(A2 ) `e denso per costruzione (usando la proposizione 9.37), per cui gli operatori menzionati in (a) ammettono aggiunto. Si consideri il vettore generico Ψ ∈ D(A∗1 ) ⊗ D(A∗2 ). Per definizione: (Ψ |A1 ⊗ A2 Φ) = (A∗1 ⊗ A∗2 Ψ |Φ) per ogni Φ ∈ D(A1 ) ⊗ D(A2 ). Ma allora, dalla definizione di aggiunto: D(A∗1 ) ⊗ D(A∗2 ) ⊂ D((A1 ⊗ A2 )∗ ) . Per (b) di teorema 5.4, essendo A1 e A2 con domini densi e chiudibili, il dominio dei rispettivi aggiunti dovr` a essere denso e di conseguenza D((A1 ⊗ A2 )∗ ) `e anch’esso densamente definito per cui A1 ⊗ A2 `e chiudibile. La prova per combinazioni lineari `e la stessa. La prova di (b) `e data nella soluzione degli esercizi in fondo al capitolo. Vogliamo ora studiarne alcune propriet` a di polinomi di operatori A1 ⊗ · · · ⊗ AN , quando gli Ak siano autoaggiunti. Nell’enunciato del teorema che segue, gli argomenti Ak del polinomio Q andrebbero pi` u propriamente intesi come I ⊗ · · · ⊗ I ⊗ Ak ⊗ I ⊗ · · · ⊗ I, ma noi scriveremo semplicemente Ak per non sovraccaricare la notazione. Teorema 9.43. Siano Ak : D(Ak ) → Hk , con D(Ak ) ⊂ Hk , per k = 1, 2, . . ., N operatori autoaggiunti e sia Q(a1 , . . . , an ) un polinomio a coefficienti reali di grado nk nella k-esima variabile. Sia Dk ⊂ D(Ak ) un dominio di essenziale autoaggiunzione per Ank k . Vale quanto segue. 5N nk (a) Q (A1 , . . . , A1 ) `e essenzialmente autoaggiunto su k=1 D(Ak ) e su 5N k=1 Dk ; (b) Se ogni Hk `e separabile, lo spettro di Q (A1 , . . . , A1 ) `e la chiusura dell’immagine di Q sul prodotto degli spettri di Ak : σ Q (A1 , . . . A1 ) = Q (σ(A1 ), . . . , σ(AN )) . Dimostrazione. (a). Per prima cosa notiamo che l’operatore Q(A1 , . . . , An ) `e nk ben definito su D := ⊗N k=1 D(Ak ) (in particolare per (d) del teorema 9.4) ed `e simmetrico su tale dominio, come si prova per computo diretto, applicando la definizione di prodotto tensoriale di operatori, tenendo conto che
9.4 Prodotto tensoriale hilbertiano
439
i coefficienti di Q sono reali e che ogni Am e simmetrico su k con m ≤ nk ` D(Ank k ). Possiamo dire di pi` u: Q(A1 , . . . , An ) `e essenzialmente autoaggiunto su D, la prova segue facilmente dal teorema 5.46 di Nelson, esibendo un insieme di vettori analitici per Q(A1 , . . . , An ) il cui spazio generato sia denso nello spazio di Hilbert globale. Tenendo conto di (1) in esempi 9.38, una tale classe di vettori analitici si definisce come quella dei prodotti tensoria(L,1) (L,N) (L,k) li ψαL ⊗ · · · ⊗ ψαL , con L = 1, 2, . . ., dove {ψαL }αL∈GL ⊂ D(Ak ) `e una base hilbertiana del sottospazio chiuso P (Ak ) ([−L, L) ∩ σ(Ak )), essendo P (Ak ) la misura spettrale di Ak ed avendo cura, ad ogni incremento di L: passando da [−L, L] a [−L − 1, L) ∪ [−L, L) ∪ [L, L + 1), di conservare gli stessi elementi di base relativi al sottospazio associato all’intervallo [−L, L). Il fatto che questi vettori siano analitici per Q(A1 , . . . , An ) si prova facilmente seguendo la stessa strada usata per dimostrare (f) nella proposizione 9.18. Per provare che Q(A1 , . . . , An ) `e anche essenzialmente autoaggiunto su D(e) := ⊗N e ora sufficiente provare che vale l’inclusione k=1 Dk ` operatoriale Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D (infatti, per costruzione Q(A1 , . . . , An ) D(e) ⊂ Q(A1 , . . . , An ) D e quindi Q(A1 , . . . , An )D(e) ⊂ Q(A1 , . . . , An )D ; se ancora Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D , allora deve essere Q(A1 , . . . , An )D(e) = Q(A1 , . . . , An )D ed il secondo membro `e autoaggiunto, per cui Q(A1 , . . . , An )D(e) `e essenzialmente autoaggiunto essendo simmetrico con chiusura autoaggiunta.) Per provare che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An ) D si supponga che nk ⊗N k=1 φk ∈ D, allora φk ∈ D(Ak ), ed essendo Dk dominio di essenziale aunk toaggiunzione di Ak , deve esistere una successione {φlk }l∈N con φlk → φk e Ank k φl → Ank k φk se l → +∞. Una facile stima, usando la decomposizione l m spettrale di Ak , implica allora che Am k φ → Ak φk se l → +∞ quando 1 ≤ N l N l m ≤ nk . Concludiamo che ⊗k=1 φk → ⊗k=1 φk e Q(A1 , . . . , AN )(⊗N k=1 φk ) → N Q(A1 , . . . , AN )(⊗k=1 φk ) quando l → +∞. Il risultato si estende alle combinazioni lineari finite di vettori della forma ⊗N k=1 φk . Questo implica che Q(A1 , . . . , An )D(e) ⊃ Q(A1 , . . . , An )D . Passiamo a provare (b). Per prima cosa, sfruttando (c) del teorema 9.13 e tenendo conto della separabilt` a di ciascuno spazio H, rappresentiamo ogni operatore autoaggiunto Ak in termini di un operatore moltiplicativo per la funzione Fk nello spazio di Hilbert L2 (Mk , μk ) che `e identificato con Hk . Ricordiamo che 2 N ⊗N e isomorfo a L2 (×N k L (Mk , μk ) ` k=1 Mk , μ) con μ = ⊗k=1 μk , come discusso in (1) di esempi 9.38. Sotto tale isomorfismo, l’operatore Q(A1 , . . . , AN ) su D corrisponde alla moltiplicazione per la funzione Q(F1 , . . . , FN ) e D corrisponde allo spazio generato in L2 (×N k=1 Mk , μ) da prodotti finiti φ1 (m1 ) · · · φN (mN ) tali che Fknk · φk ∈ L2 (Mk , μk ). Supponiamo che λ ∈ Q(σ(A1 ), . . . , σ(AN )). Se I λ `e un intervallo aperto, allora Q−1 (I) ⊃ ×N k=1 Ik per qualche intervallo aperto Ik ⊂ R, in modo tale che Ik ∩ σ(Ak ) = ∅ per ogni k = 1, 2, . . . , N . Si osservi ora che σ(Ak ) = ess ran(Fk ), dove si `e tenuto conto dell’esercizio 9.5. Conseguentemente μk (Fk−1 (Ik )) = 0 e quindi μ[Q(F1 , . . . , FN )−1 (I)] = 0. Questo significa
440
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
che λ ∈ ess ranQ(F1 , . . . , FN ) = σ(Q(A1 , . . . , PN )) per l’esercizio 9.5. Viceversa, se λ ∈ Q(σ(A1 ), . . . , σ(AN )) allora (λ − Q(F1 , . . . , FN )) : ×N k=1 Mk → R `e limitata e dunque λ ∈ ρ(Q(A1 , . . . , AN )), cio`e λ ∈ σ(Q(A1 , . . . , AN )). 9.4.3 Un esempio: il momento angolare orbitale In meccanica quantistica, le osservabili che corrispondono alle 3 componenti cartesiane del momento angolare orbitale di una particella, sono le uniche estensioni autoaggiunte dei tre operatori, sullo spazio di Hilbert L2 (R3 , dx) (dove dx `e la misura di Lebesgue su R3 ): L1 := X2 S(R3 ) P3 S(R3 ) −X3 S(R3 ) P2S(R3 ) , L2 := X3 S(R3 ) P1S(R3 ) −X1 S(R3 ) P3S(R3 ) L3 := X1 S(R3 ) P2 S(R3 ) −X2 S(R3 ) P1S(R3 ) ,
(9.97)
dove Xi e Pi sono gli operatori posizione ed impulso introdotti nella sezione 5.3, e S(R3 ) `e lo spazio di Schwartz delle funzioni a valori complessi, infinitamente differenziabili, che siannullano all’infinito pi` u rapidamente di ogni potenza negativa di r := x21 + x22 + x23 insieme a tutte le derivate di ogni ordine (vedi la sezione 3.6). Nel seguito sceglieremo dominio come D(L1 ) = D(L2 ) = D(L3 ) = S(R3 ), dato che S(R3 ) `e un sottospazio invariante per gli operatori Xi e Pi (e quindi anche per ogni Li ). Mostreremo nel seguito che gli operatori momento angolare orbitale Li , sul dominio detto, sono essenzialmente autoaggiunti e ne espliciteremo uno sviluppo spettrale e lo spettro. In questa sede ci occuperemo solo delle propriet`a matematiche degli operatori in questione, lasciando ogni commento di carattere fisico ai capitoli 10 e 11. Nel seguito ci concentreremo unicamente sull’operatore L3 , dato che, cambiando i nomi delle coordinate, quanto diremo per esso si pu` o estendere agli altri due analoghi operatori. Esplicitamente si pu` o scrivere:
∂ ∂ L3 = −i x1 , − x2 ∂x2 ∂x1 dove x1 e x2 si devono intendere come operatori moltiplicativi per le corrispondenti funzioni. Un quarto operatore che useremo nel seguito `e l’operatore momento angolare totale (elevato al quadrato): L2 := L21 + L22 + L23 , definito su S(R3 ). Anche tale operatore `e essenzialmente autoaggiunto su S(R3 ). Calcoleremo lo spettro e daremo la forma esplicita dello sviluppo spettrale di L2 := L2 . Per determinare gli sviluppi spettrali e gli spettri detti, conviene esplicitare gli operatori considerati in coordinate polari sferiche r, θ, φ dove x1 =
9.4 Prodotto tensoriale hilbertiano
441
r sin θ cos φ, x2 = r sin θ sin φ, x3 = r cos θ e quindi r ∈ (0 + ∞), θ ∈ (−π/2, π/2), φ ∈ (−π, π). In questo modo si trova, con qualche banale calcolo, che:
+ * ∂ 1 ∂2 ∂ 1 ∂ 2 2 L3 = −i sin θ , (9.98) + , L = − ∂φ sin θ ∂θ ∂θ sin2 θ ∂φ2 dove gli operatori agiscono sulle funzioni dello spazio di Schwartz S(R3 ) il cui argomento `e sottoposto al cambio di coordinate indicato sopra. Dalla (9.98) risulta evidente che i due operatori non dipendono dalla coordinata radiale r. Questo fatto si riveler`a di cruciale importanza. Tenendo conto di ci` o, notiamo che R3 = S2 × [0, +∞), dove (a meno di insiemi di misura nulla) la superficie sferica di raggio unitario S2 `e lo spazio su cui variano le coordinate θ, φ, mentre [0, +∞) `e lo spazio su cui varia la coordinata radiale r; ulteriormente la misura di Lebesgue di R3 pu` o essere vista come il prodotto delle misure: dx = dω(θ, φ) ⊗ r 2 dr , dove: dω(θ, φ) = sin θdθdφ 2
`e la misura standard su S identificata con il rettangolo (−π/2, π/2) × (−π, π) in coordinate (θ, φ) (l’insieme S2 \ ((−π/2, π/2) × (−π, π)) ha dω-misura nulla e pertanto non crea problemi). In questo modo abbiamo anche la decomposizione: L2 (R3 , dx) = L2 (S2 × [0, +∞), dω(θ, φ) ⊗ r 2 dr) . In base a (1) in esempi 9.38, abbiamo infine che: L2 (R, dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r 2dr) .
(9.99)
A questo punto definiamo gli operatori nello spazio di Hilbert L2 (S2 , dω):
+ * ∂ 1 ∂2 ∂ 1 ∂ 2 2 2 2 , sin θ , (9.100) L = −i L = − + 3 S S ∂φ sin θ ∂θ ∂θ sin2 θ ∂φ2 con dominio C ∞ (S2 ) delle funzioni infinitamente differenziabili su S2 vista come variet`a differenziabile1 C ∞ , che si pu` o provare essere denso in L2 (S2 , dω) (lo si provi per esercizio). Tali operatori risultano essere hermitiani e quindi simmetrici come `e facile verificare per computo diretto. Prima della formulazione della meccanica quantistica, dallo studio dell’equazione di Laplace (e 1 Vedere l’appendice in fondo al libro. In ogni caso l’idea `e semplicemente quella di ricoprire completamente S2 con pi` u carte locali, ottenute dall’iniziale sistema di coordinate θ,φ, ruotando gli assi cartesiani. Bastano 3 sistemi di coordinate locali costruiti in questo modo per ricoprire S2 . Le funzioni di C ∞ (S2 ), per definizione, sono quelle definite su S2 a valori in C che risultano essere C ∞ quando ristrette a ciascuno dei sistemi di coordinate locali suddetti.
442
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
dall’elettrodinamica classica) era gi`a noto che esiste una base hilbertiana di L2 (S2 , dω) costituito dalle cosiddette armoniche sferiche [NiOu82]: ! l (2l + 1) (l + m)! imφ 1 dl−m (−1) e Ylm (θ, φ) := l (1 − cos2 θ)l , 2 l! 4π (l − m)! sinm φ d(cos θ)l−m (9.101) dove: l = 0, 1, 2, . . . m ∈ N , |m| ≤ 2l + 1 . (9.102) Le funzioni Yml ∈ C ∞ (S2 ) sono note autofunzioni degli operatori differenziali S2 L3 e S2 Lz dati in (9.98), valendo: l S2 L3 Ym
= mYml ,
S2 L
2
Yml = 2 l(l + 1)Yml .
(9.103)
Si osservi che la prima identit` a `e ovvia per definizione delle funzioni Yml . In l particolare i vettori Ym sono un insieme di vettori analitici degli operatori simmetrici S2 L2 e S2 L3 , definiti su C ∞ (S2 ). Dato che le Yml formano una base hilbertiana dello spazio L2 (S2 , dω), esse garantiscono, per il criterio di Nelson (teorema 5.46), che gli operatori S2 L2 e S2 L3 definiti su C ∞(S2 ) siano essenzialmente autoaggiunti. Seguendo la stessa procedura usata nella sezione 9.1.3 per l’operatore hamiltoniano dell’oscillatore armonico unidimensionale, concludiamo che le decomposizioni spettrali di L2 := L2 e L3 := Lz sono: 2 2 l(l + 1)Yml (Yml | ) e S2 L3 = s mYml (Yml | ) (9.104) S2 L = sl∈N, m∈Z ,|m|≤2l+1
l∈N, m∈Z ,|m|≤2l+1
e, contestualmente, gli spettri sono:
1 2 σ(S2 L2 ) = σp(S2 L2 ) = 2 l(l + 1) l = 0, 1, 2 . . . ,
(9.105)
e σ(S2 L3 ) = σp (S2 L3 ) = { m | |m| ≤ 2l + 1 , m ∈ Z, l = 0, 1, 2 . . . } . (9.106) Torniamo ora allo spazio L2 (R3 , dx). Dato che lo spazio D(0, +∞) delle funzioni C ∞ a supporto compatto in (0, +∞) `e denso nello spazio di Hilbert separabile L2 ((0 + ∞), r 2dr), per (b) in proposizione 3.32, esister` a una base hilbertiana {ψn }n∈N costituita da funzioni in D(0, +∞). Si verifica per computo diretto, passando in coordinate cartesiane, che le funzioni: fl,m,n (x) = Yml (θ, φ)ψn (r) ,
(9.107)
a apparirebbero per x = 0, sono funzioni di classe C ∞ (R3 ) (le uniche singolarit` ma in un intorno di tale punto le funzioni dette si annullano per costruzione). Per costruzione, le funzioni fl,m,n hanno anche supporto compatto e pertanto appartengono a S(R3 ). Notando che, con le definizioni date e tenendo conto dei domini degli operatori considerati: S2 L3
⊗ ID(0,+∞) ⊂ L3
e
S2 L
2
⊗ ID(0,+∞) ⊂ L2 ,
9.5 Teorema di decomposizione polare per operatori non limitati
443
concludiamo che {Yml ⊗ ψn | n, l ∈ N, |m| ≤ 2l + 1 , m ∈ Z} ⊂ S(R3 ), `e una base hilbertiana di L2 (R3 , dx) = L2 (S2 , dω) ⊗ L2 ((0, +∞), r 2 dr) per quanto visto in (2) in esempi 9.38. Dato che, evidentemente, pensando L3 e L2 come operatori su S(R3 ), L3 Yml ⊗ ψn = mYml ⊗ ψn ,
L2 Yml ⊗ ψn = 2 l(l + 1)Yml ⊗ ψn ,
(9.108)
possiamo concludere nuovamente che L2 e L3 sono essenzialmente autoaggiunti su tale dominio e valgono sviluppi spettrali per le loro uniche estensioni autoaggiunte L2 := L2 e Lz := Lz del tipo: L2 = s2 l(l + 1)Yml ⊗ ψn (Yml ⊗ ψn | ) l,n∈N, m∈Z ,|m|≤2l+1
e
Lz = s-
mYml ⊗ ψn (Yml ⊗ ψn | ) .
(9.109)
l,n∈N, m∈Z ,|m|≤2l+1
Mentre gli spettri di L2 := e L3 sono ancora dati da (9.105) e (9.106). Si noti che le misure spettrali di L2 e di L3 commutano. Si pu` o arrivare agli stessi risultati applicando in modo opportuno il teorema 9.43.
9.5 Teorema di decomposizione polare per operatori non limitati Consideriamo un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Usando il fatto che, come vedremo, A∗ A `e autoaggiunto positivo e sfruttando il teorema spettrale per operatori √ non limitati, `e possibile definire l’operatore positivo autoaggiunto |A| := A∗ A. Se definiamo, almeno su Ran(|A|), l’operatore U = A|A|−1 , estendendolo all’operatore nullo sull’ortogonale di Ran(|A|), abbiamo immediatamente che vale la decomposizione: A = U |A| . Formalmente, e senza prestare troppa attenzione ai domini, si verifica che U Ran(|A|) `e un’isometria. In questo modo si ottiene, a livello euristico, una generalizzazione del teorema 3.61 di decomposizione polare, che abbiamo provato per operatori limitati definiti su tutto lo spazio di Hilbert. Questo approccio diretto ha tuttavia il difetto che non `e evidente su quale dominio valga la decomposizione di sopra (a priori i domini di A e di |A| possono essere differenti) ed il tentativo di rendere rigoroso il ragionamento si rivela piuttosto pesante. Pertanto noi seguiremo un approccio pi` u indiretto, basato su un teorema pi` u generale. L’estensione del teorema di decomposizione polare che proveremo alla fine, gioca un ruolo fondamentale nella teoria quantistica dei campi rigorosa, in riferimento alla teoria modulare di Tomita-Takesaki ed alla definizione degli stati termici KMS [BrRo02].
444
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
9.5.1 Propriet` a degli operatori A∗ A, radici quadrate di operatori autoaggiunti positivi non limitati Procediamo in alcuni passi, dimostrando prima che, nelle ipotesi di A chiuso e densamente definito, A∗ A `e autoaggiunto e che D(A∗ A) `e un core per A, e quindi un teorema che, in un certo senso, generalizza in teorema di decomposizione polare, avendo cura di specificare in modo chiaro i domini degli operatori. Infine proveremo una proposizione riguardate l’esistenza e l’unicit`a delle radici quadrate autoaggiunte positive di operatori autoaggiunti non limitati. Teorema 9.44. Si consideri un operatore chiuso e con dominio denso, A : D(A) → H, nello spazio di Hilbert H. Valgono i seguenti fatti: (a) A∗ A, definito sul dominio naturale D(A∗ A) (definizione 5.1), `e autoaggiunto; (b) il sottospazio denso D(A∗ A) `e un core per A: AD(A∗ A) = A .
(9.110)
Dimostrazione. Per dimostrare (a), indicato con I : H → H l’operatore identit` a, introduciamo l’operatore I + A∗ A, definito sul suo dominio naturale (che coincide ancora con D(A∗ A), come si dimostra immediatamente dalla definizione 5.1). Proveremo sotto che esiste un operatore positivo P ∈ B(H) tale che Ran(P ) = D(I + A∗ A), e che soddisfa: (I + A∗ A)P = I ,
P (I + A∗ A) = ID(I+A∗ A) .
(9.111)
Per (f) in proposizione 3.49, l’operatore P ∈ B(H) deve essere autoaggiunto in quanto positivo. Per l’unicit` a della funzione inversa, l’operatore I + A∗ A deve allora coincidere con l’inverso di P , ottenuto tramite la sua decomposizione spettrale: P −1 =
λ−1 dP (P ) (λ) .
σ(P )
Tale operatore `e autoaggiunto in virt` u del teorema 9.4. Dunque, l’operatore A∗ A = (I+A∗ A)−I `e allora autoaggiunto sul dominio D(I+A∗ A) = D(A∗ A), che dovr` a essere denso di conseguenza. Per concludere la dimostrazione proviamo che esiste P ∈ B(H) positivo, con Ran(P ) = D(I + A∗ A) e che vale (9.111). Se f ∈ D(I + A∗ A) = D(A∗ A) allora Af ∈ D(A∗ ) per definizione di D(A∗ A). Di conseguenza: (f|f) + (Af|Af) = (f|f) + (f|A∗ Af) = (f|(I + A∗ A)f) . Abbiamo in tal modo ottenuto che (I + A∗ A) ≥ 0, ma anche, dalla disuguaglianza di Cauchy-Schwarz, che deve essere ||f||2 ≤ ||f|| ||(I + A∗ A)f|| e dunque I + A∗ A : D(A∗ A) → H `e iniettivo. Consideriamo ora l’operatore A che `e chiuso e densamente definito. L’identit`a provata in (d) del teorema 5.9,
9.5 Teorema di decomposizione polare per operatori non limitati
445
implica che che, per ogni h ∈ H esiste un unico P h ∈ D(A), ed un unico Qh ∈ D(A∗ ) tali che in H ⊕ H: (0, h) = (−AP h, P h) + (Qh, A∗ Qh) .
(9.112)
Per costruzione P, Q sono definiti su tutto H ed inoltre i due vettori a secondo membro, pensati come vettori di H ⊕ H, sono ortogonali. Per definizione della norma usata su H ⊕ H, l’dentit` a ottenuta ci dice anche che, per ogni h ∈ H: ||h||2 ≥ ||P h||2 + ||Qh||2 e quindi P, Q ∈ B(H) valendo ||P ||, ||Q|| ≤ 1. Considerando le singole componenti in (9.112), si ha anche che: Q = AP
e
h = P h + A∗ Qh = P h + A∗ AP h = (I + A∗ A)P h ,
per ogni h ∈ H. Quindi (I + A∗ A)P = I e pertanto P : H → D(I + A∗ A) deve essere iniettiva, ma anche suriettiva dato che (I + A∗ A) `e iniettiva, come provato sopra. Per l’unicit` a dell’inversa di funzioni biettive, deve anche essere: P (I + A∗ A) = ID(I+A∗ A) . Fino ad ora abbiamo provato che P ∈ B(H) ha immagine che ricopre D(I + A∗ A) e che vale (9.111). Il fatto che P ≥ 0 si prova come segue. Se h ∈ H, allora h = (I + A∗ A)f per qualche f ∈ D(A∗ A) e quindi: (P h|h) = (P (I + A∗ A)f|(I + A∗ A)f) = (f|(I + A∗ A)f) ≥ 0 . Per concludere, dimostriamo (b). Dato che A `e chiuso, il suo grafico `e un sottospazio chiuso di H ⊕ H ed `e di conseguenza uno spazio di Hilbert. Supponiamo allora che (f, Af) ∈ G(A) sia ortogonale a G(AD(A∗ A) ), allora, per ogni x ∈ D(A∗ A) deve essere: 0 = ((f, Af)|(x, Ax)) = (f|x) + (Af|Ax) = (f|x) + (f|A∗ Ax) = (f|(I + A∗ A)x)) . Dato che Ran(I + A∗ A) = H, deve essere f = 0 e quindi l’ortogonale di G(A D(A∗ A) ) rispetto allo spazio di Hilbert G(A) `e banale e dunque: G(AD(A∗ A) ) = G(A), che `e la tesi. Passiamo ora ad enunciare e provare un notevole teorema che, unitamente ad un teorema di unicit` a delle radici quadrate positive di operatori autoaggiunti positivi (non limitati) implica, come sottocaso, il teorema di decomposizione polare per operatori chiusi e densamente definiti. Ricordiamo che, per una coppia di operatori con lo stesso dominio D, P ≤ Q significa (f|P f) ≤ (f|Qf) per ogni f ∈ D.
446
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Teorema 9.45. Si consideri una coppia di operatori chiusi e con dominio denso, A : D(A) → H, B : D(B) → H nello spazio di Hilbert H. (a) Se vale: D(A∗ A) ⊃ D(B ∗ B)
unitamente a
A∗ AD(B∗ B) ≤ B ∗ B ,
(9.113)
allora D(A) ⊃ D(B) ed esiste un operatore limitato C : H → H unicamente individuato dalle richieste: AD(B) = CB ,
Ker(C) ⊃ Ker(B ∗ ) .
(9.114)
Ulteriormente risulta ||C|| ≤ 1 e C(Ran(B))⊥ = 0. (b) Se vale: D(A∗ A) ⊃ D(B ∗ B)
unitamente a
A∗ AD(B∗ B) = B ∗ B ,
(9.115)
allora CRan(B) `e un’isometria e Ker(C) = Ker(B ∗ ). (c) Se vale: D(A∗ A) = D(B ∗ B)
unitamente a
A∗ A = B ∗ B ,
(9.116)
allora D(A) = D(B). Dimostrazione. (a) Per prima cosa proviamo l’unicit` a di C. Se C e C so no limitati e soddisfano A = CB e A = C B, allora C − C `e l’operatore nullo su Ran(B). Per continuit` a, abbiamo anche che C Ran(B) = C Ran(B) . Dato che vale la decomposizione ortogonale H = Ran(B) ⊕ (Ran(B))⊥ e (Ran(B))⊥ = Ker(B ∗ ), il fatto che KerC ⊃ Ker(B ∗ ), KerC ⊃ Ker(B ∗ ) implica che C(Ran(B))⊥ = C (Ran(B))⊥ . Di conseguenza C = C . Passiamo a provare che esiste un operatore C ∈ B(H) che soddisfa A = CB su D(B) (e quindi questo implica che D(B) ⊂ D(A)), Ker(C) ⊃ Ker(B ∗ ) e che sono vere le propriet` a ||C|| ≤ 1 e C(Ran(B))⊥ = 0. Siano A e B le restrizioni di A e B a, rispettivamente, D(A∗ A) e D(B ∗ B). Dato che (per il teorema precedente) questi spazi sono core per A e B rispettivamente, abbiamo che: Ran(A ) = Ran(A) e Ran(B ) = Ran(B). Notiamo infine che: Ker(A) = Ker(A ) e Ker(B) = Ker(B ), dato che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B). Cominciamo con il produrre un operatore che soddisfi: A = CB . Questa richiesta individua completamente un operatore lineare C su Ran(B ), definito come: A f = CB f , per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A) . Perch´e questa sia una definizione ben posta, bisogna che B f = B g implichi A f = A g cio`e, detto in termini equivalenti: B h = 0 implichi A h = 0 per h ∈ D(B ∗ B) ⊂ D(A∗ A). Questo fatto `e vero. Infatti: B h = 0 implica che (B h|B h) = 0 e quindi, essendo h ∈ D(B ∗ B) ⊂ D(A∗ A), deve valere 0 = (B h|B h) = (h|B ∗ Bh) ≥ (h|A∗ Ah) = (A h|A h) = ||A h||2 ≥ 0, che
9.5 Teorema di decomposizione polare per operatori non limitati
447
implica A h = 0. L’operatore C risulta essere limitato su Ran(B ) con ||C|| ≤ 1. Infatti, essendo: A∗ A ≤ B ∗ B ed usando il fatto che D(A∗ A) ⊂ D(A) e D(B ∗ B) ⊂ D(B), si ha subito che, se f ∈ D(B ∗ B) ⊂ D(A∗ A), allora: ||C(B f)||2 = (CB f|CB f) = (A f|A f) = (f|A∗ Af) ≤ (f|B ∗ Bf) = (B f|B f) = ||B f||2 .
(9.117)
Pertanto C si estende in modo unico su tutto Ran(B ) = Ran(B), conservando la richiesta ||C|| ≤ 1. Per completare la definizione di C : H → H, `e sufficiente definire C sull’ortogonale (Ran(B))⊥ = Ker(B ∗ ). Definiamo C come l’operatore nullo su questo spazio. In questo modo C : H → H risulta ancora essere limitato con ||C|| ≤ 1 e la condizione Ker(C) ⊃ Ker(B ∗ ) risulta essere soddisfatta. Per costruzione, per ogni f ∈ D(B ∗ B) ⊂ D(A∗ A), vale: Af = CBf . Dato che D(B ∗ B) `e un core per B, se g ∈ D(B) esister`a una successione {fn }n∈N ⊂ D(B ∗ B) ⊂ D(A∗ A), tale che fn → g e Bfn → Bg. Avremo allora che, dalla continuit` a di C, lim Afn = lim CBfn = C lim Bfn = Bg .
n→+∞
n→+∞
n→+∞
Dato che A `e chiuso, questo risultato implica che g ∈ D(A) e che limn→+∞ Afn = Ag. Pertanto A = CB si estende, in realt` a, a A = CB valida su D(B) ⊂ D(A). (b) Nell’ipotesi A∗ A = B ∗ B su D(B ∗ B) ⊂ D(A∗ A), la (9.117) risulta essere rimpiazzata da, se f ∈ D(B ∗ B) ⊂ D(A∗ A): ||C(B f)||2 = (CB f|CB f) = (A f|A f) = (f|A∗ Af) = (f|B ∗ Bf) = (B f|B f) = ||B f||2 . Da tale identit` a si ricava che C `e un isometria su Ran(B) e, per continuit` a, su Ran(B). Rimane da dimostrare che Ker(C) ⊂ Ker(B ∗ ), dato che l’altra inclusione `e valida nel caso generale (a). Se s ∈ Ker(C), dato che si ha la decomposizione ortogonale H = Ran(B) ⊕ Ker(B ∗ ), deve essere s = r + n con r ∈ Ran(B) e n ∈ Ker(B ∗ ). Pertanto, dal momento che Ker(B ∗ ) ⊂ Ker(C), 0 = Cs = C(r + n) = Cr + Cn = Cr + 0 = Cr. D’altra parte, dato che C `e un isometria su Ran(B), 0 = ||Cr|| = ||r|| e quindi Cr = 0. In definitiva, se s ∈ Ker(C), allora s = n ∈ Ker(B ∗ ) e questo conclude la dimostrazione di Ker(C) ⊂ Ker(B ∗ ). (c) Dobbiamo provare che D(A) = D(B) se D(A∗ A) = D(B ∗ B) e A∗ A = B ∗ B. Dalla dimostrazione del caso pi` u generale (a), sappiamo che D(B) ⊂ D(A). Nelle ipotesi in (c), possiamo scambiare il ruolo di A e B, trovando che D(A) ⊂ D(B) e pertanto D(A) = D(B). Ecco l’ultimo ingrediente che generalizza parte del teorema 3.57
448
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Teorema 9.46. Sia A : D(A) → H un operatore autoaggiunto nello spazio di Hilbert H. Valgono i fatti seguenti. (a) A ≥ 0 se e solo se σ(A) ⊂ [0 + ∞). (b) Se A ≥ 0, esiste ed `e unico un operatore autoaggiunto B ≥ 0 tale che B 2 = A, dove il primo membro `e definito sul suo dominio naturale D(B 2 ) che coincide con √ D(A). Vale B = A definito usando l’integrale rispetto alla misura spettrale di A. Dimostrazione. (a) Se σ(A) ⊂ [0 + ∞), (g) nel teorema 9.4, riferito alla PVM P (A) di A, implica immediatamente che A ≥ 0. Viceversa, supponiamo che A ≥ 0 e, per assurdo, che esista λ tale che 0 > λ ∈ σ(A). Se λ ∈ σp (A) allora esisterebbe un autovettore ψ ∈ H \ {0} con autovalore λ e si avrebbe un assurdo: 0 ≤ (ψ|Aψ) = ||ψ||2 λ < 0. Se invece λ ∈ σc(A), dal teorema 9.9 (A) sappiamo che, per ogni intervallo aperto (a, b) λ, vale P(a,b) = 0. Potremmo (A)
allora scegliere (a, b) = (2λ, λ/2) ottenendo, se 0 = ψ ∈ P(a,b)(H), usando le propriet` a delle misure spettrali del teorema 9.4 ed il fatto che μψ si annulla fuori da (a, b): 0 ≤ (ψ|Aψ) = xdμψ (x) = xdμψ (x) ≤
R
(2λ,λ/2)
(2λ,λ/2)
λ λ dμψ (x) = ||ψ||2 < 0 , 2 2
che `e ancora un assurdo. (b) Una radice quadrata autoaggiunta positiva di A `e semplicemente: √ √ B = A := xdP (A)(x) . σ(A)
Tale operatore `e ben definito, dato che σ(A) ⊂ [0, +∞), `e autoaggiunto per (b) nel teorema 9.4 e vale B 2 = A, dove il primo membro `e definito sul suo dominio naturale D(B 2 ) che coincide con D(A) in virt` u di (c) e (d) nel teorema 9.4. Infine B ≥ 0 per (g) nel teorema 9.4. Passiamo alla dimostrazione a. Supponiamo che B ≥ 0 sia autoaggiunto e B ≥ 0 per cui: B = di unicit` (B) xdP (x). Se vale anche B 2 = A con A ≥ 0, tenendo conto di (9.46) [0,+∞) abbiamo: (A) 2 (B) xdP (x) = x dP (x) = xdP (B)(f −1 (x)) [0,+∞)
[0,+∞)
[0,+∞)
dove f(x) = x2 con x ≥ 0, per cui f −1 : [0, +∞) → [0 + ∞) `e ben definita come funzione. Per l’unicit` a della misura spettrale di A, deve essere, in particolare, P (B) (f −1 (E )) = P (A)(E ) per ogni boreliano E ⊂ [0, +∞). Se E ⊂ [0, +∞) `e un boreliano, f(E) ⊂ [0, +∞). Pertanto, ponendo E = f(E), abbiamo che P (B) (E) = P (A) (f(E)) per ogni boreliano E ⊂ [0, +∞) (e ovviamente P (B) (E) = 0 se E ⊂ (−∞, 0)). Quindi A determina completamente B determinandone la sua unica PVM.
9.5 Teorema di decomposizione polare per operatori non limitati
449
9.5.2 Teorema di decomposizione polare per operatori chiusi e densamente definiti Possiamo finalmente enunciare e dimostrare il teorema di decomposizione polare per operatori chiusi densamente definiti. L’idea euristica della dimostrazione `e quella di partire, non da A, ma da A∗ A. Se il teorema di decomposi√ zione polare vale, allora ci si aspetta che A∗ A = |A| |A|, dove |A| := A∗ A `e definito per via spettrale, ricordando che A∗ A `e autoaggiunto come provato precedentemente. A questo punto, il teorema 9.45, nel caso (c), produce la decomposizione polare di A voluta. La potenza dell’approccio si vede nel fatto che le propriet` a dei domini degli operatori coinvolti, difficili da studiare con un approccio pi` u diretto, risultano essere automaticamente fissate dal teorema 9.45. Teorema 9.47. Sia A : D(A) → H un operatore chiuso con dominio denso nello spazio di Hilbert H. Valgono i fatti seguenti. (a) Esiste una sola coppia di operatori P, U in H tali che valgano insieme le condizioni elencate di seguito: (1) vale la decomposizione: A = UP ,
(9.118)
(2) P `e positivo, autoaggiunto e D(P ) = D(A), (3) U ∈ B(H) `e isometrico su Ran(P ), (4) Ker(U ) ⊃ Ker(P ). √ (b) Risulta essere P = |A| := A∗ A e Ker(U ) = Ker(P ) = Ker(A) = (Ran(P ))⊥. (c) Se A `e biettivo, U coincide con l’operatore unitario A|A|−1 . Dimostrazione. (a) e (b). Dimostriamo inizialmente l’unicit`a di P determinandolo esplicitamente, assumendo valida (9.118) insieme a (2), (3) e (4). Cominciamo con il provare che D(A∗ A) = D(P P ). Dalla definizione di operatore aggiunto, tenendo conto che U ∈ B(H), (9.118) implica A∗ = P ∗U ∗ = P U ∗ . Di conseguenza f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ). Si osservi ora che, decomponendo H come Ran(P ) ⊕ Ker(P ∗ ) = Ran(P ) ⊕ Ker(P ), tenendo conto del fatto che U `e isometrico su Ran(P ) e si annulla su Ker(P ), segue facilmente che (U ∗ U )Ran(P ) = I Ran(P ) . Pertanto l’asserzione f ∈ D(A∗ A) se e solo se f ∈ D(P U ∗ U P ) risulta essere equivalente a f ∈ D(A∗ A) se e solo se f ∈ D(P P ). Abbiamo ottenuto che D(A∗ A) = D(P P ). Usiamo ora tale fatto per ottenere l’unicit`a di P determinandolo esplicitamente. Se g ∈ D(A∗ A) ⊂ D(A) (che equivale a g ∈ D(P P ) ⊂ D(P )) e tenendo ancora conto del fatto U `e isometrico su Ran(P ), si ha subito: (f|A∗ Ag) = (Af|Ag) = (U P f|U P g) = (P f|P g) = (f|P P g) se f ∈ D(A) = D(P ).
450
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Essendo D(A) = D(P ) un insieme denso, si conclude che A∗ A = P P . Quindi P `e una radice quadrata positiva autoaggiunta di A∗ A, ed `e dunque l’unica per √ il teorema 9.46. Vale pertanto P = A∗ A =: |A|. A questo punto possiamo applicare il caso (c) del teorema 9.45 con B = P (che `e chiuso e densamente definito essendo autoaggiunto), trovando che l’operatore U che verifica tutte le richieste coincide con l’operatore C. Il fatto che Ker(U ) = Ker(P ) = (Ran(P ))⊥ segue da (b) del teorema citato, tenendo conto che B = P = P ∗ = B ∗ nel caso in esame e del fatto che (Ran(P ∗))⊥ = Ker(P ). L’asserto Ker(A) = Ker(P ) si prova come segue: 0 = ||Af||2 = (Af|Af) = (f|A∗ Af) = (f|P P f) = (P f|P f) = ||P f||2 , dove abbiamo tenuto conto che se Af = 0 allora f ∈ D(A∗ A) per definizione di tale dominio naturale. (c) Se A `e iniettivo, usando (b), si trova che Ker(A) = Ker(U ) `e banale e quindi U `e iniettivo. D’altra parte, direttamente dalla decomposizione polare A = U P si vede che Ran(U ) ⊃ Ran(A) e pertanto, se A `e suriettivo, deve esserlo U . Concludiamo che, se A `e biettivo, U deve essere tale. In tal caso, per (b), U `e un operatore isometrico suriettivo su Ran(P ) = (Ker(P ))⊥ = {0}⊥ = H ed `e quindi unitario. Infine, da A = U |A|, essendo A e U biettivi, segue che |A| `e biettivo e quindi possiamo scrivere: U = A|A|−1 .
9.6 I teoremi di Kato-Rellich e di Kato Gli ultimi teoremi che enunceremo e dimostreremo ora sono quello di KatoRellich e quello di Kato. Tali teoremi risultano essere utilissimi nello studio delle propriet` a di autoaggiunzione e limitatezza inferiore degli operatori della Meccanica Quantistica (specialmente i cosiddetti operatori hamiltoniani), nell’ambito della teoria delle perturbazioni. In effetti, il primo dei due teoremi fissa delle condizioni generali sufficienti affinch`e un operatore T + V , perturbazione di T , sia autoaggiunto e con spettro limitato dal basso quando lo `e T . Il secondo considera casi specifici in cui T `e l’operatore di Laplace in R3 o Rn . 9.6.1 Il teorema di Kato-Rellich Abbiamo bisogno di una definizione preliminare. Definizione 9.48. Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti nello spazio di Hilbert H con D(T ) ⊂ D(V ). Se esistono a, b ∈ [0, +∞) tali che: ||V ϕ|| ≤ a||T ϕ|| + b||ϕ|| per ogni ϕ ∈ D(T ) ,
(9.119)
9.6 I teoremi di Kato-Rellich e di Kato
451
si dice che V `e T -limitato. L’estremo inferiore dei valori a che verificano (9.119) per qualche b `e detto il limite relativo di V rispetto a T e, se esso risulta essere nullo, si dice che V `e infinitesimo rispetto a T . Osservazioni 9.49. (1) Se T `e chiudibile, come segue immediatamente dalla definizione di core (definizione 5.19), per provare che vale (9.119) `e sufficiente mostrare che tale condizione `e soddisfatta su un core di T . (2) La condizione (9.119) `e equivalente alla condizione: ||V ϕ||2 ≤ a21 ||T ϕ||2 + b21 ||ϕ||2
per ogni ϕ ∈ D(T ) .
(9.120)
Infatti, se vale la (9.120) allora vale la (9.119) con a = a1 e b = b1 . Viceversa, se vale la (9.119) allora vale la (9.120) con a21 = (1 + δ)a2 , b21 = (1 − δ −1 )b2 per ogni δ > 0. Possiamo passare ad enunciare e provare il Teorema di Kato-Rellich. Ricordiamo che, per un operatore autoaggiunto A : D(A) → H, vale σ(A) ⊂ [M, +∞) se e solo se (ψ|Aψ) ≥ M (ψ|ψ) per ogni ψ ∈ D(A) per (a) in teorema 9.46. Conseguentemente, l’enunciato (c) del teorema pu`o essere, equivalentemente, scritto in termini di limiti inferiori di forme quadratiche. Teorema 9.50. (Kato-Relich.) Siano T : D(T ) → H e V : D(V ) → H operatori densamente definiti sullo spazio di Hilbert H che verificano: (i) T `e autoaggiunto, (ii) V `e simmetrico, (iii) V `e T -limitato con limite relativo a < 1. Sotto tali ipotesi vale quanto segue. (a) T + V `e autoaggiunto su D(T ). (b) T + V `e essenzialmente autoaggiunto su ogni core di T . (c) Se σ(T ) ⊂ [M, +∞) allora σ(T + V ) ⊂ [M , +∞) con: b M = M − max , a|M | + b , con a e b che soddisfano (9.119). (1 − a) Dimostrazione. Per provare (a) cerchiamo di applicare il teorema 5.17, mostrando che, scegliendo D(T ) come dominio per l’operatore simmetrico T +V , risulta Ran(T + V ± iI) = H. In realt` a proveremo che esiste ν > 0 per cui Ran(T + V ± iνI) = H , che implica immediatamente l’affermazione precedente per linearit`a. Se ϕ ∈ D(T ), nelle nostre ipotesi di T autoaggiunto deve valere Ran(T + iμI) = H e anche: ||(T + iμI)ϕ||2 = ||T ϕ||2 + μ2 ||ϕ||2 . Ponendo ϕ = (T + iμI)−1 ψ, si conclude che: ||T (T + iμI)−1 || ≤ 1 e
||(T + iμI)−1 || ≤ μ−1 .
452
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Applicando (9.119) con ϕ = (T + iμI)−1 ψ concludiamo che: −1
||V (T + iμI)
−1
ψ|| ≤ a||T (T + iμI)
−1
ψ|| + b||(T + iμI)
ψ|| ≤
b a+ μ
||ψ|| .
Prendendo μ = ν abbastanza grande, l’operatore limitato definito su tutto H, U := V (T + iνI)−1 , deve soddisfare ||U || < 1, dato che a < 1. Questo risultato implica che −1 ∈ σ(U ) per (iii) in (c) nel teorema 8.4. Tenendo conto di (a) teorema 8.4 (notando che U `e chiuso essendo limitato) avremo di conseguenza che Ran(I + U ) = H. D’altra parte, dato che T `e autoaggiunto, deve anche essere Ran(T + iνI) = H per il teorema 5.17. Conseguentemente, l’equazione (I + U )(T + iνI)ϕ = (T + V + iνI)ϕ con ϕ ∈ D(T ) implica che, come volevamo, Ran(T + V + iνI) = H. La prova per l’altra l’identit` a, Ran(T + V − iνI) = H, si esegue del tutto similmente. La prova di (a) `e conclusa. Passiamo a provare (b). Da (9.119) segue che, se D ⊂ D(T ) `e un core per T , allora: D(T ) = D T D ⊂ D (T + V )D . D’altra parte, per costruzione e tenendo conto che T + V `e autoaggiunto su D(T ) per cui `e chiuso: D (T + V )D ⊂ D (T + V ) = D (T + V ) = D(T ) . Mettendo insieme le catene di inclusioni, si conclude che deve essere vero che: D (T + V )D = D (T + V ) e quindi (T + V )D = T + V , dato che T + V `e chiuso. (T + V )D `e allora essenzialmente autoaggiunto per la proposizione 5.18. Per concludere, passiamo alla prova di (c). Per ipotesi, dal teorema spettrale, con ovvia notazione, σ(T ) ≥ M . Si scelga s > −M (con s ∈ R). Di conseguenza vale σ(T + sI) > 0 e quindi 0 ∈ σ(T + sI). Dato che T + sI `e autoaggiunto, `e anche chiuso e allora, per (a) in teorema 8.4: Ran(T + sI) = H e le stesse stime usate precedentemente mostrano che ||V (T + sI)−1 || < 1 se: b −s < M := M − max , a|M | + b . (1 − a) Di conseguenza, per tali valori di s: Ran(T + V + sI) = H
e
(T + V + sI)−1 = (T + sI)−1 (I + U )−1 ,
che implica −s ∈ ρ(T + V ), e quindi −s ∈ σ(T + V ). Dato che T + V `e autoaggiunto ed ha quindi spettro reale, questo significa che σ(T + V ) ≥ M .
9.6 I teoremi di Kato-Rellich e di Kato
453
9.6.2 Un esempio: l’operatore −Δ + V e il teorema di Kato La condizione (9.119) nasce naturalmente in certi contesti e risulta essere di grande utilit` a nelle applicazioni, in fisica, nello studio dell’equazione di Schr¨ odinger in cui appare l’operatore di Laplace Δ perturbato tramite un potenziale V . Per discutere tale esempio di applicazione del teorema di KatoRelich, premettiamo la seguente proposizione ed un successivo lemma. Proposizione 9.51. Sia Δ :=
n ∂2 ∂x2i i=1
(9.121)
l’operatore di Laplace su Rn pensato come operatore su L2 (Rn , dx), valgono i fatti seguenti. (a) Se F : L2 (Rn , dx) → L2 (Rn , dk) indica l’operatore unitario di FourierPlancherel (vedi sezione 3.6), Δ `e essenzialmente autoaggiunto su S(Rn ), su D(Rn ) e su F(D(Rn )) ed ammette la stessa (unica) estensione autoaggiunta Δ. (b) Vale: FΔF−1 f (k) := −k 2 f(k) , (9.122) dove k 2 = k12 + k22 + . . . + kn2 , sul dominio naturale dato da:
D(FΔF−1 ) = f ∈ L2 (Rn , dk)
k 4 |f(k)|2 dk < +∞ . Rn
(c) Vale il limite dal basso per −Δ = −Δ: σ(−Δ) ⊂ [0, +∞)
che equivale a (ψ|−Δψ) ≥ (ψ|ψ) per ogni ψ ∈ D(−Δ). (9.123)
Dimostrazione. (a) e (b) sono stati provati negli esercizi 5.11 e 5.12, eccetto il fatto che Δ sia essenzialmente autoaggiunto su F(D(Rn )) e determini la stessa estensione autoaggiunta ottenuta partendo da D(Rn ) e S(Rn ). A tal fine si noti prima di tutto che F(D(Rn )), D(Rn ) ⊂ S(Rn ) e quindi le tre estensioni autoaggiunte devono coincidere per l’unicit` a dell’estensione autoaggiunta di operatori essenzialmente autoaggiunti. Il fatto che che Δ sia essenzialmente autoaggiunto su F(D(Rn )), vista l’unitariet` a di F e la (9.122), `e equivalente all’essenziale autoaggiunzione dell’operatore simmetrico moltiplicativo per −k 2 su D(Rn ). La validit` a di tale propriet` a segue subito dall’osservazione che tutti gli elementi ϕ = ϕ(k) di D(Rn ) sono vettori analitici dell’operatore moltiplicativo per −k 2 , come si verifica direttamente, valendo || − (k 2 )n ϕ|| ≤ ||ϕ||(supk∈suppϕ |k|2)n . Quindi, tenendo conto del teorema 5.46 di Nelson, (c) segue immediatamente da (b) e da (a) in teorema 9.46. Passiamo al seguente fondamentale classico lemma.
454
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Lemma 9.52. Se n = 1, 2, 3 `e fissato, si consideri f ∈ L2 (Rn , dx) ∩ D(Δ). In tal caso f coincide, a meno di insiemi di misura nulla, con una funzione continua e limitata e, per ogni a > 0, esiste b > 0 indipendente da f tale che: ||f||∞ ≤ a||Δf|| + b||f|| .
(9.124)
Dimostrazione. Eseguiamo la dimostrazione di (9.125) nel caso n = 3, gli altri due casi sono analoghi. Nel seguito fˆ := Ff. Da (a) in proposizione 3.69 e dal teorema di Plancherel (teorema 3.72), la tesi `e provata se si riesce a dimostrare che fˆ ∈ L1 (R3 , dk) e che, per ogni fissato a > 0, esiste b ∈ R con: ˆ 2. ˆ 1 ≤ a||k 2 fˆ||2 + b||f|| ||f||
(9.125)
Se f ∈ D(Δ) allora, in base alla proposizione 9.51, fˆ ∈ D(FΔF−1 ) e quindi anche (1 + k 2 )fˆ ∈ L2 (R3 , dk). Dato che (k1 , k2, k3 ) → 1/(1 + k 2 ) appartiene allo stesso spazio di Hilbert, segue che fˆ ∈ L1 (R3 , dk) per la disuguaglianza di Cauchy-Schwarz e ancora:
ˆ 1 ≤ c||(1 + k 2 )fˆ||2 ≤ c(||k 2fˆ||2 + ||f|| ˆ 2) ||f||
(9.126)
dove: c := (1 + k 2 )−1 dk. Se r > 0, definiamo fˆr (k) := r 3 fˆ(rk). Con tale deˆ 1 , ||fˆr ||2 = r 3/2 ||f|| ˆ 2 e ||k 2 fˆr ||2 = r −1/2 ||k 2fˆ||2 . finizione risulta: ||fˆr ||1 = ||f|| ˆ Usando (9.126) per fr e tenendo conto delle tre identit`a trovate, si ottiene: ˆ 2 ˆ 1 ≤ cr −1/2 ||k 2fˆ||2 + cr 3/2 ||f|| ||f||
per ogni r > 0.
Scegliendo r opportunamente si trova cr −1/2 = a e quindi (9.125) risulta essere verificata. Osservazione 9.53. Il lemma precedente si pu` o generalizzare (vedi il vol. II di [ReSi80]) con la seguente proposizione basata sulla disuguaglianza di Young. Sia f ∈ L2 (Rn , dx) con f ∈ D(Δ). Se n ≥ 4 e 2 ≤ q < 2n/(n − 4), allora f ∈ Lq (Rn , dk) e, per ogni a > 0, esiste b ∈ R indipendente da f (ma dipendente da q, n e a) tale che ||f||q ≤ a||Δf|| + b||f||. Possiamo ora applicare il teorema di Kato-Rellich ad un caso particolare di grande interesse in Meccanica Quantistica, provando un primo teorema dovuto a Kato. Successivamente vedremo un teorema pi` u generale, sempre dovuto a Kato, che include il seguente teorema come caso particolare. Teorema 9.54. (Essenziale autoaggiunzione di −Δ + V .) Sia n = 1, 2, 3 fissato. Si supponga che V = V2 +V∞ con V0 ∈ L2 (Rn , dx) e V∞ ∈ L∞ (Rn , dx) funzioni a valori reali. Vale quanto segue. (a) −Δ + V `e essenzialmente autoaggiunto su D(Rn ) e su S(Rn ). (b) L’unica estensione autoaggiunta −Δ + V degli operatori considerati in (a) coincide con l’operatore (autoaggiunto) −Δ + V definito su D(Δ). (c) σ(−Δ + V ) `e limitato dal basso.
9.6 I teoremi di Kato-Rellich e di Kato
455
Dimostrazione. Dato che V `e reale, esso individua un operatore moltiplicativo autoaggiunto sul dominio: D(V ) := {ϕ ∈ L2 (Rn , dx) | V ϕ ∈ L2 (Rn , dx)} . Per costruzione si ha anche, se ϕ ∈ D(Rn ) oppure ϕ ∈ S(Rn ): ||V ϕ||2 ≤ ||V2 ||2 ||ϕ||∞ + ||V∞||∞||ϕ||2 < +∞
(9.127)
quindi D(Rn ) ⊂ S(Rn ) ⊂ D(V ). Ulteriormente, dato che S(Rn ) ⊂ D(Δ) (per la proposizione 9.51), usando (9.124) nel lemma 9.52 (essendo n ≤ 3), troviamo allora che, per ogni a > 0, esiste un corrispondente b > 0 tale che: ||V ϕ||2 ≤ a||V2 ||2 || − Δϕ||2 + (b + ||V∞||∞)||ϕ||2
per ogni ϕ ∈ S(Rn ) .
In altre parole, se a > 0, esiste un corrispondente b > 0 tale che: ||V ϕ||2 ≤ a || − Δϕ||2 + b ||ϕ||2 per ogni ϕ ∈ S(Rn )
(9.128)
e quindi, in particolare, anche per ogni ϕ ∈ D(Rn ). Di conseguenza vale anche: ||V ϕ − V ϕ ||2 ≤ a ||(−Δϕ) − (−Δϕ )||2 + b ||ϕ − ϕ ||2 per ϕ e ϕ in S(Rn ). Usando il fatto che V `e chiuso, perch´e autoaggiunto, e che S(Rn ) `e un core per l’operatore autoaggiunto (e quindi chiuso) −Δ (per la proposizione 9.51), la disuguaglianza appena scritta mostra che D(V ) ⊃ D(−Δ). Usando ancora la chiusura degli operatori, si conclude infine che la (9.128) vale su tutto il dominio di −Δ: ||V ϕ||2 ≤ a ||−Δϕ||2 + b ||ϕ||2
per ogni ϕ ∈ D(−Δ).
Se scegliamo a < 1, abbiamo che tutte le ipotesi del teorema 9.50 di KatoRellich sono soddisfatte per T := −Δ, con V come nelle ipotesi di questo teorema. La tesi segue immediatamente dalla tesi del teorema di KatoRellich usando anche il fatto che S(Rn ) e D(Rn ) sono core per −Δ, per la proposizione 9.51. Osservazione 9.55. Tenendo conto dell’osservazione precedente, il teorema si generalizza al casi n > 3, con un’analoga dimostrazione, modificando la richiesta su V in V = Vp + V∞ con Vp ∈ Lp (Rn , dx) e V∞ ∈ L∞ (Rn , dx) dove p > 2 se n = 4 e p = n/2 se n ≥ 5. Passiamo al classico Teorema di Kato. Nel seguito f ∈ Lp (Rn , dx)+Lq (Rn , dx) si deve interpretare nel senso che la funzione f `e la somma di un elemento in Lp (Rn , dx) e un elemento in Lq (Rn , dx). Teorema 9.56. (Di Kato.) Sia n = 1, 2, 3 fissato. Si indichino con (y1 , . . . , yN ) gli elementi di RnN , dove yk ∈ Rn per ogni k = 1, . . . , N . Se
456
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
Δ denota il laplaciano (9.121) su RnN , si consideri l’operatore differenziale −Δ + V , dove V `e l’operatore moltiplicativo individuato dalla funzione: V (y1 , . . . , yN ) :=
N
Vk (yk ) +
k=1
in cui:
N
Vij (yi − yj ) ,
(9.129)
i,j=1 i 0 dipende da a, ma non dipende dai valori y2 , . . . yN ∈ R3(N−1) . Le norme sono riferite agli spazi sul primo fattore R3 di R3N ed `e fondamentale notare che, a causa dell’invarianza per traslazioni di (y1 , y2 ) → V12 (y1 − y2 ), le norme ||(V12 )k ||Lk (R3 ) non dipendono dalla variabile y2 . Per quanto notato nelle osservazioni 9.49, questa disuguaglianza equivale a: 2 ||V12 ϕ ||L2(R3 ) ≤ a || − Δ1 ϕ ||2L2(R3 ) + b ||ϕ ||2L2(R3 )
per opportuni numeri, a , b > 0 con a che pu` o essere reso arbitrariamente piccolo dato che ci`o `e possibile per a||V12||2 . Se integriamo la disuguaglianza trovata nelle variabili y2 , . . . yN ∈ R3(N−1) otteniamo che, per ogni a > 0 esiste un corrispondente b > 0 tale che: ||V12 ϕ||2L2(R3N ) ≤ a || − Δ1 ϕ||2L2(R3N ) + b ||ϕ||2L2(R3N ) .
(9.130)
in trasformata di Fourier-Plancherel su R3N
2 3
2 kr |(Fϕ)(k1 , . . . , k3N )|2 dk1 · · · dkL2(R3 N)
R3N
Si osservi ora che, passando || − Δ1 ϕ||2L2 (R3N ) =
r=1
≤
3N 2
2 2 kr2 |(Fϕ)(k
1 , . . . , k3N )| dk1 · · · dk3N = || − Δϕ||L2(R3N ) .
R3N r=1
9.6 I teoremi di Kato-Rellich e di Kato
457
Sostituendo in (9.130), concludiamo che, se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni a > 0, esiste un corrispondente b12 > 0 tale che: ||V12ϕ||2L2 (R3N ) ≤ a || − Δϕ||2L2(R3N ) + b12 ||ϕ||2L2(R3N ) . La stesso risultato si ottiene per gli altri termini Vij e per i potenziali Vk , per i quali la dimostrazione si esegue nello stesso modo, ma risulta essere ancora pi` u semplice. Se ϕ ∈ D(R3N ) oppure S(R3N ), per ogni scelta di a > 0, esiste un corrispondente scelta di numeri bi > 0, bij > 0 con i, j = 1, . . . , N ej > i tale che: ||Vi ϕ||2L2 (R3N ) ≤ a || − Δϕ||2L2(R3N ) + bi ||ϕ||2L2(R3N ) , ||Vij ϕ||2L2(R3N )
≤a
|| − Δϕ||2L2(R3N )
+
bij ||ϕ||2L2(R3N )
(9.131) .
(9.132)
In ogni spazio vettoriale con prodotto scalare hermitiano, la disuguaglianza
2
2
M M di Cauchy-Schwartz implica:
r=1 ψr
≤ r=1 ||ψr || . Tenendo conto che i potenziali Vk e Vij sono in tutto N + N (N − 1)/2 = N (N + 1)/2, la disuguaglianza menzionata e le (9.131)-(9.132) implicano che:
⎛ ⎞
2
N
N
⎝
⎠ V + V ϕ k ij
k=1
2 i,j=1 i 0 esiste un b > 0 tale che: ||V ϕ|| ≤ a || − Δϕ|| + b ||ϕ|| per ogni ϕ ∈ S(R3N ). Da questo punto in poi, la dimostrazione procede esattamente come quella del teorema 9.54, a partire dall’equazione (9.128), rimpiazzando ovunque Rn con R3N . Per concludere citiamo senza dimostrazione completa un ulteriore importante teorema, dovuto a Kato, che richiede ipotesi differenti (e pi` u deboli nel caso n = 3 rispetto a quelle nel teorema 9.54) sulle funzioni V , affinch`e −Δ + V risulti essere essenzialmente autoaggiunto su D(Rn ). Ricordiamo che f : Rn → C `e detta essere localmente a quadrato integrabile se f · g `e in L2 (Rn , dx) per ogni g ∈ D(Rn ). Teorema 9.57. L’operatore −Δ + VΔ + VC in L2 (Rn , dx) `e essenzialmente autoaggiunto sul dominio D(Rn ) e la sua unica estensione autoaggiunta −Δ + VΔ + VC `e limitata dal basso, se valgono le seguenti ipotesi.
458
9 Teoria Spettrale II: operatori non limitati in spazi di Hilbert e applicazioni
(i) VΔ : Rn → R `e una funzione misurabile che individua un operatore moltiplicativo (−Δ)-limitato con limite relativo a < 1 (nel senso del definizione 9.48). (ii) VC : Rn → R `e una funzione localmente a quadrato integrabile con VC ≥ C quasi ovunque per qualche C ∈ R. Le ipotesi (i) sulla funzione mi