136 58 116MB
Hungarian Pages 312 [155] Year 2009
Tartalom
Bírálók:
KÁLLAY MIHÁLY
Előszó ...................... ,........................................................................................................ s Néhány alapvető és származtatott fizikaiáliandó ................................................ 8 A könyvben használt fm:Í1:osabb rövidítések és jelölések ................................... 9
l.
egyetemi docens BME Fizikai Kémiai Tanszék
CSONTOS JÓZSEF tudományos főmunkatárs BME Fizikai Kémiai Tanszék Borítóterv:
SZÖNYI ETELKA
ISBN 9?8-963-482-949-2 2.
Mindenjog fenntartva. Jelen könyvet, illetve annak részeit tilos reprodukálni, adatrögzítő rendszerben tárolni, bármilyen formában, vagy eszközzel - elektronikus, mechanikus, fényképészeti úton vagy más módon közölni a kiadó engedélye nélkül.
Szimmetria a kémiában
ll Bevezetés ...................................................................................................... 11 Alapvető matematikai fogalmak ................................................................... 12 A csoport fogalma ......................................................................................... l 3 Mátrixok a kémiában és a fizikában .... ,........................................................25 A fiiggvénytér fogalma* ............. ,................................................................. 54 Molekulák sztatikus és dinamikus szimmetriája...........................................73 1-6.1 Molekuláris pontcsoportok és vázcsoportok........................................74 1-6.2 Molekulák geometriája: a Z-mátrix fogalma .......................................92 1-6.3 A szimmetria megnyilvánulása molekuláris tulajdonságokban ...........96 1-6.4 Mol~kuláris szimmetriacsoportok., .................................................... 104 1-7. K:ristályok szimmetriája: tércsoportok ........................................................ l08 1-8. Feladatok..................................................................................................... l16 1-9. Ajánlott irodalom ........................................................................................124 F.1-1. M!ltematikai logikai és halmazelméleti alapok .......................................... J25 F.l-2. A komplex számok algebrája ...................................................................... 137 F.l-3. Vektoralgebra és vektoranalízis .................... ~ ...... ~ ...................................... 140 F .1-4. Egy folyamatábra molekuláris pontcsoportok meghatározására ............... .149 FJ-5. A krisztallográfiai pontcsoportók ...............................................................150 1-1. 1-2. 1-3. 1-4. 1-5. 1-6.
Modellezés és paraméterbecslés a kémiában 151 2-1. Bevezetés ..................................................................... ,............... :.............. 151 2-2. Differenciálegyenletekkel kapcsolatos alapfogalmak................................. 152 2-3: . A LAPLACE-transzformáció......................................................................... l 60 2-4. Valószínűség a matematikában, a kén;úában és a fizikában ....................... 165 2-5: Paraméterbecslés a legkisebb négyzetek módszerével ............................... 195 2-6. Kémiai reakciók időbeli lefolyása: fenomenologikus tárgyalás ................ .216 2-7. A variációszámítás alapjai .................................................. ,. ......................230 2-8. A klasszikus mechanikamint poézis ..........................................................241 · 2-9. A tömeg és az energia ekvivalenciája .........................................................255 2-10. - Feladatok .....................................................................................................266 2-11. Ajánlott irodalom ........................................................................................271 F.2-1. Egyszerű lineáris ODE-k hagyományos megoldása ...................................278 F.2-2. A SOMMERFELD-féle módszer differenciálegyenletek megoldására...........284 F .2-3. Függvények minimalizálása szimplex-eljárással ....................................... .286 F.2-4. Speciális fiiggvények a kémiában* .............................................................289 F.2-5. Néhány fiiggvény LAPLACE-transzförmáltja .............................................. .31 0
' 3
Tasi Gyula: Matematikai kémia
Előszó
A tudomány matematika nélkül elképzelhetetlen. Nagyon sok tudományos eredmény csak matematikai eszközök segítségével írható le és érthető meg. A megfelelő matematikai háttér hiánya nagyon sok egyetemi hallgató tudományos előrehaladását lassíija, sőt meg is akadályozhatja őket a tudományos eredmények felfogásában, megértésében. A matematika bizonyos fokú ismerete tehát minden tudományos szakember számára fontos. Persze, egy kémikusnak nem pontosan olyan matematikai ismeretekkel kell rendelkeznie, mint egy gépészmémöknek vagy egy közgazdásznak. A különböző természettudományok is a matematika más-más területére helyezik a hangsúlyt. A kémikusok és a fizikusok azoriban napjainkban jobbára azonos matematikai eszközöket használnak. Azonban ez nem volt mindig így. Érdemes meggondolni, hogy a XVIII-XIX. században nagyon sokan úgy gondolták, hogy a kémiának egyáltalán nincs szüksége matematikára: "Every attempt to empl9y mathematical methods in. the study of chemical questions must be considered profoundly irrational and contrary to the spirit of chemistry. If mathematical analysis should ever hold a prominent place in chemistry - an aberration which is hoppily almost impossible - it would occasion a rapid and widespread degeneration of that science." [Augustus Compte, Freneh philosopher, 1798-1857; in Philosophie Positive, 1830]
Azonban, szerencsére, tannak nevezetes kivételek is: például Jeremias Benjamin. RICHTER (1762-1807), a sztöchiometria szó megalkotója, a matematika szeÍ:epét a kémiában olyan fontosnak tartotta, hogy egy háromkötetes müvet írt a matematika kémiai alkalmazásairól: "Anfangsgründe der Stöchiometrie oder Messkunst chem. Elemente", I-III, Hirschberg, Breslau, 1792-94. A (klasszikus) fizika már a XIX. században a matematikai analízis szilárd talaján állt. A XVII-XIX. század nagy fizikusai általában jelentős matematikai munkássággal is rendelkeztek. A XVII. század legnagyobb fizikus-matematikus géniusza, Isaac NEWTON (1642-1727), még kémiával is foglalkozott. Sőt, ezeket a tanulmányait is ugyanolyan fontosnak tartotta, mint a fizika területén születetteket. A tudományos gondolkodást ezekben az időkben a newtoni determinizmus elve uralta, s úgy gondolták, hogy a természet jelenségei differenciálegyenletek segítségével leírhatók. .A valószínűség tudománya éppen hogy csak megszületett a XVII. században, s egyálatán nem jutott szerephez a fizikában és. a kémiában. A klasszikus fizika csúcsát az analitikus mechanika megszületése jelentette: létrejött a variációszámítás az infinitezimális kalkulus talaján. A variációszámítás eszközeit napjaink kémiirusai és fizikusai egyaránt használják. · A XX. század döntő változást hozott a természettudományokban használt matematikai eszközöket illetően: győzött az absztrakt algebra és a valószínűségelmélet! Ez végül is a kvantummechanika 1925-ös megszületésének volt az eredménye. Megjelentek a mátrixok és azok csoportjai a fizikában és a .kémiában. Ezt gyorsan követte a kémiai kötés elméleti értelmezése és a BORN-ÜPPENHEIMER-féle közelítés megjelenése 1927-ben, amik megnyitották a kaput a kvantunnriechanika számára a kémia felé. Paul Adrian Maurice DIRAc (1902-1984) 1929-es híres kijelentése már a kémiai problémákat'egyenesen alkalmazott matematikai problémákra redukálta: 5
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
"The general theory of quantum mechanics is now almost complete, the imperfections that still remain being in connection with the exact fitting of the theory with relativity ideas. These give rise to difficulties only when high-speed particles are involved, and are therefore of no importance in the consideration of atomic and molecular structure and ordinary chemical reactions, in which it is indeed usually sufficiently accurate if one neglects relativity variation of mass with velocity and assutiles only Coulomb forces between the various electrons and atomic nuclei. The underlying physical laws necessary for the mathematieal theory of a large part of physics and the whole of chemistry are thus completely known, and the difficulty is only that the exact application of these laws leads to equations that are too complicated to be soluble. It therefore becomes desirable that approximate practical methods of applying quantum mechanics should be developed, which can lead to an explanation of the main features of camplex atomic systems without too much computation." [P.A.M. Dirac, Proc. Roy. Soc. (London), 123, 714 (1929)]
kérdéses bekezdéseket pedig két fiiggőleges párhuzamos vonal közé helyeztük. Ezek a részek egy alapozó általános kurzus esetén elhagyhatók. Sok barát, kolléga és tanítvány segített emelni a könyv színvonalát. Különösen hálás vagyok Kállay Miháy és Cs~ntos Józseftanár uniknak, valamint Barna Dóra, Németh Eszter és Nagy Balázs hallgatóknak. Alaposak voltak a kézirat átnézésében és őszintén megmondták a véleményüket. A könyvben kiértékelt mérési eredmények pedig kémiai és környezettudományi B Sc (náppali és levelező) hallgatók lelkes kisérleti munkáját dicsérik.
DIRAc szerint tehát a fizikai problémák nagy része és a kémiai problémák teljesen az alkalmazott matematika tárgykörébe tartoznak. Természetesen az akkori mechanikus számlálógépek nem voltak alkalmasak a kérdéses egyenletek megoldására. Érdemes megemlíteni, hogy Edward TELLER (TeHer Ede, 1908-2003) híres magyar származású kémikus-fizikus Werner HEISENBERG ( 190 1-1976) német fizikus doktorandusza volt abban az időben Lipcsében. A feladata a legkisebb molekula, a H; molekulaion, alap és getjesztett elektronállapotainak a meghatározása volt. Az előreláthatólag több évig tartó munkának, feltehetőleg a mechanikus számlálógép által keltett elviselhetetlen zaj rniatt, végül is HEISENBERG vetett véget. A későbbi Los Alaroas-i nukleáris kutatások (1940-45) is azt mutatták, hogy az akkori számítógépek nem tudtak megbirkózni a problémákkal. John von NEUMANN (Joha.mi von Neumann, Neumann János, magyar származású amerikai matematikus, 1903-1957) akkori számítógépe l lebegőpontos müveletet tudott végezni másodpercenként (Eng. monojlop machine = l flop/s). Napjainkban ez a helyzet jelentősen megváltozott: az utóbbi két évtizedben a számítástechnika óriási fejlődésen ment keresztül. Ezzel kapcsolatban érdemes megemlíteni egy, a Journal of Chemica/ Education folyóiratban megjelent cikket [P.S. Poskozim, Computer Speed and Avogadro 's Number, J. Chem. Educ., 85, 634 (2008)]. Ebből kiderül, hogy napjaink legjobb IBM számítógépe 445 trillió műveletet tud végezni másodpercenként, s így Avogadro-számnyi számításhoz 43 évre lenne szükség. Az 1986-os év egyik legjobb számítógépe, CRAY ~s l esetén ugyanez a számítás 1.9 millió évet igényelt volna. Ez azt jelenti, hogy a jelenlegi legjobb számítógép kb. 44000-szer gyorsabb. Ez évi kb. 2000-szeres sebességnövekedést jelent; ami pedig némi optimizmussal azt jelentheti, hogy egy év múlva a kérdéses számítás már csak 8 napot igényel! Jelen mű a matematikai kémiai alapokat nyújtja a későbbi termosztatikai, statisztileus termodinamikai, kvan~émiai, spektroszkópiai, szilárdtestkérniai, ásványtani, kristálytani, reakciókinetikai, radiokémiai, művelettani és nem utolsósorban a számitásos kémiai tanulmányokhoz, feltételezve a hagyományos matematikai analízis (differenciál- és integrálszámítás) ismeretét. Az érdeklődő hallgatóknak további cikkek és könyvek tanulmányozását is javasoljuk. A továbblépéshez nagyszerű cikkek találhatók a Journal of Chemical Education (J. Chem. Educ.), az American Journal of Physics (Am. J. Phys.) és a Journal of Mathematical Chemistry (J. Math. Chem.) folyóiratokban. Jelen műben vannak olyan fejezetek, bekezdések és feladatok, melyek aZ átlagosnál több figyelemet, türelmet igényelnek. Ezeket a fejezeteket és feladatokat csillaggal megjelöltük:; a
Szeged, 2009.
6
Tasi Gyula
7
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Néhány alapvető és származtatott fizikai állandó
A könyvben használt fontosabb rövidítések és jelölések
Az állandók P.J. MOHR, B.N. TAYLOR és D.B. NEWELL cikkéből szánnaznak: "CODATA Recommended Values of the Fundamental Physical Constants: 2006'', J. Phys. Chem. Ref.
z+,N: a természetes számok (pozitív egész számok) halmaza ( {1, 2, ...})
Data, 37(3), 1187-1284 (2008) (http://physics.nist.gov/constants). Értéküket a legkisebb négyzetek módszere alapján végzett illesztéssei határozták meg. Az illesztés jóságára jellemző statisztikai adatok a kérdéses cikkben megtalálhatók
z:,N.:
Mennyiség
A fény sebessége vákuumban A vákuum permeábilitása A vákuum permittivitása
Szimbólum
Erték
Dimenzió
c
299792458 47t x 10- 7
ms-1 NK2
/1{)
1/JloC2
Eo h
34
mplm.
6.62606896 x 101.054571628 x 10-34 1.602176487 x 10-19 1.672621637 x 10-27 1.00727646677 9.10938215 x 10-31 1.674927211 x 10- 27 1.00866491597 1836.15267247
mplm.
1838.6836605
ao Eh
u, mw, arnu
0.52917720859 x 10- IO 4.35974394 x 10- IS 27.21138386 6.02214179 x 1023 1.660538782 x 10-27
R k
8.314472 1.3806504 x 10-23
Planck-féle állandó h/2K Elemi töltés A proton tömege
e mp
Az elektron tömege A neutron tömege
m. m.
li
Proton-elektron tömeghányados Neutron-elektron tömeghányados Bohr-rádiusz Hartree-energia
N,~
A vagadro-állandó Atomi tömegegység 2 m. = C)/l2 Moláris gázállandó Boltzmann-állandó R/NA
me
Fm- 1 J s-1 J s-t
c kg
amu kg kg
amu
ro J
eV
Konverziós faktorok l l l l
1
eV= 23.06055 kcal mor = 96.48534 kJ mor1 = 8065.545 cm- 1 Eh= 627.5095 kcal mor1 = 2625.500 kJ mol- 1 = 27.21138386 eV Bohr-elektron = 2.541747 Debye cal= 4.184 J
Atomi egységek (Eng. atomic units, a.u.) A kvantumkémiai számításokban ún. atomi egységeket használunk. Atomi egységek használatára úgy térhetünk át, ha feltesszük, hogy 1l = m. = 4JZ"E0 =l és e = l. Ezek következménye például hogy a0 =Eh =l. Az idő atomi egysége: T0 = 1i/Eh. A sebesség atomi egysége: v0 = a0 0 • Így a fénysebesség atomi egységben: c0 = cfv0 = 137.036.
/T
8
Z : az egész számok (pozitív, negatív és a zéró) halm~ z~,N 0 : a nemnegatív egész~számok (a természetes számok és a nulla) halmaza
az első n természetes szám halmaza ( {1,2, ... ,n}) Q : a racionális számok halmaza Q+: a pozitív racionális számok halmaza IR : a valós számok halmaza IR+: a pozitív valós számok halmaza IR~: a nemnegatív valós számok halmaza IR' : a standard és a nemstandard valós számok halmaza C : a komplex számok halmaza 0 : üres halmaz 'P(A): az A halm~ hatványhalm~ . QED: Quod erat demonstrail'd.um (latin) =.be van bi:wnyítva · oif : a KRONECKER-féle delta e ifk :
LEVI-CMTA szimbólum
o(x): a DIRAC-delta A® B : direktszorzat (halmazok, csoportok, mátrixok, stb.) Sp(A): az A mátrix nyoma (spfuja) det(A): az A mátrix determinánsa [P,Q]: a P és a Q mátrixok (operátorok) kommutátora (x az x bra-vektor lY): az y ket-vektor (x ly) : az x bra-vektor és az y ket-vektor skaláris szorzata L2 : a négyzetesen)ntegrálható fiiggvények tere .L{f(t)}: azj{t) fuggvény LAPLACE-transzformáltja ..C1{F(s)}: az F(s) függvény inverz LAPLACE-transzformáltja V : nabla-operátor L\ = V 2 : LAPLACE-operátor n : eseménytér (Q,F,P): valószínüségi mező E ( ,;) a ~ valószínűségi változó várható értéke 2 D ( ,;) = (L\,;)2 : a~ valószínűségi változó szórásnégyzete (varianciája) D ( ,;) L\ ,g : a ~ valószínűségi változó szórása SE (a) : az paraméter becsült hibája L( q, q,t) : LAGRANGE-fiiggvény H(q,p,t): HAMILTON-fiiggvény
l:
=(,;) : =
a
9
Tasi Gyula: Matematikai kémia
1. Szimmetria a kémiában "Tigris! Tigris! éjszakánk Erdej ében sárga láng, Mely örök kéz szabta rád Rettentő
szimmetriád?"
William Blake (1757-1827), A tigris,
Szabó Lörinc fordításában.
1-1. Bevezetés A természet egyik legmegragadóbb tulajdons~ga a szimmetria. A szimmetria fogalmának természettudományos megalapozásához Hermann WEYL (1885-1955) egy kitűnő megfogalmazásából lehet kiindulni, miszerint akkor szimmetrikus valami (tárgy, törvény, jelenség stb.), ha azt meghatározott műveletnek alávetve nem tapasztalunk változást. A szimmetriavizsgálatok leghatékonyabb eszköze a csoportelmélet. Ahogy. a számok nagyságot, úgy a csoportok szimmetriát mémek. Nem is annyira az absztrakt csoportelmélet, mint inkább a csoport-reprezentációelmélet játszik fontos szerepet kémiában és a fizikában. Atomok, molekulák és kiterjedt szilárd anyagok szimmetriájának leírásához általában más és más csoportot alkalmazunk. Általánosságban igaz, hogy minél nagyobb a rendszer szimmetriája, annál komoly~bb matematikai apparátus kell a szimmetria kezeléséhez. Ennek megfelelöen az atomok jeldntik a legnagyobb problémát (teljes forgási csoport), majd a lineáris molekulák (axiális forgási csoport) és a nemlineáris molekulák (pontcsoportok, vázcsoportok és szimmetriacsoportok), végül pedig a kiterjedt szilárd rendszerek (tércsoportok) következnek. A csoport mellett azonban más algebrai struktúrákat (test, gyűrű, háló, lineáris tér, HILBERT-tér stb.) is használunk természeti jelenségek leírására, így ezekkel is kell foglalkozunk. A fizikai-kémiai alkalmazásokat illetően a lineáris tér messze az első helyet foglalja el az algebrai struktúrák között. A lineáris terekkel és tulajdonságaikkal foglalkozó tudományág, a lineáris algebra, a-b antummechanika és a kvantumkémia matematikai nyelve. A mátrixok algehrája, a széleskörű fizikai és kémiai alkalmazások következtében igen fontos algebrai struktúrává vált az idők folyamán. Nagyon sok fontos, közvetlenül nehezen kezelhető algebrai struktúráról derült ki ugyanis, hogy izomorfia létesíthető köztük és speciális mátrixok halmazai között. Az izomorfia megteremtése után pedig mindazok az eredmények rendelkezésünkre állnak, amik a mátrixokra már bizonyítást nyertek. Ez valójában azt jelenti, hogy az izomorfia miatt elegen~ő csak a kérdéses mátrixok algebrai struktúráját tanulmányoznunk annak érdekében, hogy a nehezen kezelhetö eredeti algebrai struktúra tulajdonságairól információt szerezzünk.
a
ll
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1-2. Alapvető matematikai fogalmak
1-3. A csoport fogalma
A matematikában, a fizikában és a kémiában deduktív elméletek a legsikeresebbek. Gondoljunk csak az euklideszi geometriára, a különbözö axiomatikus halmazelméletekre, a valószínüségelméletre, a termodinamikára, a klasszikus mechanika newtoni axiómarendszerére, az analitikus és a relativisztikus mechanikára és nemutolsósorban a kvantummechanikára. Mindezek az elméletek véges sok axiómán alapulnak. Egyedül a bennük szereplö határozatlan mennyiségeket kell definiálnunk, azaz matematikai vagy fizikai-kémiai tartalommal megtöltenünk. A matematikai logika eszközeinek segítségéve!, az axiómák alapján, tételeket tudunk felállitani és bizonyítani. Ez a folyamat vezet az elmélet bővítéséhez, teljesebbé tételéhez. Az előbbiek fényében nem meglepö, hogy óriási meglepetést és megdöbbenést keltett Kurt GöDEL (1906-1978) német-cseh-osztrák-amerikai matematikai logikus 1931-ben napvilágot látott nemteljességi tétele (Eng. Gödel 's incompleteness theorem). A tétel szaba O. Legyeh A-t= diag(l/ J];), így (A-t)2 A= A(A-t) 2 =l. Fejezzük ki az S mátrixot a A rnátrix segítségéve}: S=V AVt. Defmiáljuk az s-t rnátrixot következőképpen: s-t =·V A-tvt. Ekkor S(S-t)2 =V Avtv A·tvtv A-tvt =V A(A-t)2 v t =VVt
=l. Hasonlóan mutatható meg, hogy (S-t)2 S =l. Ez pedig azt jelenti, hogy s·t., = (S-t)2 • Az s-t rnátrix is hermitikus, ugyanis 51
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
(S-t)t =(V A-t v t )t
q(x)= xTSTSx = (Sx)T (Sx);:: 0.
Ennek megfelelően az STS mátrix sajátértékei nemnegatív valós számok és mivel valós és szimmetrikus, az STS mátrix ortogonális transzforinációval diagonalizálható: A= VT (STS)V = diag(~). A hasonJósági transzformációval szemben a mátrix rangja invariáns. A következő tétel fogja biztosítani a maximálisan lineárisan (algebrailag) fiiggetlen reakciólépések számának gyors meghatározását.
= V(A-t)t vt =V A·tvt =S-t. Most határozzuk meg a fentiekben felhasznált s·ts mátrixszorzatot: s-ts=v A·tvtv Avt
Tétel: Az STS mátrix p(STS) = p(S) darab pozitív és (K- p(S)) darab nulla sajátértékkel rendelkezik.
=VA-tAvt =VAtvt
Ez azt jelenti, hogy a sztöchiometriai mátrix rangjának a meghatározása érdekében az STS mátrix sajátértékeit kell meghatároznunk és meg kell számolnunk a pozitív sajátértékeket Végül is ez a szám lesz a sztöchiometriai mátrix rangja. Valós és szimmetrikus mátrixok diagonalizációjára pl. a JACOBI-féle diagonalizációs eljárást használhatjuk. Az előbbi elgondolásaink természetesen az SST mátrixra is alkalmazhatók, s így mindegy, hogy a kettő közül melyik mátrixot használjuk fel a numerikus eljárás során.
=St, majd igazoljuk az s·t st =l összefiiggést is: s-t st =V A·tvtv Atvt =VA-tAtvt =vvt
=l. Hasonlóan láthatjuk be, hogy st s-t = 1, azaz (S-t)"1 =st. Általános mátrix sajátértékegyenlettel találkozunk például a kiterjesztett HOCKEL-féle és az ab initio HARTREE-FOCK-ROOTHAN-HALL-féle kvantumkémiai módszerekben. Az utóbbi esetben tovább bonyolítja a helyzetet, hogy a H márixnak megfelelő FOCK-mátrix fiigg a sajátfiiggvényektől, azaz egy nemlineáris egyenletrendszert kell iteratíve megoldanunk. Az 1-5. fejezetben megmutatjuk, hogy az s ·t mátrixszal történő transzformáció egy olyan bázistranszformációval ekvivalens, me1y nemortogonális bázisfiiggvényekből ortogonális bázisfiiggvényeket hoz létre. Az általános mátrix sajátértékegyenlet konverziójára további módszerek is rendelkezésünkre állnak: a GRAM-SCHMIDT-féle módszer és aMASAMURA-féle eljárás. Az utóbbi igen egyszeruen programozható és majdnem egy nagyságrenddel gyorsabb, mint a LöWDIN-féle módszer (M. Masamura: An Ejjicient Algorithm for Solving Eigenvalue . Prob/ems of the Type HC = SCe or FC = SCe, J. Comput Chem., 3, 257 (1988)). Ennek ellenére csak ritkán alkalmazzák a kvantumkémiai programokban. (Miért?) Térjünk most vissza a sztöchiometriai mátrix problémájához. Az S mátrix legsúlyosabb problémája az, hogy nem kvadratikus. Ez azonban könnyen orvosolható, hiszen a belőle képezhető STS és SST mátrixok négyzetesek ( dim(STS) = KxK , dim(SST) = RxR ), sőt valósak és szimmetrikusak, azaz hermitikUsak. Könnyen igazolható a következő tétel.
l Elegendő csak arra gondolni, hogy a mátrix rangja a legnagyobb zérustól különböző aldeterminánsának a rendje és invariáns a transzponálással szemben. Képezzük a következő kvadratikus alakot az STS valós szimmetrikus mátrix segítségéve!: q( x) = x\STS)x (xe IRK). Azonnal látszik, hogy ez a kvadratikus alak pozitív szemidefinit, hiszen 52
53
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1-5. A függvénytér fogalma*
Definíció: A ( j ) :V® V ~ a2E :F);
3. (xjx) ~O; (x jx)= O pontosan akkor, ha x= O.
(asszociativitás).
A4. Vu E V-hez :3(-n)E V, hogy u +(-u)= (-u)+u =O (additív inverz létezése).
.
Ezt szavakkal úgy fejezzük ki, hogy a skaláris szorzat lineáris a második és antilineáris az első argumentumában. Például a fentiekben tárgyalt a~2 , ... ,~.) (ae R);
o= (0,0, ... ,0); -x = (-~~, -~2, ... ,-~.}. Belátható, hogy így a lineáris tér minden axiómája teljesül, úgyhogy az IR" halmaz az előző definiciókkal vektortér az IR test felett. A kérdéses teret n-dimenziós valós koordinátatérnek neveZZük. Ha az IR" halmazt a 1=1
ahol a
1
9 skalárokat az x vektor z bázisra vonatkozó koordinátáinak nevezzük, és a
z(x)= (~1>~2>''''~.) rendezett szám-n-est az x vektor X koordináta-rendszerbeli reprezentációjámik mondjuk. A bázis elemeit valamilyen ortogonalizációs eljárással (pl. GRAM-SCHMIDT-féle eljárás, LöWDIN-féle szimmetrikus ortogonalizáció) ortonormálttá tehetjük, s így egy ortonormált bázishoz juthatunk.
z
58
Bizonyítás: Legyen
z= {x" x 2 , ... , x.}
egy tetszőleges bázis a V térben. Ennek segítségével
'v'xe V előállítható a következő formában: X= fq;xl,
azazz(x)=(~,,~2>'"'~•).
i= l
Azt állítjuk, hogy a rp: x~ z(x) bijektív leképezés izomorfizmus, azaz a V és az F" vektorterek izomorfak egymással. Az izomorfizmus belátása érdekében meg kell mutatnunk, hogy rp(aou +p ov) = rp(aou)+ rp(/Jo v)= a o rp(u)+ Porp(v).
Meg kell azonban említeni, hogy egy kis pongyolaságot követtünk el ennek az összefüggésnek a felírásakor: a két vektortér esetén ugyanis a vektorösszeadást és a skalárral való szorzást ugyanazokkal a szimbólumokkal jelöltük. (Csak zárójelben jegyepük meg, hogy a félreértések elkerülése végett helyesebb lenne péÍdául a következő jelölésmód alkalmazása: rp(aou +p o v) = rp(aou) $ rp(p o v) = a• rp(u) EB P• rp(v). 59
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia Ebből
ugyanis azonnal látszik, hogy lcülönböző
terekről
és
lcülönböző műveletekről
van szó!
Ez ajelölésmód azonban túlságosan komplikált.) Legyenek u= "f.,u,x1 és v= "fv,x1• Ekkor .
~
(~+tp2 )(X)=tp1 (x)+tp2 (x)
(Vxe V),
(ao~)(x)
(Vxe V A Va e :F).
= a~(x)
Látható, hogy az eredmény szintén lineáris funkcionál V -n, így a V' eleme. Az összeadást és a skalárral való szorzást így defmiálva, a tp0 -t nullelemnek választva, a V' vektortér: a V-n értelmezett lineáris funkeionálok vektortere. Ezt a vektorteret a V vektortér duális terének nevezzük. A vektortér és duálisa izomorfak {RIESZ-tétel, RIESZ Frigyes magyar matematikus, 1880-1956). Feleltessük meg ugyanis a tpe V'-nek a V egy y elemét úgy, hogy tp(x)=(ylx) (VxeV).
~
i=l
tp(a ou+ po v)= (a14 + pvPaPl + Pv2 , ••• ,a,u. +Pv.); aotp(u) +p o tp( v)= ao(J4,,u2 , •• • ,,u.)+ p o (v~> v2, .•• , v.) = (aJ.4,aJ4, ... ,a,u.) + (Pv1,Pv2 , ••• ,pv.) = (a14 + Pv~>aPl + Pv2 , •• • ,a,u. +Pv.). QED A tételből azonnal következik, hogy ugyanazon :F test feletti n-dimenziós vektorterek izomorfak egymással, hiszen az izomorfizmus ekvivalencia reláció, igy reflexív, szimmetrikus és tranzitív. Az izomorfizmus létemiatt ettől kezdve tehát elegendő lenne csak az :F" vektortér tulajdonságaival foglalkoznunk. Ez azonban egy bázis rögzítését tenné szükségessé, s elrejtené a vektortér általános, bázistól fiiggetlen tulajdonságait. Legyen V egy vektortér és V'(:;t0) ~V. Ha Vx,ye V' és Va,pe :F esetén ax + py e V', akkor a V'-t lineáris altérnek (altér, lineáris sokaság) nevezzük. Triviális alterek a nulla altér, ami a nullvektorból áll és maga a teljes tér. A nemtriviális altereket valódi altereknek hivjuk. Legyen L a V vektortér tetszőleges részhalmaza, és képezzük a következő alteret N =n A. (VA,) (L ~ A. A A, lineáris sokaság V -ben).
Az nyilvánvaló, hogy tetszőleges y e V egy li:Q.eáris funkcionált definiál az összefiiggés alapján, így csak azt kell bizonyítani, hogy egy tetszőleges tp •lineáris funkcionálhoz 3y e V, ami kielégíti az összefiiggést. Legyen z= {XpXz, ... ,xn} ortonormált bázis a v téren és tp egy tetszőleges lineáris funkcionál. A vektortér tetszőleges x eleme előállítható a bázisvektorok lineáris kombinációjaként: n
x= :L;;x1• i=l
Továbbá
tp(x)= "f;,tp(xJ. i=l
Képezzük a következő vektort: n
y= L[tp(x1)]*xl. j=l
v
Az N alteret az L halmaz által kifeszített (generált) altérnek, vagy az L halmaz lineáris burkának nevezzük. A bázis •tehát vektorok olyan lineárisan fiiggetlen halmaza, amelynek lineáris hurka az egész tér. Legyen V egy n-dimenziós vektortér és U ennek egy lineáris altere. Az U altér UJ. ortogonális kiegészítője (az U-ra ortogonális altér): UJ. =(Vx) (xe V AX l. 'Ilye U).
= "ff;,IP(x1) öj, = "f.;,IP(x1) = tp(x). QED i=l
Ó(ax+Py)=aÓx+PÓy (Vx,ye V,Va,pe :F).
(Vx.,x2 E V A 'lf~,a2 E :F).
Speciális lineáris operátorok a nulloperátor ( Öx = O) és az egységoperátor ( ix = x). További példák lineáris operátorokra: a D, differenci.jilás és az X skalárral való szorzási operátorok:
Tetszőleges vektortéren értelmezett bármely
tp lineáris funkcionálra teljesül, hogy tp(O) = tp(OoO) =Otp(O)= O.
Lineáris funkeionálca példaként válasszuk a C" teret; továbbá x = (~,;2 , ••• , ; . )
~~;,xt J= t~;,tp(xi)(xi lx~)
Definíció: Legyen V vektortér az :F test felett. Az Ó :V -7 V leképezést operátornak nevezzük. Az Ó operátor lineáris, ha
Defmíció: A tp: V -7 :F funkcionál lineáris, ha = a 1 tp{Xi)+a2 tp{x2 )
(y lx)= (t[tp(x1)J*xi
j=l i=l
Az U u U J. kifeszíti a V teret: Vxe V-hez3(u,z) (ue U, ze UJ.), hogyx=u+z.
tp(~ X 1 +a2 X2 )
Ennek a skaláris szorzata a vektortér tetszőleges x elemével:
és
y= (T]p17z, ... ,1].) legyen ennek két tetszőleges eleme. A tp( x)= ; 1 definícióval lineáris
D.f(x) =d
d:);
Xf(x) =x t(x).
funkcionálhoz jutunk, ugyanis ax+ PY = (aqt + P11~>a;2 + P112 , ... ,a;. + P1l.);
Ebben az esetben a V vektortér elemei fiiggvények, ezért a vektorteret fiiggvénytérnek is nevezhetjük. Természetesen, a D, csak akkor tekinthető operátornak, ha az f(x) fiiggvény
tp(ax+Py)=a;1 +P1l1 =atp(x)+Ptp(y). Tetszőleges V vektortér esetén tp0 legyen olyan, hogy Vx e V -re teljesüljön, hogy tp0 (x) = O.
denváltja is a V térhez tartozik. A D, és az X operátorok szorzata- ami alatt egymásután való végrehajtásukat értjük- következőképpen hat az f(x) fiiggvényre:
Jelölje V' a V-n értelmezett lineáris funkeionálok összességét. Legyen ~.tp2 e V'. Értelmezzük ezek összegét és skalárral való szorzatát következő módon: 60
61
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
(:D,X)f(x) = Ö,(Xf(x)) = !{_(xf(x)) = f(x)+x df(x); dx dx
(:XD,) f(x) = XCÖ, f(x)) =x d f(x).
lényegre tudunk témi. Legyen V egy n-dimenziós vektortér és X = {x 1 , x 2, ••• , x.} annak egy bázisa. Tudjuk, hogy Vxe V felírható a bázisvektorok lineáris kombinációjaként, így speciálisan j = l, 2, ... , n esetén:
tetszőleges
dx Látható, hogy a két jobb oldal nem azonos, azaz a két operátor szorzása nem kommutatív: CÖ,X-XO,)f(x)=f(x), azazÖ,x-xo. =i.
Az A= {ay} n x n-es mátrixot az Á lineáris operátor X bázisra vonatkozó márixrepre-
A Ö ,X- XO, szorzatot a két operátor kommutátorának nevezzük és [Ö,, X] módon jelöljük:
zentációjának (mátrixának) nevezzük:
i=I
[Ö,,X] = Ö,X- XO,. (A kommutátor fogal:tnát mátrixok esetén már értelmeztük.) Meg kell
[Á.x]= A= {ay}·
említenünk, hogy nemkommutáló operátorok centrális szerepet töltenek be a kvantummechanikában. Ezt a nemkommutatív tulajdonságot hangsúlyozó ún. HEISENBERG-féle felcserélési szabályok kanonikusarr konjugált fizikai mennyiségeket reprezentáló lineáris hermitikus operátorokra vonatkoznak:
Vegyük észre, hogy az Áx1 vektor ,t bázisra vouatkozó koordinátáit az {ay} mátrixj-edik
AA
AA
AA
oszlopába helyeztük el. Ha a X bázis ortonormált, akkor (xk1Áx1)= ~>y (xklx,)= :tayőki t=l
liA
[P,Q] =PQ-QP =-:-1.
azaz
l
Az Ó lineáris operátort korlátosnak mondjuk, ha Vx(:t- O) e V -hez 3 ae IR+, hogy llóxll ~ allxll· A továbbiakban általában feltételezzük, hogy lineáris operátoraink korlátosak. A V vektortéren értelmezett operátorok között müveleteket definiálhatunk (operátoralgebra): (+) : S = Á+ B, ha Sx = Áx +Bx
(Vx e V).
Áx1 = :tayx 1 = :t(x,IÁx1)x1• i=l
i=l
Tekintsük a legfeljebb (n-1)-edfokú polinomokból álló n-dimenziós
(3l): egységoperátor, ha ix =x (Vx e V).
!X= {e,= l,e2 = x,e3
Ö,e1 =0; Ö,e2 =l=e1 ;
(-Á): (-Á)x=-(Áx) (VxeV).
D"e 3 =x=e2 ; A
Tehát a Ö" operátor mátrixreprezentációja a Xbázisra vonatkozóan:
Ál=lÁ=Á; Á(B+C)=ÁB+ÁC;
(ÁÖ) x= Á(Öx) = ÁO= Á(x-x) = Áx-Áx=O;
(ŐÁ) x= Ő(Áx) =O. QED
J=
n".x A
[
Á(BC) = (Á:B)c; Igazoljuk például az első összefüggést:
xn-2
De = - - = e . I D (n- 2)! D·l
ÁÖ=ÖÁ=Ö;
(Á+B)C=ÁC+BC;
=~~, ... ,e.= (:~-~)J
Alkalmazzuk a Ö, operátort sorban a bázisvektorokra:
(o): (aoÁ)x=ao(Áx) (Vxe V,Vae F). Bizonyítható, hogy a V téren értelmezett lineáris operátorok halmaza az előbb definiált müveletekkel vektorteret alkot az F test felett. Az Á és a B lineáris operátorok P = AB szorzata: Px=(AB)x=Á(Bx) (VxeV), azaz az operátorokat egymás után kell végrehajtani. Lássuk be a következő összefüggések érvényességét:
P" teret. Állítsuk elő
a Ö, operátor mátrixát a következő bázisra vonatkozóan:
(30): nulloperátor, ha Öx = O (Vx e V).
o l o o o o l o 0 .0 o l
o o o
0 0 0 0 ... 1
o o o o o o Legyen y= Áx (xe V). Határozzuk meg hogy milyen összefüggés van az x és az y vektorok egy tetszőleges X = {x1 , x 2 , ••• , x.} bázisra vonatkozó reprezentációi között:
A véges dimenziós vektorterek lineáris operátorainak tanulmányozásában az egyík legfontosabb eszköz a mátrix foga~. Az 1-4. fejezetet a mátrixoknak szenteltük, így most a 62
=a~g ,
J=l
63
1 !
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
(x, lx1) =őif ;
x= 'i:a1 x1; j=l
n
n
n
n
n
i:lx,)(x, l.=i.
n
y=Áx=Á:La1 x1 =:La1 Áx1 =:La1 :Layx =:L:La1p 1x Azonban az y vektor is előállítható a z bázis segítségével: y= i:A~· 1
j=l
j=l
j=l
i=l
i=l
1•
Hasonló összefüggések írhatók fel a
1=1 j=l
z'
i:lx;)(x;l=i.
i= l
;=l
Kivonva a két összefüggést egymásból, kapjUk, hogy
Mindkét bázis vektorait előállíthatjuk a másik bázis vektorai segítségéve!:
i:(fJ1 - i:aüa1 )x1 =o. i=l
lx;)=ilx;)=i:lx,)(x,!x;)= i:uif lx,) (uii =(x,!x;));
j=l
i=l
A bázis lineáris függetlenségéből következik, hogy
A kérdéses egyenleteket
1
j=l
...
~.
a2
Pn
ani a2n
aM
an
.
'
- j =l
(x,lx1) =i:(x,lx~)(x~ lx1) =i:uiku;k k=l
a22
a2, = ..
j =l
Most bebizonyítjuk, hogy az U mátrix unitér:
felírh[a~~J- m[á::xf::ában i:•• ][~ J fJ2
z=l
lx,)=ilx )= 'i:!x;)(x;lx,) =i:u1;lx1)= i:u;lx1) .
1
fJ1 = ~>ifa (i= 1,2, ... ,n). }=1
ortonormált bázisra is:
(x; lx;)= őif ;
k=l
=i:(u)ik (ut)Aj =(uut)ij =őii,
... '
k=1
azaz
azaz
=[Á, z] z(x), y=Ax. Tehát a reprezentációkra is az eredeti y = Áx egyenlethez hasonló összefüggés írható fel. z(y)
Most érdemes bevezetni a már korábban említett DIRAC-féle bra-ket formalizmust és az skaláris szorzatot úgy értelmezni, mint két vektor "közönséges" szorzatát, a bra és
(x ly) a ket
(x l
lY)
vektorét:
(x IlY) =(xly).
Az
(x; lx;) =őif
összefüggésből hasonlóan kapható, hogy
Ezek után állapítsuk meg, hogy milyen kapcsolat van az Ó : V ~ V lineáris operátor Z és
z'
ortonormált bázisokra vonatkozó mátrixai között! Ennek érdekében vizsgáljuk meg az Ó
operátor hatását a bázisvektorokra:
ólx )=iólx )=i:lx1)(x1lólx )= i:lx1)01;;
(x l
lx)
j=l
z= {l x1)}
és
z' ={l x;)}
j =1
ólx;) =ió!x;) =i:lx;)(x;ló!x;) =i:lx;)(fy. i=l
Az
o'y
.
az n-dimenziós V vektortér két tetszőleges ortonormált
o;=(x;lólx;)= (x; lióilx;) =i:i:(x;l;xk)(xklólx,)(x,!x;) k=1 1=1
bázisa. A DIRAc-féle jelölésrendszert alkalmazva vizsgáljuk meg, hogy milyen kapcsolat van a két bázis között! Legyen y) e V tetszőleges. Ekkor írhatjuk, hogy
l
=i: i: u: ok, u/j= k=1 1=1
lY)= tlx,)(x,ly) =(tlx,)(x,l)y), azaz 1=1
A
z ortonormált bázisra tehát fennállnak a következő összefüggések: 64
i=l
mátfixelemre írhatjuk, hogy
vektor adjungáltjának tekinthető. Legyen
1
1
1
A bra- és a ket-vektor elnevezések a bra(c)ket angol
szóból származnak. A formalizmus szerint a V vektortér elemei a ket-vektorok és a megfelelő duális tér elemei pedig a bra-vektorok. A RIEsz-tétel értelmében a bra- és a ket-vektorok kölcsönösen egyértelmű megfeleltetésben álb:iak egymással, így ugyanazt a szimbólumot bra-vektor az kethasználhatjuk a ket-vektorra és a neki megfelelő bra-vektorra. Az
utu =i, azaz az U mátrix unitér.
Tehát azt kapjuk, hogy
65
r Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
o'=utou;
Tétel: Az Ö operátor pontosan akkor unitér, ha
O=UO'ut, azaz a két ortononnált bázisra vonatkozó mátrixreprezentációt unitér transzformáció kapcsolja össze. Tételezzük most fel, hogy az Ö lineáris hermitikus operátor ortonormált bázisra vonatkozó hermitikus mátrixa nem diagonális. Az 1-4. fejezetben megmutattuk, hogy egy hermitikus mátrix unitér transzformációval rnindig diagonalizálható. Ennek tükrében az újabb eredményünk azt fejezi ki, hogy bázistranszformáció révén mindig elő tudunk állítani egy olyan új ortonormált bázist, amelyen a kérdéses önadjungált operátor mátrixa diagonális lesz. Ezek után lépésről lépésre bizonyítható, hogy a fentiekben definiált operátoralgebra és a mátrixalgebra izomorfak egymással: például két operátor összegének és szorzatának mátrixaik összege illetve mátrixaik szorzata felel meg. A nulloperátort a nullmátrix, az egységoperátort pedig az egységmátrix reprezentálja. Az izomórfizmus biztosítja, hogy a mátrixokra kapott eredményeink érvényesek lesznek lineáris operátorokra is. Tehát a mátrixokon keresztül a lineáris operátorok nagyon sok tulajdonságát a priori ismetjük: anélkül, hogy azokat a lineáris operátorokra bizonyitottuk volna. Lineáris operátorok és reprezentációjuk, valamint vektorok és reprezentációjuk között azonos kapcsolat van. Ezért nem okoz meglepetést a következő tétel sem.
z
Tétel: A V-n értelmezett lineáris operátorok tere izomorf az öket reprezentáló mátrixok teréveL
llőxll = llxll (V~ E V), azaz unitér operátor nem változtatja meg a vektorok normáját. Az R? tér forgatásai, mint unitér operátorok, valós ortogonális, azaz unitér mátrixokkal reprezentálhatók, Inivel a kérdéses forgatások nem változtatják meg a vektorok hosszát. Az lx) ket-vektorra való P, projekciós operátort a következő összefiiggés értelmezi:
P, lY)= lx)(xly) = (lx)(xl)ly); P, =lx)(x'l, azaz az lY) ket-vektort projektálja az lx) ket-vektor által kifeszített l-dimenziós altérre. Tudjuk, hogy az Á:B szorzat adjungáltjára fennáll a következő összefiiggés: (Á:Bf =BtÁt. Ennek megfelelően P, adjungáltja:
.P; =(jx)(xl)t =((xl)t (lx)f =lx)(xi=P,, azaz P, hermitikus. Legyen z= {l~)} (i =l, 2, ... , n) egy ortonormált vektorrendszere a terünknek Ekkor a
A mátrixokhoz hasonlóan definiáljuk az Ö operátor öt adjungáltját és ö·1 inverzét:
(xlőy)=(ötxly)
l=l
(Vx,yE V);
öö·l =Ő"1 Ő=i. A kérdéses mátrixreprezentációk rendre: [őt ,z]= [Ő,z]f és [ő·I,z] = [Ő,z]"1 • A C" téren
operátor a kérdéses ortonormált rendszer által kifeszített altérre projektáL A P operátor mint hermitikus operátorok összege - maga is hermitikus. Mutassuk meg, hogy a projekciós operátor idempotens is:
P2 = Ilx.)(It l IJxl)(xlJ = IIIx.)(x.Jxl)(xlJ
értelmezhetjük vektorok komplex konjugáltját is. Legyen x = ( a1, a 2 , ••• , a.) E C", ekkor
i=l
• ( * .·J * x = ~ ,a2 , • • • ,a.).
i=l J=l
/ =1
Az Ö operátor ÖT transzponáltját a következő összefiiggés definiálja:
(x*lőTy) = (y*lőx)
(Vx,yE C").
=P.
Ugyanúgy beszélünk szimrnetrikus, antiszimmetrikus, hermitikus, antihermitikus és unitér operátorokról, mint ahogy azt tesszük a rnátrixalgebrában a mátrixokkal kapcsolatban. Az előbbiekben tárgyalt izomorfia miatt a priori tudjuk például, hogy egy hermitikus operátor sajátértékei valós számok és a különbözö sajátértékekhez tartozó sajátvektorok ortogonálisak. Az izomorfia rniatt a következő tételnek is megvan a pontos párja a mátrixalgebrában.
Legyen lY) eleme a
Tétel: Az Ö operátor pontosan akkor unitér, ha
akkor az a
(xjy) = (őxlőy)
(Vx,yE V).
Tehát unitér operátor nem változtatja meg a skaláris szorzatot. Ítjuk fel a tétel mátrixalgebrai megfelelőjét is, és bizonyitsuk mindekettöt! Az előző tétel alapján egy további ekvivalens állítás is megfogalmazható: 66
z halmaz által kifeszített altémek. Ekkor jy) előállítható a következő
alakban: i=l
azaz lY) a
P operátor sajátvektora lesz l sajátértékkeL Ha jy) ortogonális a kérdéses altérre, P operátornak a O sajátértékhez tartozó sajátvektora lesz.
Az előbbiekben már találkoztunk olyan vektorterekkel, melyek elemei egyszerű fiiggvények, polinomok voltak (P, P"). Általánosítsuk ezeket az eseteket és a vektoraink legyenek valós változós komplex-értéleü fiiggvények (J: IR~ C), amelyek az [a,b]-on vannak értelmezve és négyzetesen integrálhatók, azaz az
67
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
smax =L max[f(x)] axi; j
integrál létezik és véges. A kapott teret precízen L2 térnek nevezik, de a fllggvénytér elnevezés is elteijedt A következőkben konstruáljuk meg részleteiben ezt a függvényteret! A függvénytér két,.fi ésf2, függvényének az összegét következőképpen definiáljuk: u;+ J;_) (x)= J; (x)+ J;(x). A skalárral való szorzás értelmezése: (a o J) (x)= aj(x). Egyedül a zártság bizonyítása jelent problémát. Nevezetesen, az előző összeg és a skalárral való szorzat is négyzetesen integrálható? A kérdésre igenlő válasz adható. Itt bizonyítsuk be az összegre vonatkozó zártságot:
lJ..+ Al
2
= 1!.1
2
Smill
=:L min[j(x)] Axi' ,
X1
~X~ X 1 + Ax1•
l
Mivel max[f(x)] =l és min(/(x)] =O az intervallum nagyságától függetlenül, a két közelítő összeg határértéke nem egyezik meg, így a RIEMANN-integrál nem létezik. A kérdéses függvény LEBESGUE-integrálja azonban létezik és zéró. Azt mondjuk, hogy f(x) =O kivéve egy olyan ponthalmazon, amelynek a mértéke zéró. Azt is mondjuk, hogy az f(x) függvény majdnem mindenütt nulla. Azonban az ilyen extrém esetektől eltekintve, a RIEMANN-integrál általában létezik és megegyezik a LEBESGUE-integrállaL Feltesszük azt is, hogy a függvénytér teljes, azaz a függvénytér elemeinek minden CAUCHY-sorozata rendelkezik határértékkel a függvénytérben. Ezt a következő ún. RIEsz-FISCHER-tétel teszi lehetövé.
2
+IAI +J..*h+ J..h* 2 =1!.1 +lAt +2Re(J..*J;) 2 2 2 2 ~ 1!.1 +IAI +2If..*AI =1!.1 +IAI +2IJ..IIAI·
Tétel: Legyenek J;(x),J;(x), ... függvényekegy függvénytér elemei. Ha
2!~JJ.- fmll
2
b
= .~~~ ]J.(x)- fm(x)l dx=O, 2
a
akkor létezik egy olyan négyzetesen integrálható függvény, amihez az {/.} sorozat konvergál, azaz
Továbbá
b
!~ JIJ(x)- f.(x)i dx=O.
azaz 2
1!.1 +IAI
2 ;::
2IJ..IIAI·
a
Figyelembe véve ezt az egyenlőtlenséget a fenti egyenlőtlenségben, kapjuk, hogy 2
lJ..+ Al ~ 2IJ..I +2 ifJ. látható, hogy Ji és h négyzetes 2
Integrálva mindkét oldalt, integrálhatósága biztosítja az összegük négyzetes integrálhatóságát is. Ezek után definiálhatjuk a függvények skaláris szorzatát is: b
(J.. ih)= JJ..*(x)J;(x)dx. a
A négyzetés integrálhatóság biztosítja, hogy a függvények normája létezik és véges: b
2
(J lJ) = 11!11
=
f ifi cb: < 2
(A tétel bizonyítását illetően lásd például: Walter Rudin: A matematikai analízis alapjai, Könyvkiadó, Budapest, 1978.) Az így előállított végtelen dimenziós, teljes, skaláris szorzatos függvényteret Hilbert-térnek nevezzük. Az 1920-as években NEUMANN János volt az, aki felismerte, hogy a kvantummechanika két párhuzamosan létrejött megfogalmazása (a mátrixmechanika és a hullámmechanika) egységesíthető az absztrakt HILBERT-tér bevezetéséveL A Hll..BERT-tér axiómáit NEUMANN János az "Allgemeine Eigenwerttheorie Herrnitescher Funkcionaloperatoren", Math. Annalen l 02, 49-131 (1929) című cikkében publikálta. A függvénytér függvényeinek {h} halmazát ortonormáltnak mondjuk, ha Műszaki
oo.
b
(J.Ifm)= jJ.*(x)fm(x)dx=omn.
a
Két négyzetesen integrálható függvény skaláris szorzata is létezik:
IJ..*AI=IftiiAI ~~(IJ..I +lAn; 2
~J..*hl dx ~ ~(11!.11 +llhll 2
a
Bizonyítsuk be, hogy az f.(x) = e1nx j J2i (n e Z) FOURIER-féle függvények halmaza ortonormált a [
-1r, 1r] intervallumon:
2
(!.l fm) = j J.* fm cb:= ;1r j ei(m-n)x dx
).
a
Meg kell azonban említeni, hogy a szokásos RIEMANN-integrál (Bernhard RIEMANN, 18611866) helyett LEBESGUE-integrált (Henri LEBESGUE, 1875-1941) kell alkalmazni. A RIEMANN-integrál ugyanis nem mindig létezik. Legyen pl. f(x) függvényünk a következő: a [0,1] intervallumba eső racionális számokon vegye fel az l értéket, az irracionálisokon pedig legyen nulla. Tudjuk, hogy a [0,1] intervallumban sokkal kevesebb racionális szám van, mint irracionális. A kérdéses függvény RIEMANN-integráljának alsó és felső közelítő összegei: 68
2
-r
=[
-tr
l
27r(m-n)i l
é·]"_,. =O, ham ;t n; It
(J.Ifm)=- Jlcb:=l, ha(m=n). 21f -It
Tehát
(J.Ifm) =onm. QED 69
T asi Gyula: Matematikai kémia
T asi Gyula: Matematikai kémia
smax =L max[tJ Ax;; integrál létezik és véges. A kapott teret precízen L2 térnek nevezik, de a függvénytér elnevezés is elterjedt. A következökben konstruáljuk meg részleteiben ezt a függvényteret l A függvénytér két,Jj és h, függvényének az összegét következöképpen definiáljuk: u;+ f.J (x)= J;(x)+ h(x). A skalárral való szorzás értelmezése: (a of) (x)= af(x). Egyedül a zártság bizonyítása jelent problémát. Nevezetesen, az előző összeg és a skalárral való szorzat is négyzetesen integrálható? A kérdésre igenlő válasz adható. Itt bizonyítsuk be az összegre vonatkozó zártságot: l.t; +h 1=l.t; 1+Ih 1+.~;·h +.t;h· 2
2
2
2
2
2
2
smin .~L min[f(x)] Ax;.
:s; x :s; X; + Ax;.
X;
Mivel max[f(x)] =l és min[f(x)] =O az intervallum nagyságától függetlenül, a két közelítö összeg határértéke nem egyezik meg, így a RIEMANN-integrál nem létezik. A kérdéses függvény LEBESGUE-integrálja azonban létezik és zéró. Azt mondjuk, hogy f(x) =O kivéve egy olyan ponthalmazon, amelynek a mértéke zéró. Azt is mondjuk, hogy az J(x) függvény majdnem mindenütt nulla. Azonban az ilyen extrém es~tektől eltekintve, a RIEMANN-integrál általában létezik és megegyezik a LEBESGUE-integrállal. Feltesszük azt is, hogy a függvénytér teljes, azaz a függvénytér elemeinek minden CAUCHY-sorozata rendelkezik határértékkel a függvénytérben. Ezt a következő ún. RIEsz-FISCHER-tétel teszi lehetövé. Tétel: Legyenek J;(x),h(x), ... függvényekegy függvénytér elemei. Ha
= l.t; 1 +Ih 1 + 2 Re(.t;•h)
:s; l.t;l +lhl +2
'
b
.~J!.- f.J = -~- ~f. (x)- /.,(x)l
IKhl= l.t;l +lh l + 2l.t;llh l· 2
2
Továbbá
2
dx =O,
a
akkor létezik egy olyan négyzetesen integrálható függvény, amihez az {/.} sorozat konvergál, azaz b
azaz l.t;l +lhl ~ 2l.t;llhl· Figyelembe véve ezt az egyenlötlenséget a fenti egyenlötlenségben, kapjuk, hogy 2
!~ fiJ(x)- f.(x) l dx=O.
2
2
2
2
l.t;+ hl :s; 2l.t;l + 2lhl • Integrálva mindkét oldalt, látható, hogy Jj és h négyzetes integrálhatósága biztosítja az összegük négyzetes integrálhatóságát is. Ezek után definiálhatjuk a függvények skaláris szorzatát is: b
(.t; Ih)= J .t;• (x)h(x )dx. A négyzetés integrálhatóság biztosítja, hogy a függvények nocmája létezik és véges: b
(fl/) =11111 = f1!1 2
2
dx < 00"
(1\ tétel bizonyitását
illetően
lásd például: Walter Rudin: A matematikai analízis alapjai, Budapest, 1978.) Az igy előállitott végtelen dimenziós, teljes, skaláris szorzatos függvényteret Hilbert-térnek nevezzük. Az 1920-as években NEUMANN János volt az, aki felismerte, hogy a kvantummechanika két párhuzamosan létrejött megfogalmazása (a mátfixmechanika és a hullámmechanika) egységesíthető az .iibsztrakt HILBERT-tér bevezetéséveL A HILBERT-tér axiómáit NEUMANN János az "Allgem~ine Eigenwerttheorie Herrnitescher Funkcionaloperatoren", Math. Annalen l 02, 49-131 (1929) című cikkében publikálta. A függvénytér függvényeinek {ft} halmazát ortonormáltnak mondjuk, ha MűszakiKönyvkiadó,
.
~(l.t;l
].~;·h 1dx :s; ~(ll.t; 11
2
2
+ll h
+Ih
n;
1n.
a
Meg kell azonban említeni, hogy a szokásos RIEMANN-integrál (Bernhard RIEMANN, 18611866) helyett LEBESGUE-integrált (Henri LEBESGUE, 1875-1941) kell alkalmazni. A RIEMANN-integrál ugyanis nem mindig létezik. Legyen pl. f (x) függvényünk a következő: a [O, l] intervallumba eső racionális számokon vegye fel az l értéket, az irracionálisokon pedig legyen nulla. Tudjuk, hogy a [0,1] intervallumban sokkal kevesebb racionális szám van, mint irracionális. A kérdéses függvény RIEMANN-integráljának alsó és felső közelitö összegei:
68
b '
(J.IJ.,)= fJ.*(x)fm(x)dx=8mn·
Két négyzetesen integrálható függvény skaláris szorzata is létezik: 1.t;·h1 = l.t;llhl :s;
2
Bizonyítsuk be, hogy az f. (x) = e1"" normált a [- 1r,1r] intervallumon:
(J. lJ.. ) =
/J2i (;ze Z )
j J.* fm dx =2~ j - tr
=[
FOURIER-féle függvények halmaza orto-
ei(m- n)x
dx
- It
l 2~r(m-n)i
l
el(m-n)x]" =o, ham# n; - tr tr
(f. IJ.. ) = - Jldx= l, 21r -1
. :;t -i>,,
i
(.t;Cx)lill,h(x))=
J.t;'(x)idf~x) d\:=[.t;'(x)i/ (x)J:- Jdf~x) ih(x)d\: 2
a
' =
2
(x)d\:=(zn•.t;(x)lh(x)).
Hasonlóan látható be, hogy a -zD, operátor is hermitikus. Ezek után könnyen tudjuk igazolni a
i>! operátor hermitikusságát: (.t;Cx)li>!h(x)J= (.t;(x)l(zn, ){ -zD, )h(x)) = ((zn. ).t; (x
2
Hermitikus operái~rok összege is hermitkus. Vegyük pl. az F.l-3. filggelékben bemutatott LAPLACE-operátort ' 2 '2 '2 d = D, +DY +D., ahol most a hagyományos deriválás helyett parciális denválást értünk:
' +Dy +D. (J;(x,y,z) ldh(x,y,z))= (J; l(D, 2
'2
' 2)
l
'2 ' 2 '2 ) h ) = ( J; D./ 2 +Dyh +D.h
=(.t; li>!h ) +(.t; l»;h)+ (.t; li>!h) =(i>!.t;l h )+(»;.t;lh)+(i>!.t;l h )
l)
' 2 +Dy ' 2 +D. ' 2) J; h = (( D,
=(d.t;lh). Most pedig vizsgáljuk meg az
X skalárral való szorzási operátort:
i
Az Ö hermitikus operátornak a sajátértékeivel és a sajátvektoraival való ilyen felírását az Ö operátor spektrális felbontásának (Eng. spectral reso/ution) nevezzük. A továbbiakban olyan 70
>j(-zD, )! (x))
= (( -zD, )(if>, ).t;(x)l(h(x))) = (i>!.t;(x)lh(x) ).
=(~~~tpi)(lJ'i i)lvr), ó= :L~IlJ';)(tpJ
a
K;df~x) )' j
=;o(~llJ';)(lJ'; i)lvr)
azaz
2 (x)d\:=(-D,ft(x)lh(x)).
ezért az operátor nem hermitikus. Megmutatható azonban, hogy az iD,
Tekintsük most az Ó operátor hatását a tér egy tetszőleges 1'1') elemére:
ó lvr)= óilvr)
df~x))' /
operátor hermitikus:
i
i= LllJ'~)(lJ';I·
a
=R-
:LI.t;)(.t; l= i,
ortonormált halmazt. Ekkor írhaljuk, hogy
df~x) d\:= [~'(x)h(x)J:- Jdf~x) h(x)d\:
a
Mivel az összefilggés a HILBERT-tér minden elemére fennáll, ezért
azaz az egységoperátor felbontását (Eng. reso/ution of identity) kaptuk. Ezzel az összefilggéssel is kifejezheljük azt, hogy az {.t;(x)} halmaz a filggvénytér egy teljes ortonormált halmaza. Ezek után csak az a kérdés merül fel, hogy hogyan tudunk találni egy teljes ortonormált rendszert a HILBERT-téren. Érdekes módon nagyon sok szerző feltételezi, általában.bizonyítás nélkül, hogy a kvantummechanikában előforduló hermitikus operátorok sajátfilggvényei teljes ortonormált rendszert alkotnak. Egy véges dimenziós vektortér esetén ez az állítás mindig igaz. V égtelen dimenziós esetben azonban nem: a válasz filgg a hermitikus operátor pontos természetétől és magától a vektortértőL A HILBERT-tér fogalmának a kiterjesztésével azonban ezek a problémás esetek is megoldhatók. Legyen Ó egy hermitikus operátor, melynek ltp1) sajátvektorai alkossanak egy teljes
('VJ;,h E V).
71
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia b
(Nx) lXJ; (x))= (J; (x)jx J;(x)) = J.t;• (x)x J; (x)dx b
=
r
a
J( x·J; (x) .t; (x) dx = (x·J; (x) l.t; (x)).
a
Látható, hogy csak x= x· esetén lesz a skalárral való szorzási operátor hermitikus:
(.t; (x)l XJ;(x)) =(x .t; (x) l.t; (x)). Tehát, ha x E R., akkor X hermitikus, x E IC" x E R. esetén azonban nem. A későbbiekben látni fogjuk, hogy az itt bemutatott példák fontosak a fizikai mennyiségeket reprezentáló operátorok előállítása szempontjábóL
72
1-6. Molekulák sztatikus és dinamikus szimmetriája Molekulák szimmetriájának leírására többfajta csoportot alkalmazhatunk. A molekuláris pontcsoport és a molekuláris vázcsoport használata esetén a molekulát - a BoRNÜPPENHEIMER-féle közelítésnek megfelelően - atommagokból álló merev struktúrának tekintjük. Az atommagokat - a potenciális energia-hiperfelület (Eng. potenfial energy surface, PES) egy lokális minimumának megfelelő - egyensúlyi helyzetükben fixáljuk (egyensúlyi molekulageometria, Eng. equilibrium molecular geometry). Ez azt jelentil hogy eltekintünk az atommagoknak a O Kelvin hőmérsékleten is meglevő rezgőmozgásátóL Ebből a rezgőmozgásból származó energiát nevezzük egyébként a molekula zéruspont rezgési energiájának (Eng. ZPVE zero point vibrationaÍ energy). Ha az atommagok az egyensúlyi helyzetük körül kis amplitúdóval rezegnek, akkor jó közelítéssel az egyensúlyi helyzetet tekinthetjük az atommagok tartózkodási helyének. A molekuláris pontcsoport elemei forgatások és tükrözések. Összehasonlítva például az alapállapotú metánmolekula egyensúlyi magkonfigurációját és a mak:roszkópikus tetraéder testet, megállapíthatjuk, hogy mindkét objektum ugyanazzal a geometriai szimmetriával rendelkezik. A molekuláris pontcsoport segítségével osztályozhatók az egyensúlyi konfigurációhoz tartozó rezgési és elektronenergiaszintek. ·Azonban ugyanazon molekula különböző magkonfigurációi közötti átmeneteket nem tudjuk leírni, azaz a pontcsoport csak sztatikus szimmetria kezelésére alkalmas. A kérdéses bsoport hasznos például az alaprezgések infravörös és Ramanaktivitásának a megértésében. A molekuláris szimmetriacsoport elemei az azonos magok permutációi az inverzióval együtt és anélkül. Ez a csoport nem igényel egy egyértelmű molekulageometriát (dinamikus szimmetria). A molekuláris szimmetriacsoportot, a molekuláris pontcsoporttal szemben, alkalmazhatjuk flexibilis molekulák tanulmányozására és olyan elektronátmenetek leírására, melyeknél a magkonfiguráció változik. Az előzöek bemutatására igen jó példát szolgáltatnak az NH3 és az NF 3 molekulák. Mindkét molekula-·egyensúlyi magkonfigurációja a C1v pontcsoporthoz tartozik. 1Az ammóniamolekula esetén azonban az egyik molekularezgés (Uz) olyan nagy amplitúdóval rendelkezik, hogy inverziós mozgás játszódik le. A mozgás átmeneti állapotában a molekula magkonfigurációja planáris (DJh). Az inverziós mozgás következtében az infravörös spektrumban egy sáv dublettként jelentkezik (inverziós dublett). Az NH3 molekula alapállapotú potenciális energiafelületén szimmetrikusan elhelyezkedő két lokális minimumot viszonylag alacsony inverziós energiagát ("" 2000 cm-1) választja el egymástól. A kérdéses molekularezgés olyan nagy amplitúdójú, hogy a molekula az egyik minimumból a másikba juthat. Ennek következtében a két állapothoz tartozó rezgési energiaszintek nem függetlenek egymástól: keverednek egymással, majd felhasadnak. Minden rezgési energiaszint így két szintre hasad fel. Az NF3 molekula esetén az inverziós energiagát olyan nagy, hogy szinte nincs lehetőség a felhasadás kísérleti megfigyelésére. A két lokális minimum gyakorlatilag független egymástól. Ennek következtében a kérdéses molekula merevnek tekinthető.
=
73
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1-6.1. Molekuláris pontcsoportok és vázcsoportok
szöget (d= diéderes). Nyilvánvaló, hogy egy molekula kétszeri tükrözése ugyanarra a síkra az identitás transzformáció: lfl =E.
A szimmetriák egyik típusa a térbeli szimmetria. Egy test szimmetrikus, ha meghatározott szimmetriamüveletek (geometriai transzformációk) a testet önmagába viszik át. Minden lehetséges geometriai transzformáció három elemi transzformáció kombinációjaként állítható elő. Ezek a következők: a test meghatározott szögü forgatása valamilyen tengely körül, valamilyen síkra való tükrözés és a testnek valamilyen távolságra való párhuzamos eltolása (transzláció). Ez utóbbi csak végtelen kiterjedésü test (pl. kristályrács) esetén jöhet szóba. Véges kiterjedésü test csak forgatással és tükrözéssei szemben lehet szimmetrikus. A BoRN-ÜPPENHEIMER-közelítés keretén belül a molekulák transzláció, vibráció és rotáció szempontjából jól modellezhetők atommagjaik együttesével, mint egy klasszikus tömegpontrendszerreL Defmíció: Egy molekula sztatikus szimmetriája alatt egyensúlyi magkonfigurációjának a szimmetriáját értjük a molekula alapállapotában. A molekula egyensúlyi magkonfigurációja a molekula szimmetriaműveleteivel szemben invariáns, azaz a transzformáció előtti konfiguráció az utánitól fizikailag megkülönböztethetetlen. Azokat a geometriai elemeket, amelyekkel kapcsolatban a szimmetriaműveleteket végrehajtjuk, szimmetriaelemeknek nevezzük. Szimmetriavizsgálatokhoz a molekula tömegközéppontjában felvett, jobbsodrású ún. molekuláris koordinátarendszert alkalmazunk (F.l-3. függelék). A legideálisabb, ha a tengelyeket ilitengelytranszformáció révén határozzuk rrieg. (Lásd az 1-6.3. fejezetet!) A szimmetriaműveletek öt típusát fogjuk a továbbiakban megkülönböztetni: (l) Azonossági transzformáció (E, e, Eng. identi/y transformation): a változatlanul hagyja;
magelrendeződést
(2) Forgatás (Eng. rotation) (Cn): a molekulát valamilyen tengely körül 2n/n szöggel elforgatja (n= 1,2, ,..). Ha Cn a kiindulásitól fizikailag megkülönböztethetetlen konfigurációt hoz létre, akkor azt mondjuk, hogy a molekulának n-forgású (n-fogású) szimmetriatengelye vagy n-edrendű valódi forgástengelye (Eng. n-fold proper rotation axis) van. Egy adott tengely körüli forgatáskor az irány legyen mindig konzekvens, azaz vagy az óramutató járásának megfelelő, vagy azzal ellentétes. Nyilvánvaló, hogy C1 =E (21t vagy O szögü forgatás). Ha Cn-t kétszer, háromszor, ... , k-szor megismételjük: 2(2n/n), 3(2n/n), ... , k(2n/n), ismét szimmetriaműveletet kapunk: c;, C~, ... , Ha n többszöröse k-nak: c.,* és =E. Az ellentétes irányban való k(2n/n) szögü forgatás c:-k-nak felel meg. Jelöljük ezt c~* -val. = c~Am,A") az rBA vektor {l,m,n} bázisra vonatkozó koordinátái. Mivel rA= r8 + rsA•
ezért az A atom (A. ,AY,A. ) pozícióját könnyen megkaphatjuk az {i, j,k} bázisra vonatkozóan: 94
A,{:;} A,{:J
Ezzel megkaptuk az atomi DESCARTES-koordinátákat! A számításokat azonban érdemes számítógépre bízni.
z.][~)J .
m. n.
:J
A,{
95
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1-6.3. A szimmetria megnyilvánulása molekuláris tulajdonságokban
A molekulák geometriájának leírásához általában két DESCARTES-féle koordinátarendszert szokás felvenni. Az első ún. laboratóriumi koordinátarendszerünket, (X,Y,Z), a térben rögzítjük, a második ún. molekuláris koordinátarendszerünket, (x,y,z), pedig a molekula tömegközéppontjában vesszük fel, s mindkét koordinátarendszer jobbsodrású (lásd az F.l-3. filggeléket). A laboratóriumi koordinátarendszerben a molekula tömegközéppontjának (Eng. center of mass, cm) koordinátái:
Az állandó elektromos molekuláris dipólusmomentum, Ji=. (flx,fly,f.lz), az egyik leggyakrabban tanulmányozott és alkalmazott fizikai mennyiség: alapvető információt szolgáltat a molekula szerkezetéről és polaritásáróL A mindennapi gyakorlatban általában skaláris értékeket használunk tudva azonban, hogy a dipólusmomentum vektormennyiség. Definíció szerint a dipólusmomentum vektor iránya olyan, hogy a pozitív töltéseloszlás centrumából mutat a negatív töltéseloszlás centruma felé. A gyakorlatban használt skaláris érték a dipólusmomentum vektor hossza (normája): IIJill =.(Ji • Ji-)'12 (/1; +fl~+ p;)'12 • Egy igen fontos tulajdonsága a dipólusmomentumnak, hogy érzékenyen filgg a molekula geometriájától (konformációjától). Végeredményben ez a filggés nyilvánul meg az infravörös spektrumban megfigyelhető abszorpciós sávok intenzitásában is. Ezek alapján nem meglepö, hogy a különbözö szemiempírikus kvantumkémiai módszerek paraméterezésekor is figyelembe vették a paraméterezéshez használt molekulák kisérleti dipólusmomentumát, mint azok alapvető fizikai tulajdonságát. Hasonló módon a különbözö módon számított molekuláris ponttöltésrendszerek jóságának az ellenőrzésekor is az egyik legfontosabb teszt az, hogy a ponttöltésrendszer dipólusmomentuma milyen mértékben egyezik a kvantumkémiailag számított vagy a kisérleti dipólusmomentummaL Azt a töltésrendszert, aminek a dipólusmomentuma jelentösen különbözik, el kell vetni Azonban azt sem szabad elfelejteni, hogy ugyanazt a dipólusmomentumot több, egymástól jelentösen különbözö töltésrendszer is visszaadhatja, így egy molekuláris ponttöltésrendszer jóságának csak szükséges feltétele a kisérleti dipólusmomentum visszaadása. A dipólusmomentum létezése és a dipólusmomentum-vektor elhelyezkedése is a molekuláris szimmetriától filgg. Mivel egy szimmetriaművelet végrehajtása után olyan konfigurációhoz jutunk, amely fizikailag megkülönböztethetetlen a kiindulásitól, ezért a dipólusmomentum-vektor iránya sem változhat meg. Ennek megfelelöen, ha a molekula egy Cn tengellyel rendelkezik, akkor a dipólusmomentum-vektor ezen a forgástengelyen fekszik. Ha a molekulának több, nem egybeeső szimmetriatengelye van, akkor a molekula nem rendelkezhet dipólusmomentummal, mivel a kérdéses vektor nem helyezkedhet el egyidejűleg több tengely mentén. Tekintsük pl. a benzolmolekulát! A molekula egy C6 tengellyel és 6 darab C2 tengellyel rendelkezik. Az utóbbiak merölegesek á C6 tengelyre. Ennek megfelelöen a molekula dipólusmomentuma zérus. Ha a molekula egy szimmetriasíkkal rendelkezik, akkor a dipólusmomentum-vektor ebben a síkban ·fekszik. Ha több szimmetriasík van, akkor a vektor a síkok metszésvonalában helyezkedik el. Ha a molekula egyensúlyi konfigurációjának szirnmetriacentruma van, akkor nincs dipólusmomentuma, mivel az inverzió tetszöleges (xi,yi,z;) vektor irányát megfordítja (-xi'-yi,-z;) . Feltételezve, hogy a szimmetriacentrum az origó.
=.
Merev molekulák valamilyen tengely körüli forgó mozgását első közelítésben úgy írhatjuk le, hogy az egyensúlyi konfigurációnak megfelelöen rögzítjük az atommagokat, s feltételezzük, hogy az atommagok közötti távolság nem változik meg a forgó mozgás folyamán. Ez a közelités ekvivalens a klasszikus mechanikából jól ismert "merev test forgó mozgása egy rögzített tengely körül" problémával. 96
x - _,i" "'"_ cm --~
L.,;mi
'
r.;..
=.+--· L.,;mi
t . Z cm --~ · L...mt
i
ahol m; az i"ik atom tömege és X;, Yi. Z; pedig az i-ik atommag helyzetét a laboratóriumi koordinátarendszerben megadó helyvektor komponensei. A molekuláris koordinátarendszerünk tengelyei először legyenek párhuzamosak • a laboratóriumi koordinátarendszerünk tengelyeiveL Az i-ik atommag koordinátáit a molekuláris koordinátarendszerben következöképpen fejezhetjük ki: · xi:. Xi -Xcm• yi:. Y; -Y.;... zi= Zi -Z=. A tömegközépponton átmenő, rögzített tengely körül forgó merev molekula i-ik atommagjának a sebessége: ahol ID a kérdéses tengely körüli forgó mozgás szögsebessége. (Az ID vektormennyiség: ID = ID(cox,COy,COz), iránya a forgástengely iránya úgy, hogy irányába nézve a forgás az óramutató járásának megfelelő értelmű.) Az r 1 = r;(x1,y1,z1) a tömegközéppontból az i-ik atommaghoz húzott helyvektor. A viszonyok a következő ábrán tekinthetök meg:
lf~t.t~
· ··.,:t~~imt~
!J··
Ennek megfelelöen a forgó mozgás kinetikus energiája: ~ot=! L:m;(ID x rl)2. Hajtsuk végre a kinetikus energia kifejezésében a vektoriális szorzást, kapjuk, hogy Trot L:mi[(wyzi -W.Y1i +(W,X1 -aJxzY +(WxYt -aJYxY J.
=t
Végrehajtva a kijelölt műveleteket, és a szögsebességvektor komponenseit a szummákból kiemelve, a következő összefilggést nyerjük:
97
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
21',.0 , =a{Lmi(l +z?)~Lmi(x; +z;)+o{Lmi(x; +l)
2
la>= l xx fil + IYY/3 + Izzf +21yz fJy+21"py+21ryafJ.
i
Az I tehetetlenségi tenzor valós és szimmetrikus mátrix, így ortogonális transzformációval diagonalizálható, s a sajátértékek valós számok: ' IV:::!V A; A=Diag(IJ; yT IV =A.
-2tVytVz L miyizi -2w. w, L mixizi -2tVxtVy L mixiyi. .
i
i
Vezessük be a következő jelöléseket: I :a= Lmi(l+z;);
Izz= Lmi(x?+y?); i
Az l={ly} {ij=x,y,z) mátrix által reprezentált fizikai mennyiséget a molekula tehetetlenségi tenzorának (Eng. inertia tensor) nevezzük:
Jrx
l= Iry
(Ixz
Jyx IYY
Jzxl
I yz
Izz
J=ltV.
A diagonálisban álló lxx, lyy. Izz mennyiségek rendre az x,y,z tengelyekre vonatkozó tehetetlenségi momentumok, az off-diagonális elemek pedig a deviációs momentumok. Látható, hogy a tehetetlenségi momentumok pozitív mennyiségek, a deviációs momentum azonban lehet pozitív, negatív vagy zérus. A tehetetlenségi tenzor elemeinek a segítségével a kinetikus energia kifejezése: 21',.01 =o{la+ a{,IYY + o{/zz 2tVYtVJyz 2tv. tvJxz 2tV,tV/ry· A kinetikus energiára vonatkozó összefüggésünket másik formában is felírhatjuk Ehhez a következőket kell figyelembe vennünk:
+
+
2
(ro x r;) =ll ro x r , li ro x r. li= li ro illi r. li sin et =li ro li Pt, 2
1 11
ahol B; az r 1 helyvektor és a forgástengely által bezárt szög, s pi az m; tömegpontnak a forgástengelytől mért távolsága. Tehát a következő összefüggést nyerjük: 2 2 2 1',.01 =t =t IQ}roZ, 1(ID x r.) =tro
Lm
Lm;P; i
ahol / 00 a forgástengelyre vonatkozó tehetetlenségi momentum. Az I ro könnyen kifejezhető az x,y,z tengelyekre vonatkozó tehetetlenségi momentumok és a deviációs momentumok segítségéveL A kinetikus energiára vonatkozó összefi1ggéseink alapján:
I
Q}
(;{roS +(;(rollJ +(;(rollJ
=
I :a
I yy
Izz
+2 ( /(roll)(;(roll}yz + 2 ( ;(roll)(;(roll}xz +2 ( ;{roll)(/(roll}ry· Ha a forgástengelyiránykoszinuszai (a, [J, y), akkor
}(roll= a; /(roll= fJ; j{roll=r. hiszen a forgástengely és a szögsebességvektor iránya azonos. Végül is a függést kapjuk: 98
tu.m;
T,.o, = +Ib ol;+ IJ1{). A forgó mozgás J impulzusmomentum-vektora:
Iry ..
+
A kérdéses ortogonális transzformáció (fótengelytranszformáció) az (x,y,z) koordinátarendszert olyan (x',y',z') koordinátarendszerbe forgatja (bázistranszformáció), melynél a deviációs momentumok eltűnnek. Az x' ,y' ,z' tengelyeket fótehetetlenségi tengelyeknek (Eng. principal axes), s a sajátértékeket pedig főtehetetlenségi momentumoknak (Eng. principal momenta ofinertia) nevezzük. A spektroszkópiáb~ a ilitehetetlenségi tengelyeket a, b és c; a fótehetetlenségi momentumokat pedig la, h és Ic módon jelöljük, s I. :5: Ib :5: Je a sorrend. A fótengelyrendszerben a kinetikus energia egyszerű alakot ölt:
következő
össze-
Az impulzusmomentum-vektor segítségével a jezése: T =
rot
főtengelyrendszerben
a kinetikus energia kife-
.1(J;/Jal+ J;/Jbl+ J;/Je1) • 2
Könnyen belátható, hogy egyik fótehetetlenségi momentum sem lehet nagyobb a másik kettő összegénél: pl. 2 I. +lb= L(a; +bi ~ L(a; +b[ ) =Ic.
+2c?)
i
j
A főtehetetlenségi momentumok alapján a molekulákat a következő csoportokba sorolhatjuk: l. Aszimmetrikus pörgettyű (Eng. asymmetric top) esetén a sajátértékek nem degeneráltak: la :f. h :f. Ic. A molekulák legnagyobb része ebbe a csoportba tartozik. 2. Szimmetrikus pörgettyű (symmetric top) esetén az egyik sajátérték kétszeresen degenerált. További két eset;-. lehetséges: (i) ha la < Ib = Ic, akkor prolát (nyújtott) szimmetrikus pörgettyűről és (ii) ha la = Ib z~> x2 ,y2 , z 2 ,x3 , y 3, z3 ] =[X:,y;,z;,x;, y;,z;, x~,y~,z~] = [x3, y3,z3, X2, Yz,Zv x;, Y1 ,zi].
Az S1 csoport szorzási táblázatát az 1-2. fejezetben elkészítettük és megállapitottuk:, hogy a kérdéses csoport a következő valódi részcsoportokkal rendelkezik: {E,(l,2)}, {E,(l,3)}, {E,(2,3)}, {E,(1,2,3),(1,3,2)} . Az S~Hl csoportot a CH3F molekula teljes magpermutációs csoportjának (Eng. Complete Nuclear Permutation (CNP) Group) nevezzük: GCNP =S~H) .
Tekintsük következő példaként az etilénmolekulát! A molekula két szénatomot és négy hidrogénatomot tartalmaz. A szénatomok permutációi egy másodfokú, Sfl, a hidrogénatomoké egy negyedfokú, st>, permutáció& csoportot alkotnak. Az etilén teljes magpermutációs csoportja a két csoport direkt szorzata lesz, hiszen a különböző atomokra vonatkozó permutációk egymástól függetlenek: G cNP = sf> ® syo.
GcNP
=SI ®Sm .®S• ...
Tehát a CNP csoport felírásához egyedül az összetételt kell ismernünk. Vegyük egy egyszeru példaként a CH2FCOOH molekulát! A molekula CNP csoportja a következő: GcNP
= s~n> ® s~o> ® sf>.
Jelölje l, 2, és 3 a hidrogénatomokat, 4 és 5 az oxigénatomokat és 6 és 7 a szénatomokat. Ekkor a kérdéses direkt szorzatcsoport: ' G CNP ={E,(1,2),(2,3),(1,3),(1,2,3),(1,3,2)} ® {E,(4,5)} ® {E,(6, 7)} . A csoport összesen 3! *2! *2!= 24 elemet tartalmaz. Soroljuk fel az összes csoportelemett GCNP ={E,(l ,2),{2,3),(1 ,3),(1 ,2,3),( l ,3,2),(4,5),(1 ,2)(4,5),
x
(2,3)(4,5),( l ,3 4,5),(1 ,2,3)(4,5),( l ,3,2)(4,5), (6, 7),(1 ,2)(6,7),(2,3)(6,7);(1,3)(6,7),(1 ,2,3)(6,7), (1;3,2)(6,7),(4,5)(6,7),(1,2)(4,5)(6,7),(2,3)(4,5)(6,7),
(l ,3)(4,5)(6,7),(1,2,3)(4,5)(6,7),(1 ,3,2X4,5)(6,7)}. Az azonos magok koordinátáinak permutációja mellett a molekulát alkotó részecskék (atommagok és elektronpk) térbeli koordinátáinak az inverzióját is végrehajthatjuk a térben rögzitett koordinátarendszerünk origójára vonatkozóan. A transzlációs mozgás leválasztása érdekében a ·koordinátarendszerünk kezdőpontját helyezzük a mblekula tömegközéppontjába, s a koordinátatengelyek legyenek párhuzamosak a térben rögzített koordinátarendszerünk tengelyeiveL Így az inverziÓ művelete (I•) a magok és az elektronok koordinátáit a tömegközéppontra tükrözi: I"[x1,y1,z;] =[x;,y;,z;] = [-x1,-y1,-z1]. inverzió műveletet szigorúari meg kell különböztetni az 1-5.1. fejezet-
A most értelmezett I" ben tárgyalt i köz~ppontos tükrözéstőL Ugyanis míg az I" müvelet minden molekulára vonatkozik, addig az i csak azokra, · melyek középpanti szimmetdacentrummal rendelkeznek. A következő ábrán tanulmányozhatjuk az (1,2) permutáció ·hatását a CH3F molekulára az I" művelet végrehajtása után, majd fordított sorrendben:
A kérdéses csoport 2! * 4! = 48 elemet tartalmaz. Érdemes megemlíteni, hogy az etilénmolekula egyensúlyi magkonfigurációjának megfelelő D 2h pontcsoport ezzel szemben csak 8 elemet tartalmaz!
104
105
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
tett rezgési állapotban azonban elképzelhető az inverziós· mozgásból fakadó felhasadások megfigyelése, Ekkor MS csoportként a teljes CNPI csoportot kell alkalmaznunk Egy molek:ula MS csoportját tehát a CNPI csoportjából úgy kapjuk meg, hogy a felesleges elemeket elhagyjuk. Egy elem akkor tekinthető feleslegesnek, ha a molekula különböző számozású egyensúlyi konfigurációit átviszi egymásba holott azokat leküzdhetetlen nagyságú energiagát választj a el. Végül konstruáljuk meg a NF3 és az NH3 molek:ulák alapállapotú MS csoportját! A NF3 molek:ula CNPI csoportja: · GCNPI
=SjPl®{E,/*} = {E,(t,z),(2,3),(1,3),(1,z,3),(1,3,z),r
:o.
zr ,(z.~r ,(t,3r ,(t,z,3r ,(1,3,2)*}.
A NF3 molek:ula rezgési-rotációs spektrumában inverziós dubiettek nem figyelhetők meg, így
GMS
={E,(1,2,3),(1,3,2),(1,2r ,(2,3r ,(1,3)*} .
Az NH3 molek:ula esetén az inverziós mozgás hatásai megfigyelhetők a rezgési-rotációs spektrumban, így a molek:ula MS csoportja a CNPI csoporttal lesz azonos. Elemeket nem hagyhatunk el ebben az esetben a CNPI csoportból, mivel az inverziós mozgás következtében a két ekvivalens konfiguráció között átmenet lehetséges.
Látható, hogy ugyanazon végállapothoz jutunk, azaz lényegtelen, hogy az (1,2) permutáció végrehajtása előtt vagy utána változtatjuk meg a koordináták előjelét, azaz alkalmazzuk az I"ot. Ez általánosságban azt jelenti, hogy a P permutáció és az I' inverzió kommutálnak: Pf = I'P. Az egyszerűség kedvéért p' jelölje a PI" műveletet. A CH3F molek:ula teljes magpermutációs ·inverziós (Eng Complete Nuclear Permutation Inversion, CNPI) csoportja: GCNP/
=St) ®{E,I'}.
Egy molek:ula CNPI csoportja tehát tartalmazza az azonos magok összes lehetséges permutációit az inverzióval és anélkül. Ennek következtében a CNPI csoport pontosan kétszer annyi elemből áll, mint a CNP csoport. A CH3F molek:ula CNPI csoportja: GCNPI = {E,(1,2),(2,3),(1,3),(1,2,3),(1,3,2),r ,(1,2r ,(2,3r ,(1,3r ,(1,2,3r ,(1,3,2n. A kérdéses csoportnak melyik az a részcsoportja, amelyik nem viszi át az A-formát a C-be és fordítva? Az elemek hatását megvizsgálva a következő választ adhatjuk:
{E, (1, 2,3),(1,3, 2),
o. 2)\ (2, 3r, (1, 3)'}.
Ezt a csoportot az alapállapotú CH3F molekula molek:uláris szimmetriacsoportjának (MS) nevezzük és CJv(M)-mel jelöljük. (A molekula egyensúlyi konfigurációja ugyanis a C3v pontcsoportba tartozik.) A CH3F molekula A- és C-formájának egy-egy, szimmetrik:usan elhelyezkedő lokális minimum felel meg a PES-en. A két lokális minimumot azonban olyan nagy energiagát választja el egymástól, hogy azok gyakorlatilag fiiggetlenek. Ez azt jelenti, hogy az alapállapotú CH3F molek:ula rotációs-rezgési energiaszintjeit meghatározhatjuk az egyik minimumra felírt rotációs-rezgési egyenlet megoldásávaL Igen nagy energiájú gerjesz-
106
107
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1-7. Kristályok szimmetriája: tércsoportok
1863, francia ftzikus és krisztallográfus) 1850-ben- több mint 50 évvel a röntgendiffrakció felfedezése előtt - geometriai alapon megállapította, hogy összesen 5 különböző síkrács és 14 különböző térrács lehetséges. A térrácsokat a tudós tiszteletére BRAvAlS-rácsoknak nevezzük. Ha ismerjük az atomok pentos elhelyezkedését egy elemi cellán belül, akkor tulajdonképpen az egész kristályra vonatkozóan ismerjük azt. A kristályszerkezet meghatározása így az egy elemi cellában levő atomok helyzetének a pontos meghatározását jelenti. Az elemi cella méreteés alakja a parallelepipedon éleinek a hosszával (a, b, c) és az élek által bezárt szögek (a, {3, y) , az Un. cellaparaméterek segítségével lehetséges:
Az embert mindig is lenyűgözte a kristályok csodálatos makroszkópikus megjelenési formája: szimmetrikus kristályok sima, fényes lapokkal és különleges optikai tulajdonságokkal ősidők óta használatosak ékszerként. A kristályok iránti tudományos érdeklődés is korán megmutatkozott a XVI. és a XVII. században. A tudósok hamar felismerték, hogy a kristályok makroszkópikus szimmetriája a mikroszkópikus építőelemek szimmetrikus elrendező désén alapul. Napjainkban széles körben alkalmazzák öket az optikában, az elektrotechnikában, a gyógyászatban, stb. Gondoljunk csak a félvezetökre, a piezoelektromos, ferromágneses és ferroelektromos anyagokra, a szupravezetökre, az optikai kristályokra, amelyek a lézer-, az ultraibolya és az infravörös technikában használatosak. Kristályos anyagokban atomok alkotta mintázat ismétlődik periódikusan a 3-dimenziós térben. A kérdéses mintázat állhat egyetlen egy atomból (ionból), több atomból (ionból), egy molekulából, vagy több molekulából. A kristály legfontosabb tulajdonsága a kérdéses mintázat szabályos, periódikus térbeli ismétlődése. Ez a szabályosság eredményezi a kristályok transzlációs szimmetriáját: az alkotóelemeknek bizonyos irányokban végrehajtott párhuzamos eltolása a szerkezetet nem változtatja meg. Feltételezzük, hogy a felülelet hatása a tömbi fázis hatásához képest elenyésző, azaz a kristály ''végtelen" kiterjedésű. Tekintsünk egy egyszerű példát! A NaCl-kristályt Na+ pozitív és Cr negatív ionok között fellépő elektrosztatikus kölcsönhatások tartják össze. Minden ionthat ellentétes töltésű ion vesz körül úgy, hogy azok egy szabályos oktaéder csúcsain helyezkednek el. Ha a kristályban pl. az egyik Na+-iontól egy másik Na+-ionhoz mozgunk a térben, az új helyen a környezet ugyanaz lesz, mint a kiindulási helyen, azaz a környezet alapján riem tudunk különbséget tenni a két Na+-ion között.
Na--Cl--Na
c(_ l -N{-~-c( \ 1
NA-fc(-
1 -
I/Cfl-\-1/~a~-- c1
JC'l•~{4 1
Na/ /
Ic/" l·
1/ :Ja-,-bdl-,-1/ Na / ch- 7 Na- / Cl Na Cl-- Na A kristályszerkezet matematikai leírása érdekében válasszunk ki véletlenszerűen'· egy pontot, egy ún. referenciapontot az IR3 euklideszi térben; majd az ezzel ekvivalens pontokat, amelyek relatíve azonos pozicióban vannak az ismétlődő mintázatokhoz képest, kössük össsze egyenes szakaszokkaL Ennek eredményeként egy 3-dimenziós rácsot (Eng. 3dimensionallattice, space lattice) kapunk rácspontokkaL A térrács a teret parallelepipedonok sokaságára bontja. Egy kiválasztott, de egyébként tetszőleges, parallelepipedonnak egyik rácspontból egy másik rácspontba való transzlációjával a teljes rácsot, s így a teljes kristályszerkezetet elő tudjuk állítani. A generáló parallelepipedont elemi cellának (Eng. unit cell) nevezzük. Az elemi cella az egész kristály tempiátjának tekinthető. Auguste BRAv AIS ( 1811108
a Az a a c és a b bázisvektorok, a ~ a c és az a bázisvektorok, míg a 'Y a b és az a bázisvektorok által bezárt szög. (A bázisvektorokat primitív transzlációs vektoroknak is nevezik a szakirodalomban.) Az élek, mint tengelyek (bázisvektorok), a kristályszerkezet leírására egy megfelelő koordináta-rendszert biztosítanak. Bizonyos szempontból egyszerűbb lenne egy térbeli jobbsodrású DESCARTES-féle (derékszögű) koordináta-rendszert alkalmazni (lásd az F.l-3. függeléket), a.Zonban a rácsvektorokon alapuló geometria előnyei túlkompenzálják a DESCARTES-féle geometria egyszerűségét. Egy az elemi cellában levő tetszőleges P pont helyzete megadható a referenciapontból, mint origóból, a P ponthoz húzott rp helyvektor z= {a, b, c} bázisra vonatkozó (x, y, z) koordinátái révén: rP =xa+ yb+zc (x,y,ze [0,1]). A P ponttal elevivalens pontok úgy állíthatók elő, hogy az x,y,z-koordinátákhoz egész számokat adunk hozzá. Az elemi cellát primitivnek mondjuk, ha nem találhatók rácspontok a belsejében. Ha az elemi cella nem primitív és n db. rácspont található a belsejében, akkor a térfogata n-szerese lesz az ugyanazon rács primitív elemi cellájáénak. A kémikusok nagy része úgy tudja, hogy a 14 BRAVAIS-rács közlll 7 primitív (P: primitív, egyszerű) és 7 centrált (1: térben centrált, F: minden lapon centrált és C: alapiapon centrált), azaz nemprimitiv. Az igazság azonban az, hogy minden VAlS-rács esetén lehetséges primitív elemi cellát választani [S.F.A. Kettle, L.J. Norrby: Real/y, your lattices are ali primitive, Mr. Bravais!, J. Chem. Educ., 70, 959 (1993)]. A szilárdtestftzikusok és a szilárdtest-spektroszkópus~k primitív elemi cellákkal dolgoznak szemben a szilárdtestkémikusokkal és a krisztallográfusokkal. Nemprimitív elemi cella választása nem szükségszerűségből, hanem kényelmi szempontok miatt történik. Továbbá az sem szükségszerű, hogy egy el~Ini cellát három párhuzamos lap határoljon. Például a WIGNER-SEITZ-féle primitív elemi cella általában több,
Bu
109
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
mint hat lappal rendelkezik és a rács teljes rotációs szimmetriájá.t tükrözi. A fő különbség a fizikusok és a kémikusok között az, hogy a fizikusokat a BRILLOVIN-zónák és így az elemi cellák transzlációi érdeklik; a kémikusokat ezzel szemben az elemi cellák tartalma, azaz a jelenlevő anyagi részecskék (atomok, molekulák, stb.) [S.F.A. Kettle, L.J. Norrby: The Brillouin Zone - An Interface between Spectroscopy and Crystallography, J. Chem. Educ., 67, 1022 (1990)]. A BRAVAIS-rácsok a konvencionális elemi cellákkal a következő táblázatban láthatók:
Példa: Egy primitív elemi cella rendelkezzen a következő paraméterekkel: a= 5.00 A, b = 6.00 A, c = 7.00 A -és a= fl= r= 90°. Egy új elemi cellát jelöljenek ki az origóból kiinduló következő vektorok: (2,1,0), (1,2,0) és (0,0,1). Határozzuk meg az eredeti és az új elemi cella térfogatát! Mennyi rácspentot tartalmaz az új elemi cella?
Kristályrendszer Triklin (háromhajlású) Monoklin (egyhajlású) Ortorombos (rombos) Tetragonális (négyzetes) Köbös (szabályos) Hexagonális (hatszöges) · Trigonális (romboéderes)
Hagyományos elemi cellák p P, C, P,C,I,F
P, l P,I,F
A hagyományos elemi cellák paraméterei a*b* é a* P* Y* 90" vagy 120" a"'-b*c a= r= 90"; fJ *90"vagy 120" a*b*c a=P=r=90" a=b"'-c a=P=r=90" a=b=c a=P=r=9o·
p
a=b*c a= fJ=90"; r=120"
p
a=b=c a = P= r"'-90"; IAI. A hatványhalmaz számosságát a következő módon is jelölik: IP(A)I=21A 1• A jelölés a véges halmazok példájából származik. (Ha lAl= n, akkor IP(A)I=2".) CANTOR mutatta meg először, hogy a természetes számok hatványhalmazának számossága a kontinuumszámossággal egyenlő: 2N• = N1• Az eljárás folytatható, s a hatványhalmaz-képzés segítségével a transzfinit számosságok végtelen sorozatát generálhatjuk: N0, Nl' N 2, ...
F .1-2. A komplex számok algebrája A polinomiális egyenletek megoldhatóságának vizsgálata vezetett a valós számok körének az első bővítéséhez, az ún. komplex számok bevezetéséhez. Tekintsük pl. a következő kvadratikus egyenletet: x 2 +1 = 0. Azonnal látszik, hogy a valós számok körében a kérdéses egyenletnek nincs megoldása. A matematikusok azonban sokáig nem voltak hajlandók foglalkozni ezzel problémával: a kérdéses egyenletet megoldhatatlannak tartották és a komplex számokat képzeletbeli (imaginárius) számoknak tekintették Girolamo CARDANO (1501-1576) híres munkájában (Ars Magna, 1545) is csak úgy emlegette a komplex számokat, mint körmönfont haszontalan dolgok~t. A komplex számok formális algebráját Rafaele BOMBELLI itáliai matematikus és mérnök dolgozta ki részleteiben 1572-ben az "Algebra" círnű művében. A komplex számok C halmazát következöképpen definiáljuk: C ={z= a+bil a,be IR}, ahol az i az imaginárius (képzetes) egység (i 2 = -1 ). A z komplex szám valós része Re(z) = a, képzetes része Im(z) = b. Látható, hogy a valós számok halmaza (b O) a komplex számok halmazának valódi részhalmaza. A z= a+bi komplex számot az (a,b) rendezett számpárral reprezentálhatjuk, és az euklidészi sík (a,b) pontjának feleltethetjük meg (komplex számsík). A szokásos Y tengely helyett azonban képzetes Y i tengelyt kell használnunk, melynek egysége az i. A z1 = a+ bi és a z 2 = c+ di komplex számok összegét következöképpen definiáljuk: z1 +z2 = (a+bi)+(c+di) = (a+c)+(b+d)i,
=
z1 +z2 =(a,b)+(c,d)=(a+c,b+d). Látható, hogy két komplex szám összege is komplex szám (zártság az összeadásra nézve). Az előbbi két komplex szám szorzatát az alábbi összefüggés adja meg: z1 •z2 = (a+bi)•(c+di) = (ac-bd)+(ad +bc)i,
z1 •z2 = (a,b)•(c,d) = (ac-bd,ad +be). Tulajdonképpen a- valós számok szorzására vonatkozó szabályokat használjuk, majd figyelembe vesszük, hogy i2 =-l . Látható, hogy két komplex szám szorzata is komplex szám (zártság a szorzásra nézve). A z= a+ bi komplex szám abszolút értéke (normája, modulusa): lzl = la+ bil = .Ja 2 +b2 , azaz egy nemnegatív valós szám. Az (x,yi) koordinátarendszerünkben geometriailag ez az (a, b) pont távolságát adja meg az origótóL Ennek megfelelöen a z komplex számot polárkoordinátás (trigonometrikus) alakban is megadhatjuk: z= lzl(cos t?+ i sin t?), ahol t? az origóból az (a,b) ponthoz húzott helyvektor és az X tengely pozitív fele által bezárt szög (a= lzl cos t? és b= zi sin t?). A t?-t akomplex szám fázisának vagy egyszerűen polárszögének nevezzük. A trigonometrikus alak segítségével vizsgáljuk meg, hogy geometriailag hogyan értelmezhető két komplex szám szorzata. Legyen z1 = lz11(cos~ + i sin ~) és z2 = lz21 (cos tY-2+ i sin tY-2). Határozzuk meg a szorzatukat ebben a formában. Kapjuk, hogy z= z1 • z2= lz1llz21[(cos~ costY-2 -sin~ sin tY-2)+( sin~ cos tY-2+cos~ sin tY-2 )i
l
J
= lz1llz2 1[cos(~ +t9-2 )+isin( ~ +~)]. 136
137
T asi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Ennek megfelelően a szorzat modulusa lzl = lz1llz2 1 és fázisa iJ= ~ + iJ2 • Geometriailag tehát
A komplex számok algebrája és bizonyos 2 x 2-es mátrixok algebrája között izomorfizmust létesíthetünk, azaz a komplex számokat speciális 2 x 2-es mátrixokkal reprezentálhatjuk. A z = a+ bi komplex számhoz a következő mátrixot rendeljük hozzá:
úgy szorzunk össze két komplex számot, hogy összeszorozzuk a normájukat és·összaadjuk a 2 fázisukat Például i fázisa tr/2 és normája L Így i fázisa 2( tr/2)= tr és normája 1·1 =l, úgyhogy
P = -l
~
várakozásunknak megfelelően.
l Példa: Oldjuk meg a z
2
=i egyenletet a komplex számok körében!
Legyen K a
következő
{b(z)=(: -:} (a,be IR).
halmaz:
Megoldás: Keressük a z megoldást trigonometrikus alakban és írjuk át az egyenletet ennek megfelelően. Kapjuk, hogy 2
lzl (cos2iJ+ isin2iJ) = 1(0+ i). 2
Tehát lzl =l, igy lzl =l. A fázisnak ki kell elégítenie a cos 2iJ ==O és a sin 2iJ =l egyenleteket. Ezeket az egyenleteket csak 2iJ=(tr/2)±n(2tr) elégiti ki, igy iJ=(tr/4)±ntr (nE Z~). A fázis iliértékei (O:::; iJ< 2tr): iJ= tr/4 (n= O) és iJ= 5tr/4 (n= I). A megoldások tehát z1 =cos
tr
. . tr
l (I
4 +zsm 4 = .Ji
.) +z ,
Az ex , a sin x és a cos x fiiggvények hatványsorai segítségével a komplex számoknak egy újabb alakjához juthatunk:
x
~
x"
e• =l+x+-+ ... = L,-, 2! n=O n! . x3 x5 ~
n
5!
n=O
(2n+l)!'
:t ( -:t( - n=O--;;!-
ei" -
iiJ)"
&· + 1·2n+l
·2•
1
n=O
(
2n)!
i}2n+!
) -
(2 n+ l)! -
{b(zi • z2) = (
ac-bd -(ad+bc)) . ad+bc ac-bd
{b(zl)•{b(z2 )=(:
4
Ezek alapján
z1 •z2 =(ac-bd)+(ad+bc)i;
nyitjuk, hogy a t/J leképezés izomorfizmus:
x 2•+1
2 x x ~ n x " cosx=l--+-- ... = L',(-1) - . 2! 4! n=O (2n)!
2
:t( r l
n=O -
i}2n (
2n)!
·:t( r if•+
+1
n=O -
l
l
(2 n+ l)!
=cos iJ+ i sin iJ. Tehát a z= lzl( cosiJ+isin iJ) komplex szám ún. El)LER-féle (exponenciális) formulája: z=lz!e;". A z= a+bi szám komplex konjugáltja (Eng. camplex conjugate) z*= a - bi. Továbbá 2
z• z* = (a+bi)•(a - bi) = a 2 +b2 = lzl
;
z+ z* =a+bi+a-bi=2a=2Re(z). · Két komplex szám hányadosát következőképpen számítjuk ki:
~)(~
-:)
= ( ac-bd -(ad+bc)) · ad+ bc ac-bd A komplex számok algebrájának alaptételét, fontossága miatt, a régebbi időkben az algebra alaptételének nevezték. A tétel azt mondja ki, hogy minden legalább elsőfokú komplex együtthatós polinomnak van legalább egy - általában komplex - gyöke. Karl Friedrich GAuss (1777-1855) bizonyította először precízen a kérdéses tételt 1799-ben. Meg kell azonban említeni, hogy az alaptétel nem tisztán algebrai: eddig ismert valamennyi bizonyítása kisebb-nagyobb mértékben kihasználja a valós és a komplex számok ún. topológiai (folytonossági) tulajdonságait is. A2í alaptétel egyik fontos következménye, hogy minden n-edfokú, tetszőleges komplex együtthatós p(z) = a0 z" + a 1z"-1 +... + a._1z +a. polinomnak n komplex gyöke van, ha minden gyökét annyiszor számítjuk, amennyi a multiplicitása, azaz ahányszor gyökként megkapjuk.
Z1 a+bi a+bi C- di (ac+bd)+(bc-ad)i ac +bd be-ad . z=-=-= - - •- - = = -- + - -- 1 ahol z 2 ;tO. Z2 c+ di c +di e- di c 2 +d2 c2 +d 2 c 2 +d2 '
Megmutatható, hogy az előzőekben definiált összeadással és szorzással a komplex számok c halmaza testet alkot. 138
-:}
Most megmutatjuk, hogy z1 • z2 képe azonos z1 és z2 képének a szorzatával, s ezzel bizo-
smx =x --,-+- - ... = .L,(-1) ----,3!
~
A z1 • z 2 komplex szám és annak {b- képe:
4
2
~}
{b(z,)= ( : {Ó(Z2) = (
. . 5tr =- .Ji l (1 +z") . z 2 =cos 5tr +zsm
4
Az előbbi {b: C ~ K leképezés bijektív és a C é~ a K algebrai struktúrák izomorf algebrai struktúrák, azaz izomorfak egymással. Ennek belátására vegyünk két tetszőleges komplex számot: z1 = a+ bi és z 2 =c+ di, melyek {b- képe:
139
Tasi Gyula: Matematikai kémia
T asi Gyula: Matematikai kémia
3
F .1-3. Vektoralgebra és vektoranalízis
a+b= _L(a1 +b;)e1;
A vektorszámítás mai formáját Josiah Willard Gmss (1839-1903) amerikai elméleti fizikus és kémikus hozta létre az 1884-ben megjelent "Elements of Vectoranalysis" című könyvében. A jelölésrendszer tökéletesitése Oliver IlEAVISIDE (1850-1925) angol elektromérnök nevéhez fűződik. Laboratóriumi (vonatkoztatási) koordinátarendszerként vegyünk fel egy térbeli (3dimenziós) jobbsodrású DESCARTES-féle (derékszögű) koordinátarendszert (Eng. right handed Cartesion coordinate system):
i a]
1 ~ a+b= [aa + [bb = [~+b a +b ] 1
2
1
]
2
]
2
2
•
~ b3 a3+b3 Látható, hogy a vektorok összeadása kommutatív művelet. A O nullvektort a következő összefilggés értelmezi: a+O=O+aFa. Tehát a nullvektor minden komponense zeró. Minden a vektornak van (-a) additív inverze úgy, hogy a+(-a)=(-a)+a =0. Képezzük az a és a b vektorok ún. skaláris szorzatát (belső szorzat, Eng. dot product, scalar product, inner product):
a • b= llallllbllcos t}, ahol llall és llbll jelöli az a és a b vektorok hosszát és tJ pedig az általuk bezárt szöget. A defmícióból következik, hogy a skaláris szorzat kommutatív, asszociatív és disztributív a vektorösszeadásra nézve., Figyelembe véve, hogy e1 •e1 = t5if, azaz a x bázis ortonormált, a skaláris szorzatra kapjukj hogy Látható, hogy a koordinátarendszerünk X, Y és Z tengelyei úgy következnek egymásra, mint a jobbkezünk hüvelyk-, mutató- és köiépsö ujja. A z= {i,j,k} halmazt bázisnak és magukat az elemeket, az egységvektorokat (Eng. unit vectors), bázisvektoroknak nevezzük. A kérdéses bázis teljes abban az értelemben, hogy minden 3-dimenziós vektor (helyvektor, helyzetvektor, Eng. position vector) előállítható ezek lineáris kombinációjaként: a= a1i+a2 j+a3k. Az {i,j,k} jelölés helyett használhatjuk az {e,,eY,e.} és az {et>e1 ,e 3 } jelölést is: 3
a =~e1 +a2e 2 +a3e3 = ,La1e1• i=l
Az apa2 ,~ E R számok az a vektor z= {e1 ,e2 ,e3 } bázisra vonatkozó koordinátái (komponensei). Az (apa2 ,~) rendezett számbármast pedig az a vektor X bázisra vonatkozó reprezentációjának nevezzük, és z(a)= (a1,a2 ,a3 ) módon jelöljük. Az a vektort egy oszlopmátrixszal is reprezentálhatjuk:
·=[~} A továbbiakban a jelöli mind az absztrakt 3-dimenziós vektort, mind annak adott bázisra vonatkozó különböző reprezentációit. Legyen még egy helyvektorunk: 3
b= qe1 +b2e 2 +b3e 3 = _Lb1e 1• i=l
Az a és a b vektorok összege alatt a következő vektort értjük:
140
a•b=(ta1e1}(tbie1)= t t a1bie1 •e1)=
tta~bA,
3
=,Latbt i=l
=(~
a2
~m
A helyvektorok hosszát könnyen megadhatjuk a koordinátáik segitségével:
ll ali== Ja•a =~a~ +a~ +ai. Definiáljuk az a és a b vektorok ún. vektoriális szorzatát (külső szorzat, Eng. vectorial product, outer product, ,cross product) is: , p,=axb=[a,b]. A p vektor hossza: IIPII=IIallllbllsint}, ahol 7'! az a és a b vektorok által bezárt szög és a p vektor iránya olyan, hogy az {a,b, p} vektorok jobbsodrású rendszert alkotnak. Azonnal látható, hogy a vektoriális szorzás nem kommutatív: [a, b]= -[b, a]. Ha az a és a b vektorok párhuzamosak, akkor sin t}= sin tr= O, azaz [a, b]= O. Ha az a és a b vektorok merőlegesek (ortogonálisak), akkor sin t}= sin(tr/2) =l, azaz llaxbll = llallllbll· A vektoriális szorzás disztributív a vektorösszeadásra nézve: ax(b+c) =(axb)+(axc). Határozzuk meg az axb vektor komponenseit az {e1 ,e 2 ,e3 } bázisra vonatkozóan: 141
T asi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
ax(bxc) ::t (axb)xc. axb = ( t a1e1 )x(tbjeJ J= t t a1b/e; x ei) = (a2 b3 -a3b2 ) e 1 +(a3b1 -~b3 ) e 2 +(~b2 -aA) eJ e1
e1
eJ
=~
a2
a3.
re
bl
b2 b3 A levezetés során a következő összefüggéseket használtuk fel: e1 xe1 = e1 xe1 =eJ x eJ =O;
r
és határozzuk meg a p és a skalárok értékét Először is állítsuk elő vektorainkat a bázisvektorok lineáris kombinációjaként:
e1 xe2 =eJ; e1 x eJ = e1 ; eJ x ei= e1 • A vektoriális szorzat komponenseinek meghatározására szolgáló fenti determinánst az első sora szerint kell kifejteni, tehát nem hagyományos determináns. A p = a x b = (p1, p 2, p 3) vektor komponenseit az
e9k LEVI-CIVITA szimbólum segítségével is előállíthatjuk 3
A bal oldalnak megfelelő vektor ugyanis a b és a c vektorok síkjában, a jobb oldalnak megfelelő pedig az a és a b vektorok síkjában fe~szik. Ennek következtében az ax(bxc) vektor előállítható a b és a c )lektorok lineáris kombinációjaként. Hasonlóan a jobb oldali is az a és a b vektorok lineáris kombinációjaként. Például az ax(bxc) vektort vegyük fel a következő formában: ax(bxc) = fib+
3
P1 = L:L:e9k aA (i=1,2,3), j=l k=l
ahol e9k =+1, ha az i,j,k indexek az 1,2,3 számok ciklikus (vagy páros) permutációja;
eijk =-1, ha az 1,2,3 számok nem ciklikus (vagy páratlan) permutációja és eijk =0, ha nem
3
3
a= L:akek;
•
b= L:b1e1 ;
k=l
1=1
Ekkor a vektoriális hármasszorzatra kapjuk, hogy ax(bxc) = LLLakb1cm [ek x(e1 xe,.)]. k
l
m
Egy kis számolással megállapíthatjuk, hogy ek x(e1 xe,.)= e1 ökm -e,. ökl . Helyettesítsük be ezt az előző összefiiggésünkbe: ax(bxc) = LLLakb1c,.(e1 Ökm -e,. ökl) k
l
m
permutációról van szó. Az utóbbi esetben az i, j, k indexek között tehát vannak azonosak. Például egy tömegpont l impulzusmomentum-vektora a részecske r helyvektorának és p impulzusvektorának a vektoriális szorzata: r= (x, y, x), p= (p,,py,pz), l= (1,,/y,lz) = rxp. Tehát az impulzusmomentum-vektor DESCARTES-koordinátáit a következő determináns első sora szerinti kifejtésével határozhatjuk meg: k
l= x
y
z .
P.
Py
P.
. Ennek belátására csak azt kell tudnunk, hogy a determináns előjelet vált, ha két sorát felcseréljük. Tehát, hogy ne váltson előjelet, kétszer kell végrehajtanunk egy-egy sorcserét: c1 c2 c3 a1 a2 a3 b1 b2 b3 q b2
a 3 = b1
b2
b3 = c1
c1
c2
c3
b3
c2
c3
a1 a2
a3
•
A második determináns (bxc)•a, a harmadik pedig (cxa)•b. A helyvektorok ún. poláris vektorok: az {e1 ,e2 ,eJ} bázisvektorok inverziója esetén ( {--e1 ,--e1 ,-eJ}) előjelet váltanak. A p= axb vektor nem poláris (közönséges) vektor: nem vált előjelet inverzió esetén. Ezeket axiális (pszeudo, ál) vektoroknak hívjuk. Két poláris vektor skaláris szorzata invariáns az inverzióval szemben. Egy poláris és egy axiális vektor skaláris szorzata ellenben előjelet vált! A vektoriális szorzás nem asszociatív művelet, azaz 142
l
k
m
L:(L:L:akb,ökl)c,.e,.. m
l
k
Az első zárójel az a • c skaláris szorzatot, a második pedig az a • b skaláris szorzatot tartalmazza. A végeredmény tehát ax(bxc) = (a•c)b-(a•b)c. Foglalkozzunk most egy speciális vektorral, az ún. "nabla-vektorral" (nabla-operátorral), melynek komponensei az x, y, és z szerinti parciális deriválások:
v =(i_. ,i_,i_)=ii_+ ji_+ ki_, dX dy dz dX dy dZ
Tétel: Az (axb)•c vegyesszorzat invariáns a tényezők ciklikus permutációjára nézve: (axb)•c = (bxc)•a = (cxa)•b.
(axb)•c= a1 a2
i = L:(L:L:akcmökm)b,e1 -
A nabla-operátor elsőrendű vektoriális differenciáloperátor. Az skalárfiiggvény ún. gradiens vektora:
J: :IR3~ lR
(= f(x,y,z))
gradf=Vf=i dj +jaj +k aj.
dX
dy
dZ
A nabla-vektorból további speciális operátorok számaztathatók. Legyen A= (A, ,AY, A.), ekkor
, aj aA aj
divA=V•A=-'-"'+-Y +-''z ;
dx
rotA=VxA=
dy
dz
j
k
a
a
Ax AY
A,
a
dX dy dZ '
143
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia 2
divgradf =V •(V/) =(V • V) j= V j= !:if;
e, =
rotgradf = Vx(Vf) ;", (VxV)f =O; divrotA =V • (VxA) =V • (A x V)= A •(V x V)= O; ahol a div művelet neve divergencia és a rot műveleté pedig rotáció. A div elsőrendű, a div grad pedig másodrendű skaláris differenciáloperátor. Az utóbbi a híres LAPLACE-operátor {á). (Pierre Simon LAPLACE (1749-1827) francia matematikus. Rövid ideig belügyminiszter volt Bonaparte NAPOLEON uralkodása alatt.) A LAPLACE-operátor természetes általánosítása a 4-dimenziós MlNKOWSKI-térre (tér-idő tér) az ún. D' ALEMBERT-operátor (Jean Baptiste Le · Rond D' Alembert (1717-1783) francia matematikus): l ()2 0 2= -- i lc2 o/2, ahol c a fénysebesség és t az . időkoordináta. A fentiekben levezetett formula segítségével egyszerűsítsük a V x (V x A) vektoriális hármasszorzatot: Vx(VxA) =(V •A) V -(V •V) A= (V •A) V-M. Az előzőekben a differenciáloperátorokat a z={e,,er ,ez} bázisra vonatkozóan adtuk meg. Sok feladat megoldása azonban lényegesen könnyebb lesz, ha a 3-dimenziós térben egy másik speciális koordinátarendszerre térünk át. Tekintsük például a térbeli polárkoordinátarendszert (Eng. spherical po/ar coordinate system):
_
ll:ll = sinecosrpe, +sinesinrper +cos eez; r-_lle cose z
e, -~~r_!:~
•·l
oos 9oos o>•. + oos 9 sU. ' . Írjuk fel az össze:fiiggéseket mátrixalakban (lásd az 1-4. fejezetet):
(::]=[::::;:: ::::: -:~~:][::]. e;
-smrp
o
cosrp
ez
A bázistranszformációt reprezentáló mátrixot jelölje 0. Könnyen megmutathatjuk, hogy a kérdéses mátríx ortogonális, azaz oT = 0"1. Ez már mutatja azt, hogy a z' bázis is ortonormált. Korábban megmutattuk, hogy egy ortogonális mátrix determinánsa ±1 . Határozzuk meg az O mátrix determinánsát! Mivel az O mátrix ortogonális, ezért az inverztranszformációt is könnyen felírhatjuk:
[t]=[:~~::: :::~:~~: -:~:](::].
z
e,
cose
O e;
-sme
A differenciálásra vonatkozó láncszabályt alkalmazva levezethetjük a :fiiggéseket:
következő
össze-
~=or~+ é)(}~+ orp ~=sinecosrp~+ cosOcosrp a _ sinrp ~ ox oxor oxoe oxorp or r ae rsineorp'
~=or~+ é)(}~+ orp ~=sinesinrp~+ cosOsinrp a + cosrp ~ ()y ()y ~r . oy ae ()y é)rp or r ae r sin(} é)rp,
y
~=or~+ ae~+ orp ~ =cose~ - sine ~oz OZ Or dZ ae dZ dfP Ezek után írjuk fel a nabla-vektort: .Egy adott r helyvektor (x,y,z) DESCARTES-koordinátái és (r,O,rp) polárkoordinátái közötti kapcsolatot a következő össze:fiiggések adják meg: x= rsinOcosrp;
y= rsinOsinrp; z= r cos O; r=
l rll = ~"x2:-+-y-=-2 +- z"7 2
V =e, a() +er ~+ez i_= (sinecosrpe, +sinesinrper +cos Oe,)~
x
144
bázis elemeit a
oy
oz
dr
+( cosecosrpe, +cosesinrpe>' -sin,(} ez ).!..~+( -sinrpe, +cosrper )-~-~ r ae ' rsm(} é)rp
A térbeli polárkoordináta-rendszer olyan probléma megoldásánál hasznos, mely gömbszimmetriával rendelkezik. Határozzuk meg a nabla-vektor komponenseit a z'= {e, ,e9 ,e,}
z'
r oe
a 1 a 1 a = e, - +e9 - - +e - ----. or r ae ; r sin e orp Tehát a nabla-vektor z' bázisra vonatkozó reprezentációja:
(O~ r< oo, O~(}~ tr, O~ rp < 2tr).
bázisra vonatkozóan! Első lépésként fejezzük· ki a segítségéve!:
dr
z
bázis elemei
ata
a)
1 z'(V) = or •-; é)(} ' r sin ()rp .
(
e
Most írjuk fel az e, ,e9 ,e91 egységvektrorok mátrixreprezentációit a . bázisra vonatkozóan: 145
z = {e,,ey,eJ
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
ee=[=:~:::]; e;=[~:::]. o
e,=[::::::]; ~e
z
-~e
Határozzuk meg ezek r, e és r/J szerinti parciális deriváltjait: ae,
ar
aee ar
=(~]=O;
ae, ae
O
=[~]=O; . o
";: omoO;
=[:::::~::]=ee; ~,r/J =[~::~~::]=sinee;; . e o -sm .
.
-sinecosf/Jl ~e; = -sin esinr/J =-e,; [ -cose . ae; ae
=[~]=o·'
~~
..·
.....···
-cosesinf/Jl = cose cosf/J =cos Be;; [
.................................~...:·:::::J..··· ··
0
ae
[-cosf/Jl a: = -s~nf/J =-:- cosBee -sin Be,
o
ismeretében mostmár könnyen előállíthatjuk a LAPLACE-operátor térbeli polárkoordinátás alakját is: 1 1 ó=V•V=(e i_+e .!__i_+e --~)•(e i_+e .!.~+e --~). 'ar erae ;rsinBarp 'ar erae ;rsinBarp A skaláris szorzás disztributív a vektorösszeadásra nézve, így írhatjuk, hogy Az
y
.
előzőek
i.)=e •(ae, i.+e _?_) = e •(oi.+e _?_)=e •e _?__=_?__. ( er i.)•(e ar r ar r ar ar r ar2 r . ar r ar 2 r r ar 2 ar 2 '
(
Egy adott r helyvektor (x,y,z) DESCARTES-koordinátái és (p,rp,:Z') hengerkoordinátái közötti kapcsolatot a következő összefüggések adják meg:
x=pcosf/J; y=psinrp; , z=z, ahol p:;:: O a henger sugara, O~ r/J< 2R és -oo < z'< oo. A hengerkoordináta-rendszer olyan probléma megoldásánál hasznos, mely hengerszimmetriával, azaz a Z tengely körüli forgási szimmetriával rendelkezik. Írjuk fel a z= {e.. ,ey,e.} és a z'= {ep, e; ,ez'} bázis közötti kapcsolatot meghatározó egyenleteket:
.!.~)=er •(aee .!__i_+e i.[.!._i_J)=o· ( er i.)•(e ar lJ r ae ar r ae 6 ar r ae '
rs~B aarp )=o; (eu; aae}(e, :r)=; :r; (eu~ aae}(es~aae )=: aa; (eu~ :e}(e; rs~B aarp )=o;
eP=
(e, :r}(e;
2
2 ;
1a ( 1 a ) ( 1 a ) cos B a ( e;rsinBarp • e, ar =;ar; e"rsinBarp • eu;ae = r 2 sinBaB; 1
a ) (
a)
1 a ) ( 1 a ) . ( e; r sin B arp • e; r sin B arp
2
1 a r 2 sin 2 B arp2 •
Összeadva ezeket megkapjuk a LAPLACE-operátor térbeli polárkoordinátás alakját:
ó=_?_+~i_+_!_~+ cosB _i_+
ll:ll =cosf/Jex+sinf/Jey;
e; =e,xeP =-sinf/Je.. +cosf/JeY. A fentiekhez hasonlóan levezethetjük a nabla- és a LAPLACE-operátorok hengerkoordinálás
alakját: a 1 a a V=e - +e - -+e - · p ap ; p arp z az ' 2
l a az ó = p ap p ap + p 2 arp2 + az2 • l a (
a )
A klasszikus elektrodinamika alapjá): a MAxWELL-egyenletek alkotják (James Clerk MAxWELL (1831-1879), skót fizikus). A vákuumra vonatkozó MAXWELL-egyenletek:
Az alkalmazások szempontjából a hengerkoordináta-rendszer (Eng. cylindrical coordinate system) is igen fontos görbevonalú koordinátarendszer:
l . ' (l) VxH--E = O; c (2) V•E=O; l . (3) VxE+-H=O; c (4) V•H=O;
146
147
ar 2
l az r ar r 2 aez r 2 sin B ae r 2 sin2 B arp2
1 a ( 2 a) 1 a ( . a ) 1 az =;r ar r . ar + r 2 sin8 ae smB ae + r 2 sin 2 B arp2 •
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
ahol H= H(r,t) a mágneses térerősség, E= E(r,t) pedig az elektromos térerősség vektora és c a fénysebesség. Ha a vektoriális hármasszorzatra felírt fenti összefiiggésben az A vektor helyére az E vektort helyettesítjük, akkor kapjuk, hogy
F.1-4. Egy folyamatábra molekuláris pontcsoportok meghatározására
V x (V x E) =(V • E) V- (V • V) E =(V • E) V- AE =-AE, hiszen az első tag nulla lesz, mível V • E =0. SzorozZuk meg a (3) MAxwELL-egyenletet balról vektoriálisan a nabla vektorral, majd vegyük figyelembe az előbbi eredményünket: l . l . Vx(VxE)+-VxH=-~E+-VxH=O; azaz
c
c
l
.
AE=-VxH.
c Az (l) MAxWELL-egyenletet az időszerint deriválva:
Vxii=.!.E.
c Ezt behelyettesítve az előző összefiiggésünkbe, kapjuk, hogy l ..
AE= 2 E. c
A H vektorra hasonló összefiiggés vezethető le. Végül is a vektoriális hárrnasszorzatra kapott formulánk segítségével a MAxWELL-egyenleteket transzformálni tudtuk:
(l')
m=~ii;
c (2) V•E=O;
(3') AE =~E; c (4) V•H=O.
148
149
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
F.1-5. A krisztallográfiai pontcsoportok
2. Modellezés és paraméterbecslés a kémiában
Kristályrendszer
Triklin (háromhajlású) Monoklin (egyhajlású) Ortorombos (rombos) Tetragonális (négyzetes)
Trigonális (romboéderes).
Hexagonális (hatszöges)
Köbös (szabályos)
Schönflies
HermannMauguin
A csoport rendje
c1 Ct
T
l 2
c2 c. C2h
2 m 2/m
2 2 4
222
4 4 8
D2
elv
mm2
D 2h
mmm
c4 s4 c4h D4 C4v D2d D4h c1 c11 D1 C3v D1d
4
4 4/m 422 4mm 42m 4/mmm 3
3 32 3m 3m 6
4 4 8 8 8 8 16 3 6 6 6 12 6 6
c6 c 3h c 6h D6 C6v D1h D6h
6/m 622 6mm 6m2 6/mmm.
12
T Th o Td oh
23 m3 432 43m m3m
12 24 24 24 48
150
6
12 12 12 24
"Az ember modellalkotó állat."
Marx György, A természet játékai, Ifjúsági Lap- és Könyvkiadó Vállafat, Budapest, 1983.
2-1. Bevezetés A tudomány egyik legalapvetöbb feladata információ nyerése adatokból. A paraméterbecslés (Eng. parameter estimation) olyan matematikai tudományág, melynek eszközei lehetövé teszik adatok hatékony felhasználását fi!atematikai modellekben szereplö állandók értékének becslésében és különbözö jelenségek matematikai modelljeinek felépítésében. A paraméterbecslés elnevezés mellett az optimalizálás (optimálás) és a nemlineáris regresszió (Eng. optimization, nonlinear regression) elnevezés is elterjedt a tudományos szakirodalomban. Paraméterbecslésre minden fizikai, kémiai tudományágban szükség van. Kezdve az alapvető fizikai állandók kisérleti értékének a meghatározásától, a kvantumkémiában használatos bázisok előállításáll keresztül, egészen a kémiai reakciók reakciósebességi együtthatóinak a becsléséig. A matematikai modellek általában algebrai, differenciál- vagy integrálegyenletek formájában állnak rendelkezésünkre megfelelő kezdeti vagy peremfeltételekkeL A legkisebb négyzeli!k módszerét, mint paraméterbecslési eljárást, Karl Friedrich GAUSS (1777-1855) használta először kozmológiai problémák megoldásánál, így öt tekinthetjük a paraméterbecslés atyjának. A módszer első részletes leírása Adrien-Marie LEGENDRE (17521833) francia matematikus 1806-os művében jelent meg. A különbözö természettudományokban nagyon sok jelenség és folyamat modellezésére differenciálegyenleteket alkalmazunk. Az 1-4. fejezetben például említettük, hogy a hullámmechanika olyan differenciálegyenletekkel dolgozik, amik az elméleti fizika más területein (pl. klasszikus mechanika, hidrodinamika, elektrodinamika., stb.) már a XIX. században használatosak voltak, s így sokkal kézenfekvöbb volt kezdetben a mátrixme'chanikánál fóleg egyszerűbb problémák esetén - gyakorlati számítások végzésére. Azt is fontos megjegyezni, hogy Richard CoURANT (1888-1972) és David HILBERT (1862-1943) porosz származású tudósok "A matematikai [TZika módszerd' című híres könyve 1924-ben jelent meg németül, és tartalmazta mindazt a matematikai apparátust, ami a hullámmechanikához szükséges volt. A kérdéses mű bővített változatban angolul is megjelent a John Wiley & Sons kiadó gondozásában: R. Courant, D. Hilbert: Methods of Mathematical Physics, John Wiley · & Sons, Volume I-ll, New York (1989). Szerenesés esetben a differenciálegyenleteink rendelkeznek analitikus megoldással. Az esetek túlnyomó többségében azonban nem ez a helyzet, s így numerikus megoldáshoz kell folyamodnunk. A numerikus módszerek jóságának ellenőrzése szempontjából azonban rendkivül fontosak azok a differenciálegyenletek, amelyek analitikusan megoldhatók. Éppen ezért haSznos tudni, hogy POLYANIN és ZAITSEV kézikönyve [A.D. Polyanin, V.F. Zaitsev: Handbook of Exact Solutionsfor Ordinary Diffe rential Equations, CRC Press, Boca Raton (1995).] csaknem 5000 közönséges differenciálegyenlet analitikus megoldását tartalmazza.
!51
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
2-2. Differenciálegyenletekkel kapcsolatos alapfogalmak
DE, ha van perturbációs tag és homogén, ha nincs. A hidrogénatomra az elŐzőekben felírt időtől fliggetlen SCHRÖDINGER-egyenlet másodrendű homogén lineáris PDE. A DE megoldása minden olyan y= f(x) fiiggvény, ami kielégíti az F(x,y,y', ... ,yO).
-s
, .... .,
0
0
, .... .,
-s
s
s
A kérdéses írnpropriusz integrál ugyanis csak s > O esetén létezik. Tehát azt kaptuk, hogy .!(1) =.!.. (s >O). s Legyen f(t) = t (t:?. O). Ekkor, parciálisan integrálva, kapjuk, hogy . " l F(s) =L(t)= te-" dt = - (s >O).
J
o
s2
Ha f(t) = e•' (t:?. O), akkor .!(e•') = "Je-•' e•' dt = lim [ ea).
2
Következésképp
2
l( l
L(coswt)=- - .- + -l. -) =2-s-2. 2 s -zw s + zw s +w Hasonlóan levezethető, hogy
L(sinwt)=~. s
Tétel: Legyen f: JR~ ~ lR folytonos és a. exponenciális rendü, melynek a LAPLACEtranszformáltja .!{f(t)} = F(s). Ekkor !:F(s)=.!{(-l)"t" f(t)},
n=l,2,3, ... (s>a).
A tétel teljes indukcióval bizonyítható, csak azt kell felismerni, hogy a feltételek biztosítják a deriválás és az integrálás sorrendjének a felcserélését:
!!_F(s)=!!_ je-"f(t)dt= j~e-"f(t)dt= }-te-"f(t)dt=.!{-if(t)}. ds dso oas o A tétel segítségével hatáiozzuk meg az f(t) = t cos wt függvény LAPLACE-transzformáltját! Először is d -L(cos w t) =-L(t cos w t). ds Amiből, az elözőek alapján, kapjuk, hogy d d s s 2 -w2 L(tcoswt)=--.!(coswt)=----= • 2 2 ds · ds s 2 +w2 (s 2 +w) A LAP~ACE-transzformációs módszer fizikai, kémiai alkalmazásakor szükségünk van az inverz müveletre is: Ha L{f(t)} = F(s) , akkor az inverz LAPLACE-transzformációt következőképpenjelöljük (Eng. inverse Laplace transform): .C1 {F(s)} = f(t) (t:?. O), ami visszaadja az eredeti függvényünket Természetes módon felmerül a következő kérdés: az inverz transzformáció egyértelmű? Szerencsére, létezik egy tétel, amit itt nem bizonyítunk, mely kimondja, hogy különböző folytonos függvények LAPLACE-transzformáltja is különböző. Ez azt jelenti, hogy folytonos függvények esetén az inverz LAPLACE-transzformáció 1 egyértelmű. Fontos megemlíteni, hogy az .C operátor is lineáris, azaz 1 1 .C {aF(s) +bG(s)} =a .C {F(s)} +b .C1 {G(s)} =a f(t ) +b g(t), ahol L{/(t)} = F(s), .!{g(t)} = G(s) (a és b tetszőleges állandók). Nézzünk egy egyszeru példát!
S-lll)
0
.+ll)
J
l ) =l [ .Cl { -l-} +.Cl { -l-}] =l [ et +e-t =cosht (t-:?.0). .Cl ( - -l - + 2(s- a) 2(s+a) 2 s-a s+a 2
Hasonlóan
160
161
T asi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Gyakran előfordulnak olyan esetek, amikor nem ismerhető fel azonnal, hogy a LAPLACEtranszformált mely függvény transzformáltja. Tekintsük pl. a következő esetet! 1
Tétel: Legyen f : JR~ ~ IR folytonos és a exponenciális rendű. Tegyük fel továbbá, hogy /'(t) folytonos. Ekkor ·
F(s)
L{f'(t)} =sL{f(t)}- J(O) (s >a).
(s-2)(s - 3) analízisből
Ebben a speciális esetben érdemes az elemi módszerét alkalmazni, azaz l
ismert parciális
tőrtekre
bontás
Bizonyítás:
"'re-"t'(t)dt =lim ·re-"t'(t)dt =lim [e-"J(t)]' + s "'re-" t O), akkor
F(s-a)=L{e"'f(t)} (s>a). Bizonyítás: 00
00
F(s-a) = re- O.
*
A függvény deriváhja zéro, ha x O. Az x =O helyen ellenben határozatlan. Reprezentálja a 8(x) DIRAc-delta függvény a HAEVISIDE-függvény deriváltját ( 8(x) = H'(x) ): 8(x) =0, ha x'* OA8(x) =oo, ha x= 0. A definíció alapján
J8(x)dx= "'JH'(x)dx=[H(x)J: =H(oo)-H(-oo) = l.
"'
Legyen
f: IR.~ IR.
folytonos és lim f(x) =O. Ekkor, pardálisan integrálva, z-->±a>
"'
Jf(x)8(x)dx =[f(x)H(x)J:- "'Jf'(x)H(x)dx
Valószinűség
a matematikában, a kémiában és a fizikában
Napjainkban már egyedi molekulák tanulmánrozása is lehetséges kísérteti spektroszkópiai módszerekkel. A labor_!ltóriumi munkák során azonban a kutatók általában olyan makroszkópikus méretű anyagokkal kísérleteznek, melyek hihetetlenül nagy számú részecskéből épülnek fel. A klasszikus fizikához tartozó termodinamika (Eng. thermodynamics)- mint fenomenologikus (leíró jellegű) tudomány- az anyag makroszkópikus (tömbi) tulajdonságaival foglalkozik. A XIX. századbanjött létre Sadi CARNOT (1796-1832), Julius Robert MAYER (18141878), James JOULE (1818-1889), Rudolf CLAU6IUS (1822-1888), Hermann HELMHOLTZ (1821-1894), William 'D!OMSON (később Lord KELVIN, 1824-1907), Josiah Willard GIBBS (1839-1903) és mások munkássága révén. Megállapításai általános érvényűek, azaz függetlenek az anyag szerkezetéről - atomi és molekuláris struktúrájáról - való ismereteinktőL A termodinamika feladata olyan fizikai mennyiségek, állapothatározók (Eng. state quantities, state variables), definiálása, amelyek a lehető legegyértelmübbenjellemzik termodinamikai rendszerünk makroszkópikus (termodinamikai) tulajdonságait, azaz makroállapotát (termodinamikai állapot = makroállapot). Az egyensúlyi termodinamika (termosztatika, reverzibilis termodinamika) az állapothatározók értékét csak egyensúlyban lévő rendszerekre értelmezi. Defmíció: A vizsgálatunk tárgyát képező termodinamikai rendszer egyensúlyi állapotban van, ha egyetlenegy állapothatározója sem változik az idővel mérhető sebességgel. Ilyen állapothatározók lehetnek - az U belső energia, a V térfogat, az N részecskeszám, az S entrópia, a T hőmérséklet, a p nyomás és a p kémiai potenciál mellett - az elektromos töltés, az elektromos dipólusmomentum, a törésmutató, a viszkozitás, a kémiai összetétel stb. A termodinamika további feladata az állapothatározók között általános érvényű) összefüggések, állapotegyenletek (Eng. state equations) megállapítása, felállítása. A független állapothatározók száma megadja · a kérdéses termodinamikai rendszer szabadsági fokainak a számát. Például adott mennyiségű tökéletes gáz (Eng. idea/ g as, peifect gas) egyensúlyi állapotát a p nyomása és a V térfogata egyértelmüen meghatározza. A tökéletes gázok jól ismert állapotegyenlete szerint ugyanis az állapothatározók között fennáll a következő összefiiggés: pV=nRT,
Mutassuk meg, hogy .C {8(t)} =l ! A DIRAC-delta függvényt a MATHEMATICA program is ismeri (DiracDelta[t]).
ahol n az anyagmennyiség és R az ún. moláris gázállandó ( k = R l N A). Ebben az esetben a szabadsági fokok száma kettő: a rendszer makroszkópikus állapottere (Eng. macroscopic state space) 2-dimenziós. A makroszkópikus állapottér tehát annyi dimenziós, ahány független állapothaÍározója van a rendszernek. A IDggetlen állapothatározóknak egy-egy koordinátatengely feleltethető meg az állapottérben. Ha megengedjük az anyagmennyiség változását is, akkor az állapotterünk 3-dimenziós lesz. Az állapottér minden pontjának a rendszer egy-egy egyensúlyi állapota felel meg. Az állapottér bármely két pontja egy termodinamikai állapotváltozást határoz meg. Természetesen ez a változás nagyon sokféle módon mehet végbe: az egyik végpontból a másikba nagyon sokféle úton juthatunk el az állapottérben. Reverzibilisnek nevezzük az állapotváltozást, ha az egyensúlyi állapotokon keresztül valósul meg. Az állapottérben ennek megfelelően csak reverzibilis
164
165
"'
=- J!'(x)dx=[-f(x)]; o
= /(O).
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
állapotváltozások (Eng. reversible processes) ábrázolhatók. A gyakorlatban bekövetkező változások azonban irreverzibilisek (Eng. irreversible processes), azaz nemegyensúlyi állapotokon keresztül mennek végbe. A reverzibilis változások tehát csak idealizációk, melyek azonban mind elméleti, mind gyakorlati szempontból rendkívül fontosak. Elegendő csak azt meggondolni, hogy egy reverzibilis folyamat esetén az állapothatározók az állapottér minden egyes pontjában jól definiált értékekkel rendelkeznek, így az állapothatározóknak a folyamat során bekövetkező teljes megváltozását integrálással megkaphatjuk. Ez az irreverzibilis folyamatokra nem mondható el. A termodinamika alapját négy axióma, ún. fótétel (törvény) képezi. A tétel elnevezés matematikai szempontból helytelen, mivel ezek a termodinamikán belül nem bizonyíthatók. A kísérteti eredményekből empirikusan vezették le őket. Számozásuk a nullával kezdődik. Ennek az az egyszerű oka, hogy a nulladik rotételt (Eng. zeroth law of thermodynamics) utolsóként fogalmazták meg. A tartalmát illetően azonban az első helyen kell szerepeltetni. A nulladik rotétel a termodinamikai hőmérséklet fogalmát is megadja:
A valószínűségelmélet kialakulásának kezdetét a XVII. századra tehetjük. A XX. századra a valószínűségelmélet a véletlen matematikai tudományává vált: axiomatikus megfogalmazása A. N. KOLMOGOROV (1903-1987) szovjet matematikus érdeme. A statisztikus mechanika még a klasszikus fizika talajánjött létre a XIX. században James Clerk MAXWELL (1831-1879), Ludwig Eduard BOLTZMANN (1844-1906), Josiah Willard GIBBS és Max PLANCK (1858-1947, fizikai NOBEL-díj 1918-ban) munkássága révén. Ennek következtében nem meglepő, hogy a mikrorészecskék mozgására kezdetben a klasszikus mechanika törvényeit tartották érvényesnek. A későbbiekben azonban a kvantummechanik:a törvényeit is ·alkalmazni kezdték, és hamarosan kiderült, hogy a kvantummechanik:a figyelembevétele alapvetően befolyásolja a makroszkópikus rendszerek termodinamikai tulajdonságait. Ezen a területen Max PLANCK, Albert EINSTEIN (1879-1955, fizikai NOBEL-díj 1921ben), Saterrdra Nath BOSE (1894-1974), Enrico FERMI (1901-1954, fizikai NOBEL-díj 1938ban), Paul Adrien Maurice DIRAc (1902-1984, fizikai NOBEL-díj 1933-ban) és Wolfgang PAULI (1900-1958, fizikai NOBEL-dij 1945-ben) értek el alapvető eredményeket. Az entrópia (Eng. entropy) a klasszikus fizika legbonyolultabb- legnehezebben érthető fogalma. Először a termodinamikában került bevezetésre, majd a statisztileus mechanikában és az információelméletben nyert átfogóbb értelmezést. A következő metaforákkal szokás szemléletessé tenni jelentését: "az entrópia a rendezetlenség mértéke", "az entrópia a s:Zabadság mértéke", "azientrópia a homogenitás mértéke", stb. Ezek a szemléletes képek azonban veszélyeket is hordoznak magukban: ha gondolkodás nélkül alkalmazzuk őket, akkor hibás konklúziókhoz juthatunk [D.F. Styer: Insight into entropy, Am. J. Phys., 68, l 090 (2000)]. A szerencsejátékok története egyidős az emberiség történetével. A valószínűségelmélet (valószínűségszámítás) kialakulásának kezdetét Blaise PASCAL (1623-1662) és Pierre FERMAT (1601-1665) szerencsejátékokról folytatott levelezésére vezethetjük vissza. A kérdéses levelekben pl. Chevalier DE MÉRÉ (Chevalier = lovag, francia) kockajátékokkal kapcsolatos problémáival foglalkoztak. A lovag ugyanis nagy fogadásokat kötött kockajátékokra, s ezekről a fogadásokról szeretett volna, a nagyobb nyeremény reményében, biztos matematikai kiértékelést kapni. RÉNYI Alfréd magyar matematikus a "Levelek a valószínűségrőr' címü lebilincselő könyvében megpróbálta rekonstruálni ezt a levelezést és bemutatni, hogy Pascal mit gondolhatott a valószínűségszámításról a XVII. és maga a szerző a XX. században.
A termodinamika nulladik axiómája: Létézik egy olyan T állapothatározó, a hőmérséklet, hogy két termikus koritaktusban lévő rendszer pontosan akkor van termikus egyensúlyban, ha a hőmérsékletüle megegyezik. A klasszikus mechanikában a hőmérséklet fogalma nem szerepel, annak ellenére, hogy súrlódás következtében mindig fellép energiaveszteség (súrlódási) hő formájában. A súrlódási erők természetüket illetően kvantumos intermolekuláris erők, így a klasszikus mechanika csak ad hoc tudja kezelni öket. Látható, hogy a nulladik rotétel a hőmérséletet implicite definiálja, mivel nem adja meg a hőmérséklet pontos értékét nem fixálja a hőmérsékleti skálát. További fontos tény, hogy az egyensúlyi termodinamikában viszont az idő nem szerepel. Általában feltételezzük, hogy elegendő idö áll rendelkezésre ahhoz, hogy a rendszerünk egyensúlyi állapotba kerüljön. A termodinamikával ellentétben a XX. század hajnalán megszületett kvantummechanika (Eng. quantum mechanics) az anyag egyedi alkotóinak (elemi részecskék, atommagok, atomok, molekulák, stb.) viselkedésével és tulajdonságaiknak a leírásával foglalkozik. A makrovilágban megfigyelhető makroszkópik:us tulajdonságok hihetetlenül nagy számú mikroszkópik:us tulajdonság átlagolódásának az eredményeként jönnek létre. Ennek következtében a makrovilág tanulmányozásával nagyon sok mikroszkópik:us jelenséget nem ismerhetünk fel: azok rejtve maradnak előlünk. A két világot (tudományterületet) a statisztileus mechanika (Eng. statistical mechanics) kapcsolja össze. Célja - az anyag mikroszkópik:us tulajdonságainak az ismeretében - az anyag makroszkópik:us tulajdonságainak a szánútása. A statisztileus mechanika legfontosabb matematikai eszköze a valószínűségelmélet (Eng. prohabilily theory), ugyanis ennek segítségével hajtja végre a mikrorészecskékre vonatkozó tulajdonságok átlagolását. A valószínűségelmélet fontos szerepet játszik a kvantummechanik:a matematikai megalapozásában is. A statisztileus mechanika és a kvantummechanik:a a modem tudomány alapkövévé tette a
A valószínűségelmélet a véletlen matematikai. tudománya. A valószíriűségelméleti problémák véletlen kísérletekkel (Eng. chance experiment) kapcsolatosak.
valószínűségelméletet
166
167
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Defmíció: Véletlen kísérlet alatt olyan kísérletet értünk, amelynek kimenetelét az általunk ismert (vagy figyelembe vett) okok nem határozzák meg egyértelműen.
Példa: Az előző dobókockás példában mennyi az összes lehetséges esemény száma?
Tehát ahhoz, hogy egy jelenséget a valószínűségelmélet eszközeivel tanulmányozhassunk nem feltétlenül szükséges, hogy az teljesen véletlen legyen, sőt olyan jelenségeket is vizsgálhatunk, amelyek valójában determinisztikusak, de az összes ok figyelembevétele túlságosan fáradságos lenne számunkra. A következőkben kísérlet alatt mindig véletlen kísérletet értünk. Itt kell megemlítenünk, hogy a valószínűségelmélet alkalmazását illetően alapvető különbség van a klasszikus mechanika és a kvantummechanika között. Az előbbi esetben tulajdonképpen arról van szó, hogy az összes tényező számbavétele igen nehéz lenne egy sokrészecskés klasszikus mechanikai tömegpontrendszerben. A klasszikus fizika szerint a valószínűségelmélet ebben az esetben csak a "lustaságunk" miatti hiányos tudásunkat kompenzálja. Ennek megfelelően a valószínűségelmélet csak megtűrt másodrendű szerepet játszott a XVIII. és a XIX. századi fizikában. A kvantummechanika ezzel szemben alapvetőerr statisztikus jellegű tudomány, azaz valószínűségi kijelentéseket tesz. A Werner HEISENBERG által kimondott bizonytalansági reláció a modern fizika alapkövévé tette a valószínűségelméletet A kvantummechanika valószínűségelméleti megalapozása olyan fontos eredménynek bizonyult, hogy Max BORN (1882-1970) 1954-ben fizikai Nobel-díjat kapott érte. Albert EINSTEIN nem tudta elfogadni a kvantummechanika valószínűségelméleti értelmezését. Ezzel kapcsolatban szokták idézni következő híres mondását: "Az Isten nem kockázik. (Eng. God does not play dice.)" Minden kísérletnek több lehetséges kimenetele van. Ha csak egy lenne, akkor az rnindig bekövetkezne és semmi véletlenszerüséget nem .tapasztalnánk. A lehetséges kimeneteleket, azaz az eredményeket a továbbiakban elemi eseményeknek (Eng. elementary event) nevezzük. Az elemi események összességét pedig eseménytérnek (Eng. samp/e space) mondjuk, s n-val jelöljük. Az elemi eseményeken túl további eseményeket is megfogalmazhatunk. Nézzünk egy egyszerű példát! Egy tökéletes - nem cinkelt - kockával való dobás legyen a véletlen kísérlet. (Egy tökéletes kockánál a tömegközéppont egybeesik a geometriai középponttal.) A lehetséges elemi események a következők: egyest, kettest, ..., hatost dobunk. Plauzibilis módon jelöljük ezeket az l, 2, ... , 6 számokkal. Tehát n= {1,2,3,4,5,6}. Azonban az elemi eseményeken túl az is eseménynek tekinthető, hogy páros számot dobunk. Ennek az eseménynek a {2,4,6} halmaz feleltethető meg. Ezek után azt mondhatjuk, hogy a lehetséges események aZ n halmaz részhalmazaL Egy konkrét eseményt pedig akkor tekintünk bekövetkezettnek, ha a kísérlet végeredménye, a kapott elemi esemény, eleme a kérdéses eseményt reprezentáló halmaznak. Az n halmaz triviális részhalmazaj pedig a biztos eseménynek (O halmaz, Eng. sure event) és a lehetetlen eseménynek (üres halmaz, Eng. empty event) felelnek meg. A hatványhalmaz fogalma így fontos szerephez jut: az összes esemény halmaza nem más, mint az n halmaz P(O) hatványhalmaza. Az n halmaz hatványhalmazát következőképpenjelölj ük: :F = P(O).
168
Mivel az események halmazok, ezért rájuk a halmazalgebra szabályai vonatkoznak, s ilyen értelemben beszélhetünk eseményalgebráról. Legyen A és B két esemény. Ekkor a két esemény A+ B összegének és AB szorzatának szemléletes jelentése van. Az előbbi bekövetkezik, ha az A és a B közül valamelyik bekövetkezik. A szorzatesemény pedig pontosan akkor következik be, ha mindkettő bekövetkezik. Az összeg esetén tulajdonképpen a két halmaz egyesítéséről, a szorzat esetén A; és a pedig a két halmaz metszetéről van szó. Ezek általánosításának tekinthetők a
IT A;
L
események. Analóg módon
értelmezhetők további
halmazelméleti fogalmak is. A B
esemény Be komplementurna azt jelenti, hogy a B esemény nem következik be. Az A- B esemény azt jelenti, hogy A bekövl)tkezik, de B nem. Az A c B azt jelenti, hogy A bekövetkezése maga után vonja B bekövetkezését. Az AB =0 azt jelenti, hogy A és B egymást kizáró események. Az elemi események egymást kizáró események, mivel egyszerre csak egy valósulhat meg közülük. Ezek után definiálhatjuk a valószínűségi mező fogalmát Defmíció: Az alábbi I-IV axiómákat kielégítő (O,:F,P) objektumot valószínűségi mezőnek nevezzük. I. axióma: :F halmazalgebra; Il. axióma: VA E :F-hez 3P(A) E JR~ skalár, amit az A esemény valószínűségének mondunk; III. axióma: P(O)= l; IV. axióma: Ha A és B egymást kizáró események, akkor P( A+ B)= P( A) + P(B). Az l. axióma azt fejezi ki, hogy az :F elemei között halmazműveleteket végezhetünk, s a műveletek eredményeként klipott halmaz szintén az :F halmaz eleme (zártság). A Il. és a III.
axiómák miatt fennáll a következő egyenlőtlenség: Os;; P( A) s;; l. A P( A) halmazfüggvényt (funkcionált) valószínűségeloszlásnak (Eng. prohabilily distribution) is szokás nevezni. A valószínűségelmélet fentiekben bemutatott axiomatikus Illegfogalmazása A. N. KOLMOGOROV (1903-1987) szovjet mat~matikus érdeme. A valószínűségi mezőt végesnek mondjuk, ha az n halmaz véges. A következőkben nézzük meg, hogy hogyan tudunk kapcsolatot teremteni a valószínűségelmélet és a kísérleti eredmények között. Egy véletlen kísérlettel kapcsolatban feltételeZZÜk, hogy azt egymástól függetlenül tetszőlegesen sokszor megismételhetjük Elegendőerr nagy számú kísérletet végrehajtva azt kell tapasztalnunk, hogy a különbözö eselll;ények gyakoriságainak (bekövetkezéseinek) a hányadosa stabilitást mritat (nagy számok törvénye, Eng. law oflarge numbers):
kA =konst.
kB Legyen B = n , ekkor az A esemény relatív gyakorisága (Eng. relative frequency): kA kA
k=--;;· n
169
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
ahol n a kísérletek száma: k0 = n. Hiszen az n esemény mindig bekövetkezik. Az előbbiek szerint az A esemény relatív gyakorisága is stabilitást mutat. Legyen P(O) = k0 /n =n/n= l. Mivel O::;; kA ::;; n, azaz O::;; kA/n::;; l, s ez minden n-re érvényes, ezért
P(A)~kA.
n A relatív gyakoriság tehát kielégíti a Il. és a III. axiómákat. Már csak azt kell belátnunk, hogy a IV. axióma is teljesül. Legyen A és B két egymást kizáró esemény, azaz AB= 0. Ekkor kA+B =kA +kB, azaz kA+a/n = kA/n+kBjn. Ha a relatív gyakoriságokat tekintjük a megfelelő valószínűségeknek, akkor azt kapjuk, hogy P( A+ B)= P( A)+ P(B), ami a IV. axióma teljesülését jelenti. Végeredményben tehát megállapíthatjuk, hogy a kísérletileg meghatározható relatív gyakoriságok jól megfeleltethetők a valószínűségeknek. Ha a kísérletek számát minden határon túl növeljÜk:, akkor az egzakt valószínűségeket kapjuk: P(A) = lim kA . n~oo
n
Az eseménytér részhalmazain sok különböző valószínűségeloszlás adható meg. Egy konkrét esetben ezek közül .csak egy realizálódik. Ennek a "valódi" valószínűségeloszlásnak az empírikus közelítésével foglalkozik a matematikai statisztika. Definíció: Klasszikus valószínűségi mezőnek nevezzük a véges valószínűségi mezőt, ha minden elemi esemény egyenlően valószínű. Legyen 0={wpw2 , •••• ,w.} és 'ifi esetén P( w)= p. Ekkor azaz p=lfn. Például kockadobás esetén klasszikus valószínűségi mezővel van dolgunk feltéve, hogy a kocka ''tökéletes", azaz nem cinkelt. Ekkor minden szám dobásának azonos a valószínűsége: 1/6. Ha A= {~,w2 , •• •• ,wk}, akkor P(A) = k/n = "kedvező esetek száma/összes esetek száma". A kedvező és az összes elemi események számát általában kombinatorikai eszközökkel határozzuk meg. A számítógépek kitűnően alkalmazhatók véletlen kísérletek szimulációjára és MonteCarlo számítások végzésére. Az egyedüli fontos feltétel: jó véletlenszám (Eng. random number) generátorral kell rendelkeznünk. Egy számítógépen igen sok kísérletet tudunk végrehajtani rövid idő alatt. Ennek megfelelően a valószínűségelméleti problémák analitikus megoldásával kapott eredményeinket számítógépes szimulációval numerikusan ellenőrizni tudjuk. Sőt, akkor is meghatározhatjuk a helyes választ szimulációval, ha a probléma analitikus megoldása nincs a kezünkben. A Monte-Carlo módszer elnevezés NEUMANN Jánostól származik. A Il. világháború idején NEUMANN János és Stanislaw Marcin ULAM (1909-1984) matematikusok Los Alamos-ban tanulmányozták neutronok elnyelődését különböző anyagokban. Mivel a problémát analitikusan nem tudták megoldani, véletlen jelenségekre alapozott számítógépes szimulációval oldották meg a feladatot. A projektet titkosnak nyilvánították, s névvel kellett ellátni. NEUMANN és ULAM a Monte-Carlo nevet adták a projektnek, utalva a véletlennek a projektben játszott kruciális szerepére, valamint a véletlen és a szerencsejátékok kapcsolatára. 170
Defmíció: Az
~,~, ... ,A"
események összességét teljes eseményrendszemek nevezzük, ha
~+~+ ... +A"=OésA,Ai=0, hai:;t:j.
A:Zaz az n eseménytér egy tetszőleges partícióját teljes eseményrendszemek nevezzük. Legyen A és B két esemény, s P(B)> O. Végezzük el n-szer egymástól fiiggetlenül azt a kísérletet, amellyel ez a két esemény kapcsolatos. Legyen kB a B esemény gyakorisága, s kAB jelölje azt a gyakoriságot, amikor a B esemény mellett az A esemény is bekövetkezik. A kAB/kB hányadost az A esemény B eseményre vonatkoztatott feltételes relatív gyakoriságának nevezzük. Mivel k AB/n ~ P( AB) és kB/~ ~ P(B), ezért kAB _ kAB / n _ P(AB) - P(B) .
k;- kB j n
A P( AB)/P(B) hányadost az A esemény B eseményre vonatkoztatott feltételes valószínű ségének nevezzük, s P(A l B)-vel jelöljük (ejtsd: "P A vonás B"). Könnyen beláthatjuk a következő összefiiggések teljesülését: O::;;P(A l B)::;; l; P(B IB)=l; P(LA, l B)= _L P( A, l B) (A,Ai =0, ha i :;t: j). i
i
Defmíció: Az A eseményt a B eseménytől fiiggetlennek mondjuk, ha P( A l B)= P( A). Mivel P( A l B)= P( AB)/P(B), ezért P( AB)= P(A)P(B). Mivel ekkor P(B 1 A)= P( AB)/P( A)= P( B), így érdemesaszimmetrikus egyenlőséget elfogadni a fiiggetlenség definíciójaként P( AB)= P(A)P(B). Általában a feltételes valószínűségeket ismerjük és más események valószínűségét keressük: P(AB)= P( A l B)P(B).
Ennek a formulának az ismételt alkalmazásával belátható a következő összefiiggés: P(A1 ~ •••A") =P(A" l A1•••A"_1)P(A"_1 l A1•••A"_2 ) •• .P(~ l A1)P(A1), ahol az Ap ~, ... , A" események tetszőlege sek. Az előző fogalmak és eredmények alaposabb megértése érdekében tekintsünk egy példát! Példa: Legyen adott egy doboz, melyben 3 fekete és 5 fehér golyó van. A kísérlet abból áll, hogy visszatevés nélkül egymásután egy-egy golyót veszünk ki a dobozbóL Feltesszük, hogy a golyók- színüktől eltekintve- teljesen egyformák, s minden kivétel előtt jól összekeverjük a golyókat. Határozzuk meg a következő események valószínűségét: ~={az l. golyó fehér}; ~
= {a 2. golyó fehér};
A 1•2 ={mind az l ., mind a 2. golyó fehér}. Megoldás: A feltételeknek megfelelöen minden golyó húzásának ugyanakkora a valószí- · nűsége. Az eseményterünk 8 elemi eseményből áll, melyek válószínűsége azonos: 1/8. Az A1 esemény valószínűségét könnyen meghatározhatjuk: P(A1) =5/8, mivel 5 h kedvező elemi események száma és 8 az összes elemi esemény száma. Tudjuk, hogy A1,2 = ~~· Ennek 171
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
számításához a P(~ l~) feltételes valószínűség ismerete szükséges. A P(~ l A1) megadja annak az eseménynek a valószínűségét, hogy a 2. golyó fehér lesz, ha az l. fehér volt. Ha az l. golyó fehér, akkor 7 golyó marad a dobozban, melyek közül 4 fehér és 3 fekete. Tehát a feltétel bekövetkezése után más lesz az eseményterünk, s megváltozik a2: elemi események valószínűsége is. Annak a valószínűsége, hogymost fehér golyót veszünk ki 4/7, azaz .
Tétel: Ha a Bi'B2 , ... ,B. események teljes eseményrendszert alkotnak, továbbá Vi-re P(BJ >O, valamint A egy tetszőleges esemény, melyre P( A)> O, akkor
P(~ l ~)=4/7.
Ezek után az
~~
LP(A l BJP(BJ i=l
Bizonyítás: Tudjuk, hogy P(Bk l A) P( A)= P( A l Bk)P(Bk). Elosztva ezen egyenlet mindkét oldalát P(A)-val, kapjuk, hogy
esemény valószínűsége:
P(~~)=P(~ l ~)P(~) =*i=~~.
P(B
l A)= P(A l Bk)P(Bk) . P(A )
k
Az ~ esemény valószínűségének a számításához azt kell figyelembe vennünk, hogy ebben az esetben az l. golyó fehér vagy fekete lehet, azaz ~ =(~ n~)u(~c n~).
Mivel a zárójelben levő események egymást kizárják, ezért
Az) +P(~~).
P(~)= P(A1
Az első tagot már kiszámítottuk. A második tag számítása pedig hasonlóan történik az tagéhoz:
első
P(~~)= P(~ l ~c)P(~) = ~~ = ~78
P(BkiA)= ;O; fJ(x)dx=l. Az utóbbi azt jelenti, hogy a teljes értelmezési tartományra vett integrálja l . Az T/ valószínűségi változó eloszlásfüggvényét (Eng. probabi/ity distribution function) a következő
D(q)(= !!.q)= ( D2(q)
Határozzuk meg az előbbi dobókockás példánkban a q diszkrét valószínűségi változó várható értékét és szórását! Ha a q folytonos valószínűségi változó flx) sűrűségfüggvénnyel, akkor következőképpen definiáljuk az előbbi mennyiségeket: "' xj(x)dx "' = xf(x)dx; f(x)dx - oo .
J (;) =--:
J
J
"' 2 2 2 D (q) = (x-E(q) tJ(x )dx = (; )-(q) ;
összefüggés definiálja: F(x) =P(rt< x)=
J
D(q) = ~(q2)-(q)2.
f(x')dx'.
Ez azt jelenti, hogy F(x) az f(x) primitív függvénye. Az eloszlásfüggvény a következő tulajdonságokkal rendelkezik: F(-oo) =O, F(oo) =l és O< F(x) 1),
m-1 ami pedig nem más, mint a korábban bevezetett reziduális variancia.
b= 2.06438 ;t 0.04207
A linearitás mértékének a jellemzésére jól használható a lineáris korrelációs koefficiens, melynek definfciója: cov(X, Y) (37) rxr ahol m
L(Y~ - Y) ~ - -(38) s2 =..!::~-~ r m- l
202
mm
203
2
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
!{x -X}
(39)
Itt érdemes bevezetni a V variancia-kovariancia (vagy egyszerűen kovariancia) mátrixot is (lásd a 2-4. fejezetet). A kétparaméteres egyenessel végrehajtott lineáris regresszióra kapott (6) egyenletből fejezzük ki az ismeretleneket az A koefficiensmátrix inverze segítségéve!:
2
1
s; = ...::
11 ="-- - -
m-1
(!x y-(!x )(!y )1 m).
1 (40) cov(X,Y) = 1 1 1 1 m-1 1=1 i=1 1-1 Figyelembe véve a (3 8-40) összefüggéseket, a (3 7) lineáris korrelációs koefficiens-következöképpen adható meg:
Í:xt Y; ~(fx~)(f:Y1) lm.
(4 l) rxr =
i=1
fr x;m
1=1
frxt )2 lm
( m
(43)
t:'}
[:)=A-'(~:} d~:A)(_;,, t;'](
A V variancia-kovariancia mátrix következöképpen állítható elő:
1- 1
m
frYt2-
fr Y; )2 lm
(44)
( m
·
V=s.2A-I=de:·(A)
(
-Í:x] ~=l
m
21.
m
-_Lx ,Lx
1
1
i=l
A lineáris korrelációs együtthatóra fennáll a következő egyenlőtlenség: -l ~ r ~ l; tökéletesen lineáris kapcsolatesetén az értéke ±l (lásd a 2-4. fejezetet is). Számítsukki a lineáris korrelációs koefficienseket is a (41) formula alapján:
1=1
A V mátrix diagonális elemei a paraméterek becsült varianciáit, az off-diagonális elemek pedig a becsült kovarianciáit szolgáltatják:
r=-0.99435
(45) SE(O)=,/v,; =,,( det(A)r =',[ •
r=-0.99435
,
'm[.,Lx J]~
m,Lx
1 -
1
1=1
r=-0.99790 Jóllátszik a kiugró pont elhagyásának a jelentősége a lineáris korrelációs koefficiens értékén is. Természetesen, a kiugró pontokat nemcsak elhagyni, hanem újabb kísérletekkel helyettesíteni is lehet. A kiugró pontok felderítésének kérdése sok esetben problematikussá teszi az OLLS-módszer alkalmazását. Alternatívaként .a 1HEIL-módszert alkalmazhatjuk, melyet speciáJisan arra terveztek, hogy csökkentsék a kiugró pontok hatását az egyenes meredekségére és tengelymetszetére. A részletekért az irodalomra hivatkozunk: P. Glaister, Robust Linear Regression Using Theil's Method, J. Chem. Educ., 82, 1472 (2005). A kétparaméteres modell esetén egy másik korreláció (kapcsolat) problémája is felmerül: és a b paraméterek mennyire függenek egymástól? Az és a b paranevezetesen az méterek korrelációs együtthatóját a következő kifejezés definiálja (lásd a 2-4. fejezetet):
a
a
=
( 42) rab
cov(a,b)
D(a)D(b)"
Ennek a korrelációs koefficiensnek a jelentősége és a szerepe teljesen eltér az elözőétöl.Ez a két valószínűségi változó korreláltságát méri. Egyenest akkor is illeszthetünk azonban, ha a két paraméter erősen korrelált, igy az egyenes illesztése szempontjából a (42) összefüggésnek nincs jelentősége. A (42) számítására akkor van szükség, ha a paramétereket további számításokban. kívánjuk felhasználni, s hibaanalízist szándékozunk végezni (a hibaterjedés vizsgálata). A témával kapcsolatban Robert de LEVIE cikkét ajánljuk további tanulmányozásra: Two Linear Correlation Coefficients, J. Chem. Educ., 8, 1030 (2003). A kérdéses cikk az rxr lineáris korrelációs koefficiens (37-41) formuláit is értelmezi.
204
fx;
[
•=l
J
~
A kapott formulák azonosak a korábban meghatárowttakkal. (Lássuk ezt be!) A (47) összefüggés segitségével a paraméterek (42) korrelációs koefficiensét is meg tudjuk határozni. C. SLATER figyelemreméltó cikke analitikai kémiai alkalmazásokkal is foglalkozik: Error Analysis Using the Variance-Covariance Matrix, J. Chem. Educ., 77, 1239 (2000). A V mátrix lehetőséget nyújt azonban a hiba terjedésének a vizsgálatára is. Tegyük fel, hogy az F mennyiség az a és a b paraméterek függvénye. Ekkor az F mennyiség becsült hibája:
(48) SE(F) ahol
=[(grad F )r V (gradF)JI/2 =s, [ (grad F )r A- (gradF)JI/2 , 1
.
(49) gradF =
205
l
(a% a%: .
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
A (47) és a (42) formulák alapján határozzuk meg a kétparaméteres egyenesünk paramétereinek a becsült kovarianciáját és a becsült korrelációs koefficiensét:
kísérteti meghatározása úgy történik, hogy a motorra meghatározott U feszültséget adunk, majd mérjük a illotor által felvett I áramerősséget és a motor n fordulatszámát. A mérés során a feszültséget lépésenként növeljük. Míg a feszül~séget pontosan be tudjuk állítani, addig az áramerősség és a fordulatsz"ám meghatározása hibával terhelt. A jelen példában a ftlggö változónk a P0, a ftlggetlen változónk pedig az n. A Po értékét a következő formula segítségével számítjuk: (53) Po = U •I.
cov(a,b)=-0.00028 mm2 /golyó
r0r, =-0.88852 Látható, hogy a paraméterek közötti korreláció mértéke nem ad aggodalomra okot. Az OLLS-módszert azokban az esetekben is alkalmazhatjuk, amikor a ftlggetlen változónk értékét a ftlggö változóéhoz képest kicsi, azaz elhanyagolható hiba terheli. Előfordulhat az az eset is, hogy a ftlggetlen változóval nincs probléma, a ftlggö változónál azonban a hiba mértéke bizonyos értelemben ftlgg a ftlggetlen változótóL Ez utóbbi esetben a súlyozott lineáris legkisebb négyzetek (WLLS) módszerét (Eng. weighted linear least-squares method) hívhatjuk segítségül:
1=1
súlyfaktor lehetőséget nyújt számunkra az illesztésnél figyelembe vett pontok eltérő mértékű súlyozására [S.R. Logan: How to Determine the Best Straight Line, J. Chem. Educ., 72, 896 (1995)]. A súlyfaktorok értékét az y 1 értékek ai hibáinak ismeretében például következöképpen tudjuk megválasztani: l (51) w.=- v wi = • 2 ahol a
Wi
l
(ji
(ji
További súlyozási stratégiákról is olvashatunk az irodalomban [T.P. Kohman, Least-Squares Fitting ofData with Large Errors, J. Chem. Educ., 47, 657 (1970)]: l (52) W1 =--.
A feszültséget 1.9 V-tól változtattuk 4.6 V-ig 0.3 V-onként, és 10 ftlggetlen kísérletet (leolvasást) végeztünk minden feszültségértéken. A keverőlapátunk 75 mm széles volt. A mérési eredményekből a következő táblázatokat készítettük:
h/A
!JA
Is!A
MA
hlA
/g/A
NA
ft olA
0.130 0.131 0.135 0.140 0.146 0.147 0.148 0.151 0.152 0.160
0.123 0.131 0.125 0.136 0.132 0.137 0.136 0.141 0.140 0.145 0.147 0.149 0.148 ; 0.149 0.153 0.155 0.158 0.1 58 0.170 0.159
0.124 0.132 0.135 0.138 0.142 0.143 0.146 0.15 0.154 0.167
0.130 0.134 0.137 0.140 0.145 0.149 0.153 0.153 0.159 0.162
0.122 0.128 0.134 0.137 0.141 0.143 0.147 0.148 0.158 0.157
0.125 0.130 0.133 0.137 0.142 0.149 0.148 0.151 0.154 0.162
0.128 0.132 0.136 0.139 0.146 0.144 0.146 0.152 0. 158 0.163
0.125 0.133 0.136 0.140 0.143 0.152 0.152 0.153 0.154 0.159
0.132 0.132 0.136 0.139 0.143 0.144 0.147 0.153 0.154 0. 168
UN
n 11Hz
n:z/Hz
n31Hz
nJHz
ns!Hz
n61Hz
n1/Hz
ns!Hz
n. t".
(14)
p
l-k2) =
Az általános megoldást a sajátvektorok lineáris kombinációjával kapjuk meg:
[A]] [B] = [[C]
_k,_a/"'-' +pe-""' k2 -k,
r+ ___js_ ae-"'-' _5_ p k2
ki-k2 Figyelembe véve a kezdeti feltételeket, kapjuk, hogy a=[A]0 ;
. P= k,ki[A]o -k2 '
(a,p,y,4E R).
r= k, +k
2
[Alo·
k2
Ennek a deriváltja:
[~~~]=A[;]r =A[~~~]· e)J
[C]
[C]
Helyettesítsük be a kapott kifejezést a (14) egyenletbe:
[-k~ -~2 ~1 [~~~]=A[~~~]· 1
O
k2
O
[C]
a
222
k, ;'
(15)
k,
A~B~C; k_,
[C]
Egy közönséges mátrix sajátértékegyenlethez jutottunk, amit az 1-4. fejezet ismeretében könnyen megoldhatunk A sajátértékek és a megfelelő sajátvektorok:
lo):[;}
Ez pedig pontosan azonos a korábbi eredményünkkell A bemutatott mátrixalgebrai módszer csak elsőrendű reakciólépések esetén alkalmazható. Jó hír, hogy az általános esetre is közöltek mátfixalgebrai megoldást: M.N. Berberan-Santos, J.M.G. Martinho: The Integration of Kinetic Rate Equations by Matrix Methods, J. Chem. Educ., 67, 375 (1990). Tegyük egy kicsit bonyolultabbá az előbbi rendszerünket, s legyen az első lépés vagy mindkettő reverzibilis:
k,
(16)
k,
A~B~C. k_,
k_,
A (15) és a (16) reakciórendszerekről néhány könyv azt állítja, hogy nem oldhatók meg analitikusan, s különböző feltevésekkel ( előegyensúly, kvázistacionárius állapot, stb.) élve közelítő megoldásokat adnak. A valóság az, hogy ezek is megoldhatók analitikusan. Bonyo" lultabb reakciórendszerek esetén azonban érdemes numerikus módszert alkalmazni: R.R. Pavlis: Kinetics without Steady State Approximations, J. Chem. Educ., 74, 1139 (1997); W.D. Moebs, E.A. Haglund: A Simple Monte Carlo Method for Teaching Chemical Kinetics, J. Chem. Educ., 53, 506 (1976). Sebességi együtthaták kisérleti adatokból történő meghatározása a paraméterbecslés tudományának tárgykörébe tartozik (lásd a 2-5. fejezetet). A következőkben enzimkatalízissei foglalkozunk, és megpróbáljuk a lineáris és a nemlineáris legkisebb négyzetek módszerét alkalmazni enzimkatalitikus reakciók paramétereinek a becslésére.
223
Tasi Gyula: Matematikai kémia
;
Az enzimek a fehérjéknek leülönösen fontos csoportját képezik: az élő sejtek katalizátorai. A növényi és az állati szervezetekben végbemenő kémiai átalakulások enzimek jelentétét feltételezik. Az enzimek katalitikus aktivitásáért az ún. aktív centrum a felelős, amely a polipeptidlánc meghatározott részeinek különleges hajtogatottsága révén jön létre. Az enzimekre nagyfokú szubsztrát- és reakcióspecifitás jellemző, azaz csak meghatározott anyagok meghatározott átalakulását katalizálják. Egy enzimkatalitikus reakció első közelitésben a következő reakciósorozattal írható le: ~
(17)
k, .
ahol E az enzim, Sa szubsztrátum, ES az enzim-szubsztrátum komplex, és P a termék (R = 3, K = 4). A kérdéses reakciórendszert modellező üDE-rendszer a következő:
;:J=
Tasi Gyula: Matematikai kémia
(27) K M= k_l. kl Mivel a reakciórendszer sebességmeghatározó lépése az [ES]-komplex elbomlása, ezért a (21) egyenlet adja meg a reakció effektív sebességét: (28) r= d[P]=_ d[S] = k [ES]= k2 [S][E]0 V'"""[S] 2 dt dt KM +[S] K M+[S]' ahol (29) Vmax = k2[Elo·
E+S~ES~P+E, k_,
(18)
r
-'i+ r_1
=-kí
A (28) felírásánál figyelembe vettük, hogy (30) [S] 0 =[S]+[ES]+[P], így
[S][E] + k_1 [ES];
d[E] (19) ---;jf=-1j +r_1 +r2 =-kí[S][E]+k_1 [ES]+k2 [ES];
azaz (32)
(20)
d(!S] = 'i -r_1 -r2 =kí[S][E]-k_1 [ES] - k2 [ES]; (21)
d[P]= r2 = k2 [ES].
dt A kezdeti (t = O) feltételek a következők: [E] = [E] 0 -:t- O, (S] = [S]0 -:t- O, [ES] = [ES] 0 = O, és [P] = [P]0 = O. Most nem foglalkozunk a kérdéses rendszer analitikus megoldhatóságának a problémájával, hanem L. MICHAELIS and M.L. MENTEN -1913-ban publikált hipotézisét alkalmazzuk a probléma egyszerüsítésére [Michaelis, L, Menten, M.L.: Biochem. Z., 49, 333 (1913)]. A MICHAELIS-MENTEN-hipotézis szerint az ES-komplex gyorsan kialakul és a reakciórendszer sebességmeghatározó lépése a kérdéses komplex elbomlása. Ez matematikailag aztjelenti, hogy d[ES]/dt =O és k2 « k_1• Ennek megfelelően a (20) egyenlet következőképpen alakul: (22)
d[dES] =kí[S][E]-k 1 [ES]-k2 [ES]=O,
t
-
amiből
(23)
kí [SJ{[E]0 -[ES])= k_1 [ES]+k2 [ES] ,
hiszen [E]0 = [E]+[ES]. Fejezzük ki [ES]-t a (23) összefilggésböl: (24) [ES] = Mivel
~
kí [S][E]o k_1 +k2 +k1[S]
« k_1 , ezért (24) nevezőjében a k...1 mellett a k2 elhanyagolható:
d(P ] =- d(S].
dt dt A (28) egyenletet MICHAELIS-MENTEN-egyenletnek nevezzük. A kérdéses egyenlet két paramétert (KM és Vmax ) ta.I"tillmaz. Látható, hogy [S] ~ co esetén r ~ Vmax , azaz Vmax az enzimreakció maximális sebessége. A KM pedig az ún. MICHAELIS-MENTEN-állandó. Fizikaijelentése a következő összefilggésből egyértelművé válik:
(33) r= Vmax = Vmax[S] ' 2 KM+[S] amiből KM =[S] következik. Ez azt jelenti, hogy KM azzal a szubsztrát-koncentrációval
egyenlő, amelynél az enzimreakció sebessége a maximális érték fele. Az enzimreakció sebességét a két paraméter együttesen határozza meg. Az irodalomban többféle módszert publikáltak a két paraméter értékének kisérleti adatokból történő becslésére. A következökben foglalkozzunk egy kicsit ezekkel a paraméterbecslési módszerekkel! Leggyakrabban a (28) összefilggés valamilyen linearizált formáját alkalmazzák. Ezek közül válasszuk ki az egyiket: l KM l l (34) - = - - + - . r Vmax [S] Vmax Míg az eredeti (28) összefilggés közvetlen alkalmazása nemlineáris paraméterbecslést igényel, addig a (34) forma már lineáris regresszió végrehajtására alkalmas (1/r vs.lj[S]). Az y-tengelymetszet 1/Vmax, az x-tengelymetszet pedig -1/KM. A meredekség pedig a két paraméter hányadosa. A viszonyokat a következő ábra szemlélteti:
(25) [ES]"" kl [S][E]o . k_t +kí[S] A (25) összefilggés számlálóját és nevezőjét osszuk el k 1-gyel: (26)
[ES]"" [S][E]o , KM+[S]
ahol ·
224
225
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Hogyan határoztuk meg a reciprokmennyiségek becsült hibáit? Ehhez csak a 2-5. fejezet (48) formuláját kellett alkalmaznunk
Dz
([~]l= (d~S] [~])Dz ([sJ)( d~S] [~])=D~~~~]),
amiből
SE {l/[SJ}=
~Dz (
l ) = SE([S]).
[S]
[S] 2
Az llresetén hasonló módon történik a számítás: SE (l/ r)=
A lineáris regresszió végrehajtásánál azonban óvatosan kell eljárnunk! A 2-5. fejezetben részleteiben foglalkoztunk a lineáris regresszió kérdésével. Ott megmutattuk, hogy az OLLSmódszer a legritkább esetben vezet kielégítő megoldáshoz. Tekintsünk egy irodalmi példát, majd alkalmazzuk a 2-5. fejezetben tanultakat! A következő kisérleti adatok D.P. CHONG cikkébenjelentek meg [D.P. Chong: On the use ofleast squares to .fit. data in linear form, J. Chem. Educ., 71,489 (1994)]: [S]
SE([S])
r
SE(r)
0.138 0.220 0.291 0.560 0. 766 1.460
0.011 0.015 0.017 0.028 0.031 0.044
0.148 0.171 0.234 0.324 0.390 0.493
0.015 0.015 0.019 0.023 0.023 0.025
A táblázatban szereplő mennyiségek dimenziójával az egyszerűség kedvéért ne foglalkozzunk. Hasonlóan azzal sem, hogy milyen enzim milyen reakciójáról van szó. Most kizárólag a csupasz számadatok érdekelnek bennünket. Az [S] a szubsztrátum koncentrációja és az r a kezdeti reakciósebesség. A táblázat tartalmazza a becsült experimentális hibákat is. Az 1/r vs. l/[S] lineáris regresszió végrehajtásához a táblázat adataiból további adatokat kell előállítanunk:
1/[S]
SE {l/[SJ}
1/r
SE(l/r)
7.2464 4.5455 3.4364 1.7857 1.3055 0.6849
0.5776 0.3099 0.2008 0.0893 0.0528 0.0206
6.7568 5.8480 4.2735 3.0864 2.5641 2.0284
0.6848 0.5130 0.3470 0.2191 0.1512 0.1029
226
~D2 u·J = S~~r).
Az előző két táblázat alapján már kivitelezhetők a paraméterbecslések. Nézzük először a (34) kétparaméteres egyenessel végrehajtott lineáris regressziók eredményeit (lásd a 2-5. fejezetet):
Módszer
Paraméterek
OLLS
KM =0.4406 Vmax = 0.5853 r=0.97912
WLLS [(2-5.64) súlyfaktorokJ
K M =0.5552 Vmax = 0.6715 r=0.98928 KM =0.5343 Vmax = 0.6552 K M =0.5671 Vmax = 0;6773 r=0.98983 KM=0.5721 vmax = 0.6797
WLLS (Kohman) GLLS (iteratív)
GLLS (szimplex)
A táblázat alapján a következő megállapításokat tehetjük. Nem meglepő módon a legrosszabb eredményt az OLLS-módszer, a legjobbat pedig a GLLS-módszerek szolgáltatják. Az utóbbiak közül pedig a szimplex-eljárás révén kapott a pontosabb. Az eredmények az mutatják, hogy lineáris regressziónál fontos figyelembe vennünk mindkét változónk hibáját, amennyiben azok rendelkezésünkre állnak. Az OLLS-módszerrel és a WLLS-módszerrel [(2-5.64) súlyfaktorok, szaggatott vonal] kapott eredményeket bemutatjuk grafikusan is:
227
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Látható, hogy a paraméterek, ha kismértékben is, de különböznek! Határozzuk meg az eltéréseket: KM :2.4% és Vmax : 0.8%. A további részleteket illetően a korábban már említett kitünő irodalomra hivatkozunk: D.P. Chong: On the use of /east squares to fit data in linear form, J. Chem. Educ., 71, 489-(1994).
7
-3
·2
·1
o
3
4
6
1/[S]
A kettő közötti különbség jól látható. A GLLS-eredmények pedig még jobban eltérnek· az OLLS-eredménytől. Sajnos, a reciprokmennyiségekre még a GLLS-módszerrel végrehajtott lineáris regresszió eredménye is a priori eltér a (28) összefüggés közvetlen felhasználásával vérehajtott nemlineáris ·regresszió eredményétőL A következő táblázat a (28) függvénnyel kapott eredményeket mutatja nemlineáris regressziót végezve: Módszer
Paraméterek
OLS
KM =0.5965 Vmax = 0.6904 KM =0.5869 vmax =0.6849 KM =0.5860 Vmax = 0.6854
WLS [(2-5.64) súlyfaktorokl GLS (szimplex)
A célfüggvény minimalizálását a szimplex-eljárással végeztük el. Látható, hogy ebben az esetben a különböző módszerekkel kapott eredmények sokkal kisebb mértékben térnek el egymástól. Vessük össze a lineáris és a nemlineáris regressziók legjobb eredményét egymással: Módszer
Paraméterek
GLLS (szimplex)
KM = D.5721 Vmax = 0.6797 KM = 0.5860 Vmax = 0.6854
GLS (szimplex)
228
229
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
2~7. A variációszámítás alapjai
tették a differenciálhányados (derivált), valamint az integrál (antiderivált) végtelenül kicsiny mennyiségektől független fogalmát NEWTON és LEIBNIZ infinitezimális analízisét ezzel teljesen száműzték a matematikai analízisbőL Létrejött a matematikai analízis ún. sztenderd (standard) formája (Eng. standard analysis). Elevenítsük fel például, hogy a standard analízis szerint hogyan definiáljuk az y= f(x) függvény x 0 pontban való folytonosságát!
A matematikai analízis- a ·klasszikus mechanika (fizika) matematikai nyelve- a XVII. században alakult ki Isaac NEWTON (1642-1727) és Gottfried Wilhelm LEIBNIZ (1646-1717) munkássága révén. Ha azonban valaki NEWTON fő műve, a Principia mathematica philosophiae naturalis (A természetfilozófia matematikai alapjai, 1687) alapján szeretné megismerni a matematikai analízis alapjait, akkor csalódást érezne, mivel a műben az infinitezimális (végtelenü! kicsiny) mennyiségekről egyetlen egy szó sem esik. NEWTON az euklidészi véges geometria módszereit alkalmazta a mű megírásakor kihagyva az infinitezimálisokat a tárgyalásbóL A Principia egyébként is igen nehéz olvasmány: tömör, nem tartalmaz ismétléseket. Ennek ellenére igen sok nyelvre lefordították az idők folyamán. Hogy miért mellőzte NEWTON az infinitezimálisokat az alapmű megírásakor? A magyarázat az, hogy igen érzékeny ember volt: félt, hogy az infinitezimálisok esetleges alkalmazása miatt szakmailag megtámadnák. Végül is LEIBNIZ dolgozta ki részleteiben a differenciál- és az integrálszámítás infinitezimálisokra épülő technikáját és jelölésrendszerét Az infinitezimális, azaz a végtelenül kicsiny, de nem nulla mennyiség és a végtelen fogalmát még EUKLIDÉSZ és ARISZTOTELÉSZ száműzte a geometriából és a logikából. ARKIIIMÉDÉSZ is elvileg tagadta az infinitezimálisok létét, a gyakorlatban azonban alkalmazta ő~et! Segítségükkel ugyanis sokkal gyorsabban tudott eljutni alapvető összefüggésekhez, mmt hagyományos eszközökkel. (Az infinitezimálisok használatáról "A módszerrőf' cfmű művében írt. Ez a . mű teljesen ismeretlen volt egészen az 1906-os felfedezéséig.) ARKIIIMÉDÉSZ módszere, amellyel sikerült elkerülnie az infinitezimálisok használatát a nyilvánosságnak szánt írásaiban, igen hasonló volt a XIX. századi matematika "epszilondelta" módszeréhez. A legnagyobb probléma az infinitezimálisokkal, hogy nem rendelkeznek a valós számok ún. arkhimédészi tulajdonságával, e szerint ugyanis egy nagyon pici nemnulla szám is akármilyen naggyá válik, ha elegendően sokszor adjuk hozzá önmagához. Nézzünk egy egyszerű geometriai példát a2: infmitezimálisok használatára a XV. századból! Állapítsuk meg, hogy a kör területe hogyan viszonyul a kerületéhez! Az egyszerű ség kedvéért vegyünk egy egységsugarú kört, s osszuk fel a körvonalat végtelen sok, azonos hosszúságú, infinitezimális (dx) egyenes szakaszra. Összekötve a szakaszok végpontjait a kör középpontj ával, infinitezimális háromszögeket kapunk, amelyek területe: dt =l· dx/2. Ha vesszük az összes infinitezimális háromszög területét, akkor a kör területét kapjuk: t=oo·dx/2. A kör kerülete pedig nem más, mint az infinitezimális szakaszok hosszának az összege: k = oo • dx. Ezek alapján a terület és a kerület arányára t oo·dx/2 l -=---=k oo·dx 2 adódik. Láthatjuk, hogy a furcsa okoskodásunk jó eredményre vezetett. Felmerül a kérdés: Hogyan lehetséges, hogy helytelen okoskodással mindig a korrekt eredményhez jutunk? A XIX. századi matematikusok - többek között Baron Augustin Louis CAUCHY (17891857), Niels Henrik ABEL (1802-1829), Peter Gustav Lejeune DIRICHLET (1805-1859), Karl WEIERSTRASS (1815-1897), Richard DEDEKIND (1831-1916), Georg CANTOR (1845-1918), Bernhard BOLZANO (1781-1848) - úgy gondolták, hogy véglegesen száműzik az infinitezimálisokat a matematikából. Bevezették a határérték fogalmát és erre építve megterem230
A folytonosság CAUCHY-féle definíciója: Az f(x) függvény folytonos az x 0 pontban, ha minden pozitív e számhoz megadható egy olyan pozitív t5 = t5(e, x 0 ) szám, hogy 0 < t5 esetén lf(x)- f(x0 )i O, ezért o y előjele y"(x) előjelétől fiigg. Tudjuk, hogystacionárius pont ese~ tén y'(x) előjele eldöntheti, hogy az x helyen minimum (y'(x)>O), vagy maximum (y"(x) O elégséges feltétele a minimumnak, de nem szükséges. 2
2
o
Tekintsük pl. az y =x4 függvényt. A függvény első, második .és harmadik deriváltja: 3 y'(x) = 4x , y'(x) = 12x2, y•(x) = 24x. A kérdéses függvénynek az x= O hely stacionárius pontja: y'(O) =O. Vizsgáljuk meg a második derivált előjeiét ebben a pontban: y"(O) =O. Ennek ellenére a függvénynek az x = O helyen minimuma van. Ezt beláthatjuk abból, hogy x< O esetén y'(x) O esetén y'(x) >O, azaz a függvény növekszik. Tehát az y'(x) függvény az x= O ponton áthaladva előjelet vált. A kérdéses előjelváltás minimumot jelez. Érdemes megemlíteni, hogy az y'(x) függvény szélső értékhelyei az y(x) függvény inflexiós pontjai. Tehát a 2y =O A 3y i' O elégséges feltétele az inflexiós pont létének, de nem szükséges. Az előbbi példában y'(O) =O és y•(o) =O, azonban x< O esetén y'(x) >O és x> O esetén y"(x) >O. Tehát az y'(x) függvény nem vált előjelet az x= O ponton áthaladva, így a kérdéses pont nem szélsőértékhelye az y'(x) függvénynek, azaz nem inflexiós pontja az y(x) függvénynek Az y= x 4 függvény a teljes értelmezési tartományában (alulról) konvex.
o
232
o
a2J
axay
axaz
a2J ()y2
a2J ayaz
a2J
a2J
azax
azay
a2J az2
a2J
3!
Ha ox kicsi, akkor
a2J
ayax
H=
y(x+ox)- y(x)= y'(x) ox+.!. y'(x) (oxi+_!_ y•(x) (ox) 3 + ... 2
aJJ[!;)=(Vf/ •o=(gradf/ •o, az oz
aj ay
A HESSE-mátrix valós szimmetrikus mátrix, azaz hermitikus. (Ludwig Otto HEssE, 18111874 német matematikus.) Egy hermitikus mátrix minden sajátértéke valós szám és a külö~böző sajátértékekl:lez tartozó sajátvektorok ortogonálisak egymásra (lásd az 1-4. fejezetet). Az f függvény második variációja - a fenti formula alapján - egy kvadratikus alak. ~ of = OA 8 2 f > O elégséges feltétel a minimum létezéséhez. Az f függvény másodtk variációjának megfelelő kvadratikus alak pontosan akkor pozitív defmit ( ~f > O), ha a HESSE-mátrix minden sajátértéke pozitív. A of = OA 0 2f < O elégséges feltétel a maximum létezéséhez. Az/függvény második variációjának megfelelő kvadratikus alak pedig pontosan akkor negatív defmit (82 f< O), ha a HEssE-mátrix minden sajátértéke negatív. Ha a HEssEmátfix minden sajátértéke pozitív egyet kivéve, ami negatív, akkor elsőfajú nyeregpontról (Eng. first-order saddle point) beszélünk. Két negatív sajátérték esetén másodfajú nyeregpontról van szó, s így tovább. Tehát a HESSE-mátrix sajáértékeinek analízisévellehetőségünk adódhat a stacionárius pontokjellegének a megállapítására. Az elmondottak illusztrálására vizsgáljuk meg a következő kétváltozós függvényt (E.K.P. Chong, S.H. Zak: An Introduction to Optimization, Wiley, New York (1996)):
f(x,y)=3(l-x) exp{ -X2 _:(y+ln-10(~-x3 - y )exp(-x - y )2
exp{ -(x+1)
4
2 -
y
2
},
3 ami geometriailag egy felületnek felel meg a 3-dimenziós térben:
233
2
2
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia b
I[f(x)] = jQ[J(x)] dx. a
Ekkor az !If(x)] funkcionálfszerinti első variációja:' b
b dQ
a
a
öi= Jöndx=f-~töfdx.
if
Tekintsük a következő speciális funkcionált: .r,
![y]= jF(x, y,y') dx.
"'
Látható, hogy a kérdéses tartományban (x E [-2, 2] 1\ y E [-2, 2]) a fiiggvén)rnek három maximuma (M1-M3), két minimuma (m1.mz) és három elsőfajú nyeregpontja (s 1-s3) van. A fiiggvény 2-dimenziós ún. kontúrvonalas (szintvonalas, nívóvonalas) ábrázolásán a kritikus pontok jobban felismerhetők: y----~----~--------~~ ~
~~ ,@l s, ~ 0 ,
av;
-2
Variáljuk az y fiiggvényt úgy, hogy öy( x1) = öp(x2 ) = O, azaz a végpontokban ne legyen variáció és az I funkcionált tegyük stacionáriussá. Az előzöek alapján irhatjuk:, hogy
''dF "tdy
Határozzuk meg az F fiiggvény y szerinti teljes deriváltját: dF =aF+ aF dy' =aF+ aF~ dy =aF+ aF~ . dy ()y ()y' dy ()y ()y' dx dy ()y ()y' dx Helyettesítsük ezt be az I funkcionál első variációjára kapott kifejezésbe és integráljunk parciálisan:
' 'J{aF d}. őydx Öl=
b
I[f(x)] = jf(x)dx. a
Az lff{x)] funkcionál értéke tehát azj{x) függvénytől függ. Állítsuk elő a kérdéses funkcionál első variációját azj{x) fiiggvényt variálva: b
b
b
öl= jU+öf)dx-jfdx = jöfdx. a
a
a
Tovább bonyolódik a helyzet, ha az integrandusz maga is egy funkcionál: 234
aF ()y +é)y'dx
=[~öyi + } ( : - !~)őydx=O. Az első tag nulla, hiszen a végpontokban nincs variáció. A második tag csak úgy lehet nulla tetszőleges őy mellett, ha az integrandusz azonosan nulla, azaz
-1
Az j: IRn ~IR függvény adott c E IR értékhez tartozó nívóhalmazát (Eng. level set) a következő összefüggés értelmezi: S = {P E IR" l f(P) =c}. Amíg egy kétváltozós függvény esetén az S halmaz geometriailag egy vonalnak, addig háromváltozós esetben egy felületnek felel meg. Többváltozós függvények stacionárius pontjainak a meghatározására érdemes számítógépet használní. A szimplex-eljárás ún. közvetlen kereső módszer: az eljárásnak·csak függvényértékekre van szüksége (lásd az F.2-3. függeléket). A módszer robosztus: tetszőleges függvény esetén alkalmazható. Eddig közönséges függvényekkel foglalkoztunk. Most tekintsünk egy funkcionált:
.
ől= j-öydx=O.
'~
~aF _aF =F~ .y'+F'.y'+F'. _aF =O. dx ()y'
()y
yy
yy
xy
()y
Ezt a másodrendű differenciálegyenletet másodfajú LAGRANGE-egyenletnek nevezzük. A későbbiekben mellékfeltételek.mellett fogjuk funkeionálok szélsőértékét keresni. (Eng. constrained optimization, minimization, maximization). A hagyományos függvényanalízisben feltételes szélsőérték meghatározására bevált ÚIJ.. LAGRANGE-féle multiplikátoros módszer (Eng. Lagrangian undetermined multiplier method) a variációszámításban is kitünöen alkalmazható. A módszer alkalmazásánál az eredeti függvény helyett egy olyan új segédfüggvényt vezetünk be, melynek a szélsőértékét a szokásos módon, azaz mellékfeltétel figyelembevétele nélkül tudjuk meghatározni. Nézzük meg részleteiben a módszert a legegyszerűbb esetben! Határozzuk meg a z= f(x,y) függvény maximumát a g(x, y)= O mellékfeltétel mellett. Tegyük fel, hogy a maximum az (i*,y*) pontban van, és a g(x,y) =O mellékfeltételböl ki tudjuk fejezni y-~ mintx függvényét: y=u(x) (legalábbis x= x* közelében). Így a · z= f(x,u(x)) függvény stacionárius pontját kell meghatároznunk. A kérdéses függvény x szerinti teljes deriváltjának el kell tűnnie:
235
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
dz= dj + dj du =O dx dx dydx ' amiből- feltéve, hogy dj fiJy :F- O -kapjuk, hogy
és ennek kell meghatároznunk az extrémurnát A módszer illusztrálására tekintsünk egy egyszerű példát!
du=- djldf. dx dx dy Azonban g(x,u(x)) =O összefüggésünket is deriválhatjuk:
dg = dg + dg du = 0 azaz dx dx ()ydx '
Példa: A 2s kerületű háromszögek közül határozzuk meg azt, amelyiknek legnagyobb a területe. Megoldás: A háromszög oldalai legyenek x, y, z és kerülete: 2s =x+ y+z. HERON képlete szerint a háromszög területe következőképpen adható meg az oldalai segítségéve!:
t(x,y,z) =~s(s -x)(s- y)(s~z).
du , dg = -dg/dg - (felteve,hogy -::F-0).
dx dx iJy ()y Az u'(x)-re kapott összefüggéseinket egyenlővé téve, kapjuk, hogy
djldf = dg/dg azaz dx dy dx iJy' dj/dg = djldg =-A. dxdXdydy. Ezek alapján írhatjuk, hogy
df =-A. dg dx iJx' iJf =-A iJg. dy dy
A t maximumát úgy kell meghatároznunk, hogy a g(x, y, z)= x+ y+ z- 2s =O mellékfeltétel teljesüljön. A t helyett tekinthetjük a t 2 függvénYt is, mivel a két függvénynek egybeesik a maximuma:
f(x,y,z) = [t(x,y,z)]2 • Ennek megfelelően képpezzük a LAGRANGE-féle módszer alkalmazásához szükséges új segédfüggvényt:
F(x,y,z,A.) =f(x,y,z)+A.g(x,y,z) =s(s-x)(s- y)(s-z)+A.(x+ y+z-2s),
azaz a mellékfeltétel A.-szorosát hozzáadjuk az eredeti függvényünkhöz (A, a még egyelőre ismeretlen LAGRANGE-féle multiplikátor). Az F(x,y,z,A) függvény mellékfeltétel nélküli szélsőértékhelye megegyezik az f(x,y,z) függvény mellékfeltétel melletti szélsőérték helyével. A maximum létezésének szükséges feltétele az F(x,y,z,A.) függvény első variációjának az eltűnése:
iJF
iJF
. iJF
iJF
őF =-Őx+-Őy+-Őz+-őA. dx dy dz ()A,
Átrendezve a kapott összefüggéseket:
a
= F'őx+F'őy+ F'őz+ F:oA. =O Y
dx (f +A,g) = 0'
Z
X
A
Mivel a variációk tetszőlegesek, mindegyik koefficiensnek el kell tűnnie:
a
dy (f +A-g) =0,
F; =-s(s- y)(s- z)+A. =O;
azaz az F(x,y,A,) = f(x,y)+A.g(x,y) függvénynek is stacionárius pontja van. Ezzel a mellékfeltétel melletti optimalizálási problémát közönséges optimalizálási feladattá redukáltuk. A A-t LAGRANGE-féle multiplikátomak nevezzük. Tehát a három ismeretlen meghatározása érdekében a következő három egyenletet kell megoldanunk:
F; =-s(s -x)(s-z)+A. =O;
iJF = iJj +A iJg =O· dxdx dx' aF = df +A, dg dydy dy
F; =x+ y +z-2s =0. Tehát kapjuk, hogy
x=y=z=
'
()A,= g(x, y)= O.
A módszer nagyszerűsége abban rejlik, hogy könnyen általánosítható több változó és több mellékfeltétel esetére. Tegyük fel például, hogy az f(x,y,z) függvényt kell maximalizálnunk (minimalizálnunk) a g 1(x,y,z)=O és a g 2 (x,y;z)=O mellékfeltételek mellett. Ekkor a következő segédfüggvényt kell képeznünk: F(x,y,z,~,A.J == f(x,y,z)+~ g 1 (x,y,z)+ ~ g 2 (x,y,z),
(s -x)(s- y)= (s-x)(s-z) =(s- y)(s-z),
azaz
=O·
()F
236
F; = -s(s -x)(s- y)+A. =O;
2s
3.
Végül is azt kaptuk, hogy az egyenlőoldalú háromszögnek a legnagyobb a területe. Most már meghatározhatjuk A. értékét is: s3
A =s(s- y)(s -z)=-. 9
Tekintsük most azt az esetet, amikor a funkcionálunk két egyidejűleg variáljuk:
237
függvénytől
is függ, és azokat
T asi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia b
I[ypy2 ]= JQ[y1(x),y2 (x)]dt, a b
,
Öl[ypy2 ]= fön[ypy2 ]dt=
an } J{an dy, Öy + dyz Öy dt. b
1
2
sok fontos alkalmazásban valós változójú, komplexértékű .fiiggvényekkel ( lfF : R ~ C ) van dolgunk. Határozzuk meg például a következő funkcionál első variációját úgy, hogy mindkét fiiggvényt variáljuk:
Ezen
az S entrópia maximumának a meghatározása az M betöltési számok variálásával. A következő mellékfeltételeink vannak: N= L N 1 =állandó;
E=LAN1 =állandó.
túlmenően
j
azaz a részecskék összes száma és összes energiája állandó. A 2-4. fejezetben megmutattuk, hogy n gN' n gN1 WMB(NpN2 , ••• ,N.) = N!IJ-1- =NNIJ ---71:· 1 t=! N1 1=1 N1 •
h
(VF~IIfF1 ) = JlfF; (x) Vf/x)dt. a
A lfF1 : R
~C
fiiggvényt következöképpen írhatjuk fel: !f11(x) = a1(x)+ ib1(x),
ahol al'b1 :R~ R és í =-1. Hasonlóan ljF1 (x) = a/x)+ib1 (x). Ezek alapján írhatjuk, hogy
A BOLTZMANN-egyenlet szerint a rendszer entrópiája:
S=klnWMB
2
lfF; lfF1 = ( a1 -ib1 ) ( a1 + ib1 ) = a1a1 +b1b1 +i( a1b1 -b1a1 ). Érdemes megemlíteni, hogy !f11 variálása esetén lfF; is variálódik, s ráadásul fiiggetlen módon:
lfF; = a1 - ib1; OlfF1 = oa1 +i ob1;
Az S első variációja:
n[a1,bpa1 ,b1 ] = a1a1 +b1b1 +i( a1b1 -b1a1 ), és az al'b1,a1 ,b1 fiiggvényeket variáljuk. Az könnyen meghatározhatjuk:
n
os
--=-'Llng1 ÖN1 + LlnN1 ÖN1• k j j A mellékfeltételek figyelembevételére a LAGRANGE-féle multiplikátoros módszert alkalmazzuk:
öS = .[ lnN; ÖN;- L:tngj oNl +aL: oN;+ PL: e; ÖN;
OlfF; = ( ÖlfF1 )* = oa1 -i ob1• Míg a ÖlfF1 és a Ö!fl; variációk moclulusa azonos, addig a fázisuk különbözö, így egyikük sem állítható elő a másik konstansszorosaként! Ezek után határozzuk meg a ( lfF1 IVF1 ) első variációját! A fenti formutánkban szereplö n ekkor a következő alakú lesz:
=k(NlnN- ~N1 1nN1 + ~N1 1ng1 ).
l
ahol a és p a LAGRANGE-féle multiplikátorok. Mivel a ÖN1 -k fiiggetlenek egymástól, ezért az előző összefiiggés csak úgy teljesülhet, ha
ln N 1 +a+ p e1 =O ('Iti-re).
funkcionál szükséges parciális deriváltjait
gl
Tehát azt kapjuk, hogy
an
.
ahol A=e-a. Határozzuk meg először az A, azaz a értékét:
-a =a -zb a. . 1
1;
J
N= LN1 =ALg1 e-pe';
Ezek alapján írhatjuk, hogy
l
öD.= ( a1 +ib1 )oa1 +(b1 -ia1 )öb1 +(a1 -ib1 )oa1 +(b1 +ia1 )ob1 = lfF1 oa1 - ilfF1 8b1 + V'; öa1 + ilfF; ob1 =
VFA Oa; - iöbl) +V'; (oaj+ iobj) ~
. .
~
= !f11 u1fF1 + 1fF1 u !flr Tehát
A=
j
N =N Lg; e-/Je, a,
ahol cr-t állapotösszegnek nevezzük Látható, hogy a = a(P). Mostmár csak fi-t kell meghatároznunk! Egyszerű manipulációkkal a következő kifejezés adódik az S entrópiára:
S=kfJU+k Nln a,
o(V'~IV'1 ) =(oVI; IV'1 )+(!flt lö!fl1 ) . A fejezet zárásaként határozzuk meg a MAxWELL-BOLTZMANN-eloszlásnak elegettevő gáz részecskéinek az egyensúlyi energiaeloszlását (lásd a 2-4. fejezetet)! A tényleges feladat 238
ahol E helyett a belső energiára vonatkozó hagyományos U termodinamikai jelölést hoztuk be. A termodinarnikából tudjuk (lásd a 2-2. fejezetet is), hogy
239
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
(:~l=~=:~~~Az entrópiára vonatkozó összeftlggésünk alapján dS
dfl
=kU +kflau +kNI_ au · ap u ap au au =kU+kfJ ap-kU=kfl ap·
mivel
Ezek alapján
as) =!=kflau ap =kfl. (au v r ap au Ebből pedig fl-ra
a következő egyszerű összeftlggés adódik: l
fl= kT.
Hasonló módon vezethetők le a FERMI-DlRAC és a BasE-EINSTEIN statisztikai eloszlásmodellek esetén is az egyensúlyi energiaeloszlási formulák.
2-8. A klasszikus mechanika mint poézis A klasszikus mechanika makroszkópikus testek kis sebességgel történő mozgását írja le. Törvényeinek megalkotásánál ugyanis csak ilyen mozgásokat tudtak kísérletileg tanulmányozni. Ennek következtél5en a klasszikus mechanika törvényei csak közelítőleg érvényesek: mind a sebesség növelésével, mind a méret csökkenésével egyre inkább nyilvánvalóvá válnak a korlátai. A relativisztikus mechanika és a kvantummechanika a XX. század elején születtek meg azután, hogy a XIX. századi klasszikus flzika törvényei alapján nem sikerült néhány flzikai jelenséget megmagyarázni. Mindkét elmélet hat~esetként tartalmazza a klasszikus mechanikát. A kvantummechanika esetén azonban már az alapok lerakásánál szükség van a klasszikus mechanika formalizmusára. Ráadásul, nem is a newtoni mechanika, hanem a variációszámításra épülő- Leónhard EULER, Joseph Louis LAGRANGE és William Rowan HAMILTON által kidolgozott - ún. analitikus mechanika szükséges. D' ALAMBERT a kérdéses formalizmust-matematikai szépsége miatt- poézisnek nevezte (Jean Baptiste le.Rond o' ALAMBERT, 1717-1783, francia matematikus-fizikus). A NEWTON által felépített klasszikus ·mechanika axiómarendszere minden középiskolás számára ismert: (l) a tehetetlenség törvénye: inerciarendszerben minden magára hagyott test nyugalomban van vagy. egyenesvonalú egyenletes mozgást végez; (2) az erő dinamikai törvénye: F =ma, ahol'F a testre ható erők eredője, m a test állandó tömege és a a test gyorsulása; (3) a hatás-ellenhatás (akció-reakció) törvénye, ami azt fejezi ki, hogy két test kölcsönhatásakor az egymásra ható erők egyenlő nagyságúak, de ellentétes irányúak és (4) az erők vektorokként összegződnek (paralelogramma-szabály). A törvényekben eredetileg testekről volt szó, azaz NEWTON kerülte a tömegpont fogalmának a használatát Az absztrakt tömegpont ugyanis magában hordozza az infinitezimális fogalmát Napjainkban azonban a tömegpont (anyagi pont, részecske) fogalma elfogadottá vált, s nyugodtan használhatjuk a tudományban. NEWTON néháfiy flzikai fogalom deflníciója után a következőkkel indítja a Principia című könyvét [angol fordítás: Andrew Motte és Florian Cajori, Berkley: University of California Press (1934)]:
·r do not define time, space, place, and motion, as being weil
known to ali. Only I must observe, that the common people conceive those quantities under no other notions but from the relation they beor to sensible objects. And thence arise certain prejudices, for the removing of which it will be convenient to distinguish them into absolute and relative, true and apparent, mathematical and common."
NEWTON végig hitt az abszolút térben, az abszolút időben és az abszolút mozgásban. Formalizmusának nehézkessége abból fakad, hogy az erősen kötődik a DESCARTES-féle derékszögű koordinátarendszerhez; minden részecske mozgásának a leírásához három differenciálegyenletet kell felími, melyek megoldásához három erőkomponenst kell megadni. Ezek után, ha egy adott időpillanatban ismerjűk az összes részecske helyét és sebességét, akkor a differenciálegyenlet-rendszer megoldása révén egy tetszőleges későbbi időpillanatban is meg tudjuk adni azokat. Ez a newtoni determinizmus elve (Eng. Newton 's principle of determinacy). A következőkben szakítunk a DESCARTES-féle koordinátarendszerrel, tetszőle-
240
241
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
ges ún. általános (általánosított) koordinátákat (Eng. generalized coordinates) fogunk alkalmazni, és a newtoni axiómák helyett egyetlen egy axióma teljesülését fogjuk feltételezni. A szabadon mozgó tömegpont helyzetének a leírására az lR 3 euk:lidészi vektorteret alkalmazhatjuk (lásd az 1-5. fejezetet). Az lR 3 tér minden egyes pontja a részecske egy lehetséges helyzetének felel meg. Ennek megfelelően a szabad részecske szabadsági fokainak a száma 3, mivel 3 koordináta rögzítése szükséges a részecske helyzetének egyértelmü megadásához. N darab szabadon mozgó · részecske esetén a szabadsági fokok száma 3N, ugyanis ennyi koordináta szükséges a rendszer helyzetének egyértelmü megadásához. A tapasztalat azt mutatja, hogy egy s szabadsági fokkal rendelkező tömegpontrendszer esetén a általános koordináták és a
q=(qPq2, ... ,q, )
(2)
általános sebességek (Eng. generalized velocities) egyértelműen meghatározzák a (3)
ii=(qPij2, ... ,q, )
általános gyorsulásokat (Eng. generalized accelerations) a mozgásegyenletek (Eng. equations
ofmotion) által:
A (7) egyenletrendszer s darab másodrendő differenciálegyenlet az s darab ismeretlen q1 (t)re nézve. A megoldások· összesen 2s darab tetszőleges állandót tartalmaznak. Ha egy adott időpillanatban ismerjük a q-t és a q-ot (kezdeti feltételek), akkor a 2s állandó értéke meghatározható. Ezek ismeretében már tetszőleges későbbi időpontban is meg tudjuk adni a rendszerünk állapotát (NEWTON-féle determináltsági elv). A legkisebb hatás elvének megfelelően tehát egyedül a mechanikai rendszerünk LAGRANGE-fiiggvényét kell ismernünk. A (7)-ből látható, hogy L tetszőleges állandóval megszorozható: az EULER-LAGRANGEféle mozgásegyenletekben ez nem jelentkezik. A, LAGRANGE-iliggvény additivitása azonban megszünteti ezt a határozatlanságot: minden LAGRANGE-iliggvényt csak ugyanazzal a számmal és egyidejűleg szabad megszorozni. A LAGRANGE-iliggvények additív tulajdonsága: Ha a rendszerünk A és B részei iliggetlenek egymástól, azaz nincs közöttük kölcsönhatás, akkor a teljes rendszer LAGRANGE-iliggvénye a két rész LAGRANGE-fiiggvényének az összege: (8) L = L(A)+L(B). A LAGRANGE-fiiggvényhez egy tetszőleges J (q,t) fiiggvény teljes idődeciváltja hozzáadható, ugyanis nem változnak meg a mozgásegyenletek:
ii=/(q,q).
(4)
A mozgásegyenletek megoldása révén tudjuk meghatározni az egyes részecskék pályáját (trajektóriáját, Eng. trajectory) az lR 3 térben. Az R s ún. konfigurációs térben (Eng. corifiguralion space) egyetlenegy trajektória írja le a rendszerünk időbeli mozgását, azaz a rendszerünk mechanikai állapotának időbeli fejlödését.
'
(9)
.Í(q,q,t)=L(q,q,t)+ ;f(q,t);
(10) ·'f.ídt ='jLdt+ /1
/1
'J;
f( q,t)dt ='JLdt+{f(q,t2 ) - J( q(l>,t1)}.
/1
It
A kapcsos zárójelben lévő mennyiség konstans, így a variációja zéró. Ez azt jelenti, hogy 12
A legkisebb hatás elve (HAMILTON-féle elv, Eng. Hamilton 's principle of least action): A mechanikai rendszerünk olyan pályán mozog a t1 és a t2 időpontok között, amelynél az alábbi funkcionál (HAMILTON-féle hatásiliggvény, Eng. Hamiltonion actionfunction) minimális:
,,
(5) S =fL( q,q,t)dt.
,,
Az L (q, q,t) fiiggvény a mechanikai rendszer ún. LAGRANGE-fiiggvénye (Eng. Lagrangian function). A végpontokban a q rögzített, azaz nem variáljuk. A valóságban ·általában csak azt használjuk ki, hogy az S stacionáriussá válik, azaz az első variációja eltűnik:
,,
(6) oS = foL(q,q,t)dt = O.
,,
A kérdéses problémát a 2-7. fejezetben már lényegében megoldottuk (lásd a másodfajú LAGRANGE-egyenletet), így most azonnal fel tudjuk írni a (6)-ból következő ún. EULERLAGRANGE-féle mozgásegyenleteket (Eng.Euler-Lagrange equations ofmotion): (7)
!!._~L = ~L dt oq;
oq;
242
(i= 1, 2, . . . ,s).
12
(ll) o f.ídt =o fLdt, t,
'•
azaz a mozgásegye nletek azonosak lesznek. A részecskék mozgásának leírása érdekében egy megfelelő vonatkoztatási rendszert kell választanunk, amelyben a mechanikai törvények a lehető legegyszerűbb alakúak. A fizikai tér általában nem homogén és nem izotróp, azaz a szabad részecske számára a különböző helyek és irányok nem ekvivalensek. Hasonlóan, általában az idő sem homogén: a különböző időpillanatok nem ekvivalensek a szabad részecske mozgása szempontjábóL Definíció: Azt a vonatkoztatási rendszert, amelyben a szabad részecske számára a fizikai tér homogén és izotróp, az idő pedig homogén, inerciarendszemek (Eng. inertial system) nevezzük. Ha egy test valamely időpillanatban nyugalomban van egy inerciarendszerben, akkor korlátlan ideig nyugalomban is marad. Most határozzuk meg a szabadon mozgó tömegpont inerciarendszerbeli LAGRANGEfiiggvényét! A kérdéses fiiggvény - a tér és az idő homogenitása mia~ - nem fiigghet explicite sem az r-től, sem a t-től. Hasonlóan, a tér izotrópiája miatt, a v irányától sem, csak a nagyságától:
243
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Ennek megfelelően a szabadon mozgó tömegpont EULER-LAGRANGE-féle mozgásegyenlete:
!!._ iJL =O,
(13)
dt dV
mivel
(20) L=
iJL =0.
(14)
ar
A (13)-ból következik, hogy (15)
Most tekintsünk egy tömegpontokból álló rendszert, de tegyük fel; hogy a részecskék nincsenek egymással kölcsönhatásban. A LAGRANGE-fiiggvények additivitásamiatt a tömegpontrendszer LAGRANGE-függvénye:
iJL
dv =konstans.
Ezzel megkaptuk NEWTON l. axiómáját, azaz a tehetetlenség törvényét. Egy adott inerciarendszerhez képest egyenesvonalú egyenletes mozgást végző vonatkoztatási rendszerek is inerciarendszereknek tekinthetők, azaz végtelen sok inerciarendszer van. A (12) konkrét formájának a meghatározása a GALILEI-féle relativitási elv (Eng. Galilei's relativity principle) segitségével lehetséges. A kérdéses elv szerint a klasszikus mechanika törvényei minden inerciarendszerben azonosak. A GALILEI-féle relativitási elv a koordináták és az idő GALILEI-féle transzformációján (Eng. Galilean transformation) alapuL Legyen két inerciarendszerünk: Kés K '. AK' mozogjon v= konstans sebességgel aK-hoz·képest (t= O esetén a két origó essen egybe). Ugyanannak a mozgó tömegpontnak aK és aK' helyvektorai között a következő összefüggés áll fenn: (16) r=r'+vt. Az idő nem transzformálódik: t= t'. Deriválva t szerint (16) mindkét oldalát (figyelembevéve, hogy v = konstans ), kapjuk, hogy (17) r', azaz (18) a = a' :::> F = F'.
r=
Látható, hogy a NEWTON-féle mozgásegyenletek nem változnak meg: invariánsak a GALILEItranszformációval szemben. (A klasszikus elektrodinamika MAxWELL-egyenletei azonban nem. Ezzel kapcsolatban lásd a 2-9. fejezetet!) A GALILEI-féle relativitási elv részletes alkalmazásától eltekintve, (12) végül is következőképpen néz ki: (19) L=tmv\ ahol m a részecske tömege. Természetesen, a (19) formulát - mint a kinetikus energia klasszikus mechanikai formuláját - minden középiskolás jól ismeri. Most azonban a HAMILTON-féle legkisebb hatás elvéből, az inerciarendszer definíciójából és a GALILEI-féle relativitási elvből vezettük le.
244
2
m;V; .
2
i
Most "kapcsoljuk be" a kölcsönhatást a részecskék között. Tömegpontok zárt rendszere (Eng. elosed system) esetén a tömegpontok csak egymással állnak kölcsönhatásban, külső testtel nem. Ekkor a rendszer LAGRANGE-fiiggvénye (20) helyett következőképpen néz ki:
2
Mivel iJL/dv csak a sebesség függvénye, ezért v = konstan~. A következő fontos konklúzióra jutottunk: Inerciarendszerben minden szabad mozgás állandó (nagyságú és irányú) sebességgel megy végbe.
L
(21)
L=
m.v. L-'-' - V(rpr 2
2 , ...
)=
(•2 ·2 •2)
+z; L mt .X; +Y; 2
) V(rp r2 , ... =T-V,
i
i
ahol az első tagot kinetikus energiának (T, Eng. kinetic energy), a másodikat pedig potenciális energiának (V, Eng. potenfial energy) nevezzük. A potenciális energia a kölcsönhatásra jellemző és csak a kölcsönhatás jellegétől függ. A klasszikus mechanikában a tömegpontok közötti kölcsönhatás "pillanatszerű", azaz végtelen nagy sebességgel terjed a részecskék között. Ha valamilyen véges sebességgel terjedne, akkor a GALILEI-féle relativitási elv nem teljesülne. A kérdéses rendszer esetén az idő nemcsak homogén, hanem izotróp is: a t-t (-t)vel helyettesiíve a LAGRANGE-fiiggvény nem változik. Ennek következtében változatlanok maradnak mozgásegyr2 , -'7'2
Az ~~ulzus megmaradásának tétele a tér homogenitásából származik. Ha egy zárt
mechanikai rendszert önmagával párhuzamosan eltolunk a fizikai térben, a mechanikai tulajdonságok nemváltozhatnak meg. Ezt precízen úgy fejezhetjük ki, hogy egy zárt rendszer LAGRANGE-fliggvénye invariáns a transzlációval szemben. A transzláció hatására a rendszer minden pontja egyformán mozdul el: (38) r1 ~ r1 +u, így (39) ÖL =
(48)
)
....
Ezekkel az EULER-LAGRANGE-féle mozgásegyenletek: DESCARTES-koordináták esetén az általános impulzusok megegyeznek a pi vektorok komponenseiveL Általános esetben a p 1 mennyiségek a qi sebességek elsőfokú homogén filggvényei és nem a sebességek és a tömegek szorzatai. A tömegpontrendszer tömegközéppontjának (Eng. center ofmass) a defmíciója: Lm1r1
L ar; dL =0. j
Az EULER-LAGRANGE-féle mozgásegyenletek értelmében:
LdL =L:~ ()L =~L: dL =O. ; dr1 i dt dvi dt i dVi A (41 )-ből következik, hogy zárt mechanikai rendszer esetén (41)
Egy zárt rendszer mechanikai tulajdonságainak vizsgálatánál célszerű olyan inerciarendszert használni, amelyben az (50) tömegközéppont nyugalomban van (Eng. center of mass coordinate system). Ezzel a rendszernek, mint egységes egésznek a transzlációját kizárjuk. Most két test kölcsönhatásával fogunk foglalkozni (Eng. two-body problem). A kérdéses problémát NEWTON megoldotta a Principia-ban 1687-ben. A két kölcsönható részecskéből álló rendszer mozgását le tudjuk redukálni két fiktív részecske egymástól fliggetlen, önálló mozgására. A két kölcsönható részecske potenciális energiája csak a részecskék távolságától fligg, így a rendszé'r LAGRANGE-filggvénye a K koordinátarendszerben:
(42) P =L ()L =konstans.
avi
j
A P-t a rendszer impulzusának nevezzük (Eng.linear momentum). Mivel
2
L =t~r1 +t~r; -V(r),
ahol r=
2
(43)
L-"' mlvi--v ( rl'r2 , ... ) , -'7'2
ezért (44) P=
L;m v = Lp 1 1
1
aL
r;=r,-R; r; =r2-R.
•
Látható, hogy az energiával szemben a rendszer impulzusa az egyes részecskék impulzusának az összege. A (43) alapján
llrll =!Ir, -r2ll·
Helyezzük koordinátarendszerünk origóját az (50) tömegközéppontba (K' koordinátarendszer):
i
j
L....mi
i ari'
l
Az L első variációjának el kell tűnnie. Mivel u tetszőleges, ezért
(40)
R=+-·
(50)
L ()L ör. =uL ()L i dri
Pi =Fl'
(49)
Így
av
(45) - = - - = F1 ,
ari drj ahol F1 a2: i-ik részecskére ható erő. Ennek megfelelöen a (40) összefliggés (46)
L aridL =. I;F; = 0 i
j
248
AK' koordinátarendszerben a rendszer, mint egész, nyugalomban van: P' = ml;+~r; = 0.
r
Az vektor segítségével megadható
r; és r; : 249
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
r =r1 -r2 =r1 -r2 ;
Tetszőleges u esetén csak akkor zéró a második tag, ha P =O , azaz a tömegpontrendszer
r'=~r· l ,
mint egységes egész nyugalomban van. Ez a határozatlanság azonban nem okoz problémát az impulzusmomentum megmaradásának a tételében, mivel zárt rendszer esetén az impulzus
,
l
"':. +m2
is megmarad. Általánosan az f(t) ftiggvény időátlaga alatt a következőt értjük: l < (56) (!)=~~~ fJ(t)dt. o Ha f(t) = dF(t)/ dt és F(t) korlátos, akkor
r;= _____3__ r. "':. +m2 Ezek alapján a rendszer Lagrange-ftiggvénye: L
=tm. (r;+ R)+t~ (r; +R)- V(r) =tMR +t .u e -V(r), 2
(57) (!)=lim.!_ ÍdF dt =lim F( -r)-F(O) .....~ r dt .....~ -r
ahol
M=m1 +m2;
Tegyük fel, hogy rendszerünk a tér véges tartományában mozog, s eközben á részecskék sebessége nem válik végtelenné, azaz ~)1 pi korlátos. EULER tétele szerint:
Ji.= rrz.m2 . rrz.+m2
i
Tehát a tömegközéppont - mint egy M tömegü fiktív részecske - szabad mozgást végez. A másik fiktív részecskénk .U tömeggel rendelkezik és a V(r) térben mozog (.u a rendszer redukált tömege). NEWTON a két-test probléma megoldása után a három-test problémát (Eng. three-body problem) is tanulmányozta a Principia-ban: vizsgálta a hold mozgását a nap és a föld hatására. A problémát azonban nem tudta általánosan megoldani. Vezető tudósok tanácsára ll. OszKÁR svéd király pályázatot írt ki az általános három-test probléma megoldására. A díjat azonban évekig senki sem tudta elvinni. Végül 1889-ben POINCARÉ-nak ítélték oda, annak ellenére, hogy nem tudta megadni az általános megoldást. Napjainkban a pályák már gyorsan számíthatók számítógép segítségével és kiderült, hogy jó példával szolgálnak a természetben megfigyelhető kaotikus jelenségekre. Végül is nem csoda, hogy az általános megoldást nagyon sokáig (1912) nem tudták megtalálni, majd azt a későbbiekben alkalmazni. Egy zárt rendszer mechanikai tulajdonságai akkor sem változhatnak meg, ha azt mint egységes egészet elforgatjuk a térben, azaz a tér izotróp. Legyen &p kicsiny virtuális forgatási vektor, melynek iránya a forgástengely, s jobb csavart alkot a forgatássaL A részletektől eltekintve (51) t5L = &/Ji;(rixp1 + v1 Xp 1 ) Mivel &p
tetszőleges,
=&p!
Y; ri Xp =O. 1
ezért d (52) - ,Lr.xp. =0, dt i l
(58) 2T=
.Li dvi ar vl =LP1v1=!!....(_Lp~r~)- _Lqil. i dt i i
Határozzuk meg a kinetikus energia időátlagát ;
(59)
2(T)=-(Y;r1 p1) =(Y;ri ~)·
mivel az (58) első tagjának a járuléka zéró. Legyen V az r1 -k k-adfokú homogén·ftiggvénye, ekkor
(60)
2(T)=k(V).
A (60) összeftiggés a klasszikus mechanika viriál tétele (Eng. virial theorem, Lat. vis, visf = erő). A NEWTON-féle gravitációs és a COULOMB-féle elektrosztatikus kölcsönhatásnál k =-l,
azaz
(61) 2(T)=-(V). Ebben az esetben ;·
(62) E=(E)=(T)+(V)=-(T), azaz á mozgás csak akkor megy végbe a tér korlátos tartományában, ha a teljes energia negatív. A mechanikai rendszerünk leírására a (q, q) változók helyett használhatjuk a (q, p ) változókat is. Ennek érdekében hajtsunk végre egy (q, q)=> (q,p) negatív LEGENDRE-transzformációt a LAGRANGE-ftiggvényen (lásd a 2-2. fejezetet):
l
(63) H(q,p,t) = - ( L -
azaz (53)
J= ~)i x pi == kontans.
A J vektor a rendszer impulzusmomentuma (Eng. angu/ar momentum). Az impulzusmomentum értéke ftigg a koordinátarendszer kezdőpontjának a megválasztásától: (54) r1 =r; +u; (55)
J = ,L[r1,p 1]= ,L[r;,pJ+ux
í;piq1
)=E.
A kapott H(q,p ,t) ftiggvényt HAMILTON-ftiggvénynek nevezzük. Képezzük a H teljes differenciálját
LP =J' +uxP. 1
i
250
O.
0
251
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
(64) dH=~dL+
L qidpl+ LP;dql
=-"'f.fttdqi-"'f.pldq;+ L qldpi+ "'f.pldqi
l _.2 2 (73) E=-mw a =konstans. 2 A lineáris harmonikus oszcillátor HAMILTON-függvénye:
~(74)
=-LP; dq; +L qidpi. l
l
(64)-ből a HAMILTON-féle kanonikus mozgásegyenletekhez (Eng. Hamilton 's canonica/ equations ofmotion) jutunk:
A
.
aH
q~=-a
(65)
'P;
c, akkor a ~l- v 2l c 2 képzetessé válik.' Ez azt jelenti, hogy a két inerciarendszer maximum csak a c fénysebességgel mozogbat egymáshoz képest. A fénysebesség tehát olyan batársebesség, amit a relativitáselmélet szerint nem lehet megbaladni. A LORBNTZ-transzformációt leíró egyenletekből fejezzük ki az x, y , z, t koordinátákat:
x
x l .. vt'
~l-v lc 2
2
, , t l +vx ' / c 2 ; y = y; z = z; t= .
~I-v2 lc2
Ezek az összefüggések adják meg, hogy milyen aK vonatkoztatási rendszer a K '-ből nézve. Látható, hogy az eredmény ismét LoRBNTZ-transzformáció. A különbség csak az, hogy a v helyére (-v) került. Az eredmény azt mutatja, hogy nincs abszolút mozgás. Ha a K ' ip.erqiarendszer a K-hoz képest v sebességgel mozog, akkor ez fizikailag ekvivalens azzal, hogy a K rendszer (-v) sebességgel mozog a K '-höz képest. 258
x;
x;
:-
l'_ , , _ x2 -vt0 2 - x -~ - ~l - v2 lc2
~ -vt0
~I-v2 lc2
l
~I- v2lc2 '
azaz l ~ 1'. Tehát a mozgó rúd hossza kisebb, mint a nyugalmi bossz. Pontosabban: a rúdhoz képest mozgó koordinátarendszerben levő megfigyelő rövidebbnek méri a rodat, mint a nyugvó rúd koordináta-rendszerében levő megfigyelő. Ezt a jelenséget nevezzük LORBNTZ-kontrakciónak (hosszúságkontrakció, Eng. LOREN1Z contraclion). Az idődilatáció és a LORBNTZ-kontrakció egymással szoros kapcsolatban áll. Nézzünk erre egy példát! A müonok instabil elemi részecskék: átlagos élettartamuk T = 2.22xl0-6 s. Kozmikus sugárzás hatására a Föld felső légkörében keletkeznek, majd a kb. 50 km-es utat megtéve lejutnak a Föld felszínére. Ha fénysebességgel mozognának, akkor az élettartamuk alatt mintegy S = CT = 665.539 m utat tennének meg. Hogyan képesek mégis áthatolni a több 10 km vastag légkörön? Az előbbiekben hallgatólagosan feltételeztük, hogy a müonok élettartama fiiggetlen a sebességüktől. Tekintsünk két vonatkoztatási rendszert: K legyen a Földhöz rögzítve, K ' 259
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
pedig a müonhoz. A K' rendszerben levő megfigyelő számára a müon átlagos élettartama a fenti érték: T(K') = 2.22x10-6 s. AK rendszerben levő megfigyelő számára azonban '!(K) = '!(K')
~l-v /c 2
' dx' ux = dt' ;
dx dt'
dx'/dt' +v. dy _ dy'. ~l-v2 /c2 ' dt'- dt''
(x;
V
2
.J
'
'
X2 -XI
.
0
'
c . 1-v2/c2
:t:. '
azaz az események nem lesznek egyidejűek Tegyük fel most, hogy a K' rendszerben lejátszódó előbbi két esemény nem egyidejű és >t;. Ekkor kapjuk, hogy
t;
~
t1' +vx1' / c 2 . 2
t2
2
~l-v /c '
t2'
+vx'2 j c 2
~l-v2 /c2 ·
Mi a feltétele annak, hogy t 1 > t 2 teljesüljön? Az előző formulák szerint ehhez fenn kell állnia annak, hogy
Tegyük fel, hogy
.
2 .
.·
.XI' - X2' >c ( t 2' -ti') . v ' Tehát, ha az események távolságára ez az egyenlőtlenség teljesül, akkor a K rendszerbeli megfigyelő számára az események sorrendje megfordul. Ha most az pontban a időpillanatban ébredő hatás u' sebességgel halad az x; pont felé, és ott a időpillanatban egy másik eseményt vált ki, akkor az ok~okozati viszony a K rendszerben csak akkor fordulhat meg, ha az u' nagyobb, mint a fénysebesség. Mivel ez nem lehetséges, az ok-okozati viszony sorrendje nem fordulhat meg. Most nézzük meg, ·hogy a sebességek hogyan transzforri:tálódnak! Mozogjon egy tömegpont a K' rendszerben u' sebességgel. Ekkor
x; t;
260
t;
dt'
~1-v2/c2
l+u:v/ c 2 ; uY
l+u:v/ c 2 '
u.- l+u:v/ c 2
u: =c. A GALLILEI-transzformáció szerint ekkor ux =u:+v=c+v.
LORBNTZ-transzformáció esetén azonban aztkapjuk, hogy u: +v c+v c+v ux l+u:v/c2 l+cv/ c 2 = l+v/ c =c.
=
Ami azt jelenti, hogy .ha egy tömegpont .egy inerciarendszerben c fénysebességgel mozog, akkor az összes többi inerciarendszerbőlnézve is c lesz a sebessége. A 2-8. fejezetben NEWTON IL axiómáját tömören következőképpen írtuk fel:
.
F=p.
Az EINSTEIN-féle relativitási etv szerint ez a formula érvényes a relativisztikus mechanikában is. Itt azonban p=m(u)u lesz (u=llull), ahol az m(u) koefficiens a u sebességgel mozgó részecske tömege. Hasonlóan érvenyesnek tartjuk a III.'axiómát ("hatás-ellenhatás") is. A K inerciarendszerben mozogjon két egyenlő tömegű golyó egymással szemben az X tengely mentén v, illetve (-v) sebességgel. Ekkor az impulzusaik: p 1 = m(v)v; p 2 = -m(v)v. Az impulzusuk eredője zérus. Ha rugalmasan ütköznek, akkor egy pillanatig megállnak, majd sebességet cserélnek, de az eredő impulzusuk az egész mozgásuk során nulla marad. Nézzük meg az ütközési .folyamatot a K' inerciarendszerbőL Ebben az l. golyó. sebessége nulla az ütközés előtt, mivel a K' rendszer együtt mozog az l. golyóval. A 2. golyó sebessége a K' rendszerben legyen u az ütközés előtt. A golyók impulzusa tehát m(Ó)O =O; m(u)u.
·
amiből
l+(v/ c )dx'/dt'
u:
ux
Aminek a megtételére - a fentiek szerint- a müonnak van elég ideje. Egyszerűen megmutatható, hogy különböző helyeken végbemenő események egyidejű ségéről csak egy adott vonatkoztatási rendszerre vonatkozóan van értelme beszélni: az egyik inerciarendszerben egyidejű .események ugyanis a másik inerciarendszerben nem lesznek egyidejűek További érdekes kérdések: (i) Az események sorrendje fiigg-e a vonatkoztatási rendszertől? és (ii) Az okozat - mint esemény- megelőzheti-e az okot, azaz a kiváltó esec ményt? Játszódjék le · a K' rendszer két különböző helyén :t:. x;) két pillanatnyi esemény egyazon időpontban (t;= ti). AK rendszerből nézve az eseményeket:
2
dt
A dt/dt'-vel osszuk el a másik három összefiiggés mindkétoldalát: 2/-c-2 +v u;~l _;,v2/ c2 . _ u;..j,....1---v""'
l(K')=l(K)~I-v2 /c2 =632.443 m.
-
' dz' u. =-d-t' ·
Határozzuk meg a tömegpont K rendszerbeli sebességét! Ennek érdekében képezzük a következő deriváltakat:
2
Tegyük fel, hogy v=0.99992c. Ekkor r(K)=0.00017551 s, és s=v'!(K)=52612.3m lesz a müon által megtett út a K rendszerbeli megfigyelő számára. Tehát a K rendszerbeli megfigyelő szempontjából a müon át tud hatolni a Föld légkörén. Vizsgáljuk meg a kérdést most aK' rendszerből nézve: milyen vastagnak "látja" a müon aK rendszetbeli megfigyelő számára 50 km-es vastagságú réteget? A LORENTZ-kontrakcióra levezetett formulánk alapján:
t,i -ti -
' dy' uY = -dt-, ;
.
p;=
p; =
Az ütközés első pillanatában a golyók megállnak a K rendszerben. Ebben a pillanatban a K' rendszerből egy m(O)+m(u) tömegű testet látunk, mely (-v) sebességgel mozog, így impulzusa: p' =-(m(O)+m(u))v.
Az EINSTEIN-féle relativitási elv szerint az impulzus aK' rendszerben is megmarad, így ' p'=-(m(O)+m(u))v=p:+p;=m(u)u, amiből
kapjuk, hogy
m(u)=- m(O)v. u+v
261
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
Most határozzuk meg az u és a v közÖtti összefüggést. A 2. golyó sebessége a K' rendszerben u, a K rendszerben pedig (-v), így
u+v -v=--.,....,..2 l+uv/c
~ v=:
2
-1).
( ~1- u 2/c2
Ezt behelyettesítve az előző kifejezésünkbe, kapjuk, hogy m(u)
W=
p
p
Po
Po
JF ds =J(F,dx + Fydy +f'.dz)
l
= J( F,u. + FYuY + F,u,) dt. t,
Helyettesítsük be az erőkomponenseket az integrálba:
m(O)
~I-u 2 /c2
A zérus sebességhez tartozó tömeget nyugalmi tömegnek nevezzük, s m0 -val jelöljük. Így a relativisztikus tömegnövekedési formula: ·
W=m.,{•.[ ~~~-~'/c' )••,[~~~-·:'/c' )••.[ ~~~-~'/c' )]dt Az integrandusz átalakítása után ezt következöképpen is irhatjuk:
R ~1-u2/c2 l )d [--.====== ~I-u2/c2 ,, 2
Ha u =c, akkor m = =. Ez a magyarázata annak, hogy a részecskét nem lehet a fénysebességre felgyorsítani. A relativisztikus mechanikában az impulzus már nem lineáris függvénye a sebességnek Míg a sebesség korlátos (-c < v< c), addig az impulzus tetszőleges értéket ( -oo
m miatt zérus. Ha n = m, akkor a következő integrált kell meghatároznunk: l 2 l l d"[J(x)] dx= nn! fo -xt+"(l+xl+n dx. 2 ~ ~
dx"
291
·rr
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
1
Az integranduszban szereplő n-edik deriváltat megkapjuk, ha figyelembe vesszük, hogy nszeri deriválás után az n-nél alacsonyabb fokú tagok eltűnnek és csak a fóegyüttható n!szorosa marad. Tehát a (14) összefüggés alapján: 19 ( )
d"[J~a,p)(x)] =~(a+P+2n) dx" 2" n '
l •- [(a+n)(P+n) (n-kXx-l.)k(x+l)"-k-l + --;;L 2 k-=0 n-k k
+(
(23)
1 L(a+k+l+P-k+n) •( a+n )(P+n) =--;; . (x-l)k(x+l)"-k-1 2 k-=0 n-k-1 k
1
= a+P+n+lJ
-
-
;.
(78)
-
-
(l)
l l Je-"'dt=2 - Je-•'dt= - Je-'i2 dt=r- =..[;.
2 o o Az IIERMITE-polinomok ortononnálási összefiiggésére tehát azt kapjuk, hogy (79)
-J
e-•' H. (x)H". (x)dt =c>.". 2" n!..[;.
Definíció: Általánosított LAGOERRE-polinomnak nevezzük az x
(80) fiiggvényt. Ha
(a)L.(x)= ;a
d" [x•+ae-•J dt"
Először
is lássuk be, hogy a fenti módon definiált fiiggvény legfeljebb n-edfokú polinom. Alkalmazzuk a LEmNIZ-féle differenciálási szabályt:
(a)L (x)=(!' d"[x•+ae-•J n xa dx"
=;: ~(:)d;:+a
o
(83) =(-1)"
'
J
~
(a)
L., (x)dt
d" [(a)L
Jxa+•e-•
(x)]
dt:
dt = O.
o
A többszöri parciális integrálás során a kiintegrált részek eltünnek: a tényezőként szereplő (a)L., (x) -és deriváltjainak-határértéke az x= O helyen O, hiszen egy m-edfokú polinomról van szó; a kiintegrált tagok határértéke az x= oo helyen ugyancsak zérus, amit az HERMITEpolinomok vizsgálata során már látott módon igazolhatunk, annyi különbséggel, hogy itt a kérdéses határértékeket az y= e-• fiiggvény x= oo helyen felvett határértékére vezetjük vissza. Abban az esetben, ha a fenti integrálban n = m , a következő kifejezéshez jutunk:
~ (84)
. ~ d"[(a)L (x)] Jxae-•[(a)L.(x}J dt=(-1)" Jxa+•e-• dt: dt=n! Je-•x•+a,
o
o ;'
00
(85)
o
-
Je-•x•+adt = Je-•x(•+a+l)-ldt = r(n+a+ 1). o
o
Az általánositott LAGOERRE-polinomok ortonormáltsági összefiiggése tehát: (86)
Jxae-• (a) L. (x)" (a)L., (x)dt =c5..,n!r(n+a+l). o
d::::•
-n'L• (a+n)(-x)"-• -··=o k (n-k)t' A végeredményből látható, hogy valóban egy legfeljebb n-edfokú polinommal van dolgunk. Az általánosított LAGOERRE-polinomokra is jellemző, hogy a differenciálással szemben zárt halmazt alkotnak, azaz deriváltjuk ugyancsak egy általánosított LAGOERRE-polinom - egy konstans faktortól eltekintve. 300
o
ahol az integrandustátalakítva ismét a gamma-fiiggvényt kapjuk:
a = O, akkor közönséges LAGOERRE-polinomról beszélünk.
(81)
jxae-• (a)L• (x) (a)L". (x)dt = jd" [ ~~e-•
...., dx=2"n! Je-"'dt,
ahol az n-edik derivált meghatározásához felhasználtuk a (68) összefiiggést. A kapott integrált visszavezethetjük a gamma-fiiggvényre a t= x 2 helyettesítéssei és annak figyelembevételével, hogy az f(x) = exp(-x2 ) páros fiiggvény, azaz teljesül rá, hogy f(x) = f(-x):
(n-k-I)!
Az összegzésben a k index felső határa azért változott n-ről (n-l )-re, mert a deriválás során a k = n -hez tartotzó tag eltünik. Most igazoljuk, hogy az általánosított LAGUERRE-polinomok a (O, oo) intervallumban a p(x) = xae-• súlyfiiggvény mellett ortogonális rendszert képeznek. Az (l) definícióban szereplő integrált kell meghatároznunk a már többször is alkalmazott módon:
..... d"H (x) le-"'H.(x)H".(x)dx= le-x' dt=O,
.....
k
=-n (a+l)Ln-1 (x).
hiszen H., (x) legfeljebb m-edfokú polinom és n > m . Abban az esetben, ha a vizsgált integrálban n = m , az n-szeri parciális integrálás után a következőt kapjuk: (77)
n-l(a+n) (-xr-k-1
=-n'L ··=o
(82)
2xe'
Végül bizonyítsuk be, hogy
(a)L.
(x)
(87)
megoldása az
xy'+(a+ I-x)y' +ny= O
differenciálegyenletnek Végezzük el az y= (a)L. (x) behelyettesítést, a deriváltak meghatározására pedig vegyük figyelembe a (81) és a (82) összefiiggéseket. Egy kis átrendezéssei az alábbi összefiiggést kapjuk, amelyről bizonyitanunk kell, hogy valóban teljesül.
_~(a+n)· (-xr•-l +(a+ I)f(a+n) (-xr-•- + t..o k (n-k-2)1 •~o · k . (n-k-1)! 1
(88)
~·(a+n).
+~
•=o
k
(-xr -• (n-k - I)!
=-n(a)L (x.) n
301
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
A továbbiakban elegendő a baloldallal foglalkozni. Vonjuk össze az azonos fokú tagokat, felhasználva a binomiális együtthatók (24) azonosságát. Összevonás után egy (n +l) tagú összeget kapunk:
Igazoljuk, hogy f (x, y) a bétafliggvény előállítása a pozitív valós szárnsíkon. Legegyszeröbb a harmadik tulajdonság belátása:
_:t(
(89)
k=O
Tehát
(a)L.
(x)
k(n-k) + k(a+l) +n-kJ(a+n)(-xrk =-n(a)L. (x). a+n-k+1 a+n-k+l k (n-k)!
valóban eleget tesz a kérdéses differenciálegyenletnek
A
következő
o
Az első tulajdonság igazolásához a z =1- t helyettesítést érdemes elvégezni: (97)
Definíció: EULER-féle gammafliggvénynek nevezzük azt az egyváltozós fliggvényt, amely eleget tesz az alábbi egyenlőségeknek: (90)
l
~ (96) /(1,1)= fdi;;;;[t]~ =l.
r( x+ l) =xr( x) r(l) =l.
f(x,y)
l
o
l
o
l
o
= ft•-l (1-ty-1 dt =- f(l-zr-1 zY-1dz"' fzy-1 (1-zr -1 dt =f(y,x).
A második tulajdonság igazolása érdekében érdemes előbb az alábbi két egyenlőség teljesülését belátni: (98)
fliggvényt pedig EULER-féle másodfaj ú integrálnak nevezzük: (91)
f(x)= Jr•-le-'dt
f(x+1,y)=~ f(x,y+l) y
f(x,y) = f(x+l,y)+ f(x,y+l). Az első egyenlőség esetén elegendő egy parciális integrálást végrehaj tanunk:
(x> O).
1
o
1 (99) f(x+ 1,y)"' Jt• (1-ry- dt =[-t• ( -tY ] o Y 0 1
Igazoljuk, hogy az EULER-féle rnásodfajú integrál rendelkezik a gamrnafliggvény tulajdonságaival. Az első tulajdonság belátásához elegendő egy parciális integrálást elvégezni. A második tulajdonság igazolása még egyszerübb: ~
o
(100)
o
Ezek alapjánaz f(x) fliggvényt a pozitív számok halmazáll a garnrnafliggvény egy előállí tásának tekinthetjük. Megtehető a teljes valós szárnhalrnazra való kiterjesztés, de számunkra - az ortogonális polinomok vizsgálata szempontjából - ez a kiterjesztés nem szük:séges; A gamrnafliggvény definíciójában sz~replő két egyenletből következik, hogy ha n egy nernnegatív egész szám, akkor (93) r(n+l)=n!. történő
kiterjesz-
Defmíció: EULER-féle bétafliggvénynek nevezzük azt a kétváltozós fliggvényt, amely eleget tesz a következő egyenlőségeknek:
B(x,y) = B(y,x) (94) B(x,y+l)"'_LB(x,y)
x+ y
B(l,l) =l. Az alábbi függvényt pedig EULER-féle elsőfajú integrálnak nevezzük:
1
f(x,y) = Jt•-l (1 - tY- dt o
302
(x> O, y> O).
l
'
l
l
o
o
.
o
= f(x,y)- f(x+l,y) ,
f(l)= Je-'dt=[-e-']; =l
(95)
'
J(x,y +1) = ft•-l (1-t)(1-ry-l dt = ft•-l (t-ty-l dt- ft• (1-tf-l dt
o
Látható, hogy a gammafüggvényt a faktoriális fogalom valós számokra tésének tekinthetjük.
Y
Yo
A második egyenlőség igazolásához érdemes egy kis algebrai átalakítást végezni:
~
f(x+l)= Jt•e-'dt=[ -t•e-'J; +x Jt•-le-'dt=xf(x) (92)
+~ Jr•-l (1-tf dt =~ f(x,y+ 1).
amiből egy átrendezéssei következik a második egyenlőség. Az így belátott két egyenlőséget felhasználva már könnyen igazolhatjuk a definícióban szereplő második tulajdonság teljesülését. Végezetül érdemes bemutatni a béta- és garnrnafliggvények kapcsolatát megadó összefüggést:
(101) B(x, y ) = r(x)r(y), r( x+ y) ahonnan könnyű látni, hogy a baloldalra valóban teljesülnek a bétafliggvény definícióbeli tulajdonságai. SLATER-pályákat, helyesebben SLATER típusú függvényeket (Eng. Stater-type orbita!, STO; Stater-type function, STF), valamint GAUSS-pályákat, helyesebben GAUSS típusú fliggvényeket (Eng. Gaussian-type orbita/, GTO; Gaussian-type function, GTF), régóta alkalmaznak - mint bázisfliggvényeket - kvantumkémiai számításokban. Atomokon centrált STO és GTO függvények lineáris kombinációjával állítjuk elő az atompályákat és a molekulapályákat. Ezt az módszert nevezzük LCAO-közelítésnek (Eng. /inear combination of atomic orbita/s). A híres GAUSSlAN kvantumkémiai programcsomag (J.A. POPLE és munkatársai 1969-től) neve onnan származik, hogy GTO fliggvényeket használ bázisfüggvények gyanánt. Samuel Francis BoYS (1911-1972) angol kvantumkémikus érdeme a GAUSS-pályák bevezetése és az első kvantumkémiai programcsomag létrehozása [S.F. Boys: Proc. R. Soc. London, Ser. A , 200, 532, (1950)]. Ez a tettszinte forradalmasította a kvantumkémiát. N.C. HANDY, 303
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
J.A. POPLE és I.S. SHAVITT a egy cikkben méltatta BOYS munkásságát: Samuel Francis Boys, J. Phys. Chem., 100, 6007 (1996). A lényeg az, hogy a többcentrumú molekuláris integrálokat sokkal könnyebb GAUSSpályákkal kiszámítani, mint SLATER-pályákkal. Ez annak köszönhető, hogy két- különböző atomon centrált - GAuss-pálya szorzata - egy kontstans faktortól eltekintve - egy harmadik centromon lokalizált GAuss-pálya. A harmadik centrum a két atomot összekötő egyenes szakaszon helyezkedik el. A SLATER-pályákról ugyanez a tény nem mondható el. Az A atomon centrált ún. primitív GAUSS-pálya DESCARTES-féle alakja (Eng. primitive cartesian gaussian): ,J,GTO { • ) l m n gA ='l'l,m,n rA,a = N A XAYA zAexp ( -arA2 ) '
ahol t; a STO pályakitevője, k a kontrakció mértéke és a c1 skalárok az ún. expanziós koefficiensek. Természetesen egy adott szimmetriájú STO előállításához ugyanolyan szimmetriájú primitív GTO-kat kell alkalmaznunk A SLATER-pálya DESCARTES-féle alakja csak a radiális részben tér el a GAUSS-pályáétól:
ahol NA a normálási tényező (Eng. normalization constant), rA =r-A az A atom A=(A",AY,A.) helyétől az r=(x,y,z) pontba mutató vektor, a a GAUSS-pálya pályakitevője (exponense, Eng. orbital exponent) és l,m,nE Z~. A 1.. = (l,m,n) rendezett számbármast impulzusmomentumnak, a [1..] =l+ m +n számot pedig impulzusmomentum-indexnek nevezzük. A [l..] számértékétől függően (O, l, 2, ...) beszélünk s, p, d, ... primitív GAussfüggvényekrőL A normálási faktor értékének a meghatározásához a következő integrált kell kiszámítanunk:
JJf[x~ y; z~ exp(-ar;)J dxdydz, ahol az integrálást a teljes térre kell végrehajtanunk. Az NA segítségével a gA GTO-t normálni tudjuk:
Míg a STO-k a hidrogénszerű atompályákhoz hasonló tulajdonságokkal rendelkeznek, addig a GTO-k jelentősen eltérnek azoktól. Ennek következtében egy atompálya közelítésére általában elég egy STO-t használni. GTO-ból viszont sokkal több kell. Az első néhány normált GTO függvény (az A indexet elhagyva és az r= jelölést bevezetve): 2 )3/4 2 g,= ( : exp(-ar );
llrll
4
5 7"JI/
g x = ( 128a
5
xexp( -ar
2)
;
4
128a JI/ yexp ( -ar gY= ( 7"
2)
;
4
y;
z~(rA;t;) =NA x~ z~ exp( -t; rA). A legegyszerűbb normált STO kifejezése (elhagyva az A indexet):
xi:W(r;t;)
=(~r exp(-t;r).
z::-
0 Legyen a feladatunk a függvény különböző exponensü g, függvények lineáris kombinációjával való közelítése:
k "pro
A: is
,j,CGTO ""'I'Is
"
=,t_. C; gs,l' i=l
A különböző kértékekhez tartozó {c;} és {a;} paramétereket úgy kell meghatározni, hogy a kontrahált GTO fllggvény a lehető legjobban megközelítse a kérdéses STO függvényt. A kérdéses paraméterek optimalizálásával sok cikk foglalkozik a szakirodalomban. Itt csak néhányat említünk meg közülük. R.F. STEWART a legkisebb négyzetek módszere szellemében a következő függvény minimalizálásával határozta meg a paramétereket [R.F. Stewart: Small Gaussian Expansions ofAtomic Orbitals, J. Chem. Phys., 50, 2485 (1969)]:
S=
f] f[zi:W -~~GTOr
dxdydz+A(l-
f] J[~;GroJ
dxdydz
J
Látható, hogy STEWART a LAGRANGE-féle multiplikátoros módszerrel mellékfeltételként vette figyelembe a CGTO normáltságát: A. a multiplikátor. A kapott CGTO-t STO-kG módon jelöljük. W.J. HEHRE, R.F. STEWART és J.A. POPLE egy J. Chem. Phys. cikkben közölte a ST0-2G, ..., ST0-6G megoldásokat [J. Chem. Phys., 51, 2657 (1969)]. Érdemes megemlíteni, hogy elegendő csak t;= l esetén meghatározni a paramétereket. Tetszőleges t; ;t l értékre ugyanis könnyen meghatározhatjuk a megoldást egyszerű skálázással: xt':o (r; t; ;t l)= ;3/2xi:W (t;r; 1). A probléma megoldására egy másik utat választunk. Először is alakítsuk át az előbbi mellékfeltétel melletti - minimalizálási problémát egyszerű - mellékfeltétel nélküli maximalizálási feladattá. Tekintsük a kérdést általánosari: egy [a,b]-on folytonos F(x) függvényt (F(x)E qa,b]) akarunk illeszteni egy másik- szintén az [a,b]-on folytonosf(x;c) függvénnyel (f(x;c)E C[a,b]) (Eng. curve.fitting). A pontos vessző azt jelöli, hogy az f(x;c) függvény parametrikusan függ a c vektortóL A legkisebb négyzetek módszere értelmében úgy választjuk meg a c paramétervektort, hogy az b
128d JI/ 2 g,= ( 7" zexp( -ar ).
S(c)= Jw(x)[F(x)- f(x;c)] dx
Az előzőeknek megfelelően tehát l STO közelítésére több primitív GTO lineáris kombinációját kell alkalmaznunk. Így jutunk el az összetett (kontrahált) GTO bázisfüggvény (Eng. contracted GTO) fogalmához:
határozott integrál minimális. A w(x)> O függvényt súlyfllggvények nevezzük. Segítségével az intervallum különböző pontjait különböző mértékben tudjuk figyelembe venni. Természetesen w(x)= l is választható. Az S(c) minimumának szükséges feltétele: ,
k
XSTO (r; t;)"" ifJcaro
=L c; g; .
2
a
i=l
304
305
Tasi Gyula: Matematikai kémia
Tasi Gyula: Matematikai kémia
as(c) =0,
(j=l,2, ... ,n),
S(a)
ac} azaz
=J1 J~o fAC.GTO dxdydz =(; )1/2(2: )3/4 J1 Je-r e-ar' dxdydz 1/2 ( 2 .)3/4 2tr = ~ a Jdrr e-r e-ar' Jd8sin8 Jd(!> ( ) o o o tr '
2
fw(x)[F(x) aj(x;c)- f(x;c) aj(x;c)] dx =O, acj acj
(j= 1,2, ... ,n).
1r
1r
2 t r - )1/ -
_4(l (2a)
Q
Tegyük fel, hogy a függvényeink négyzetesen integrálhatók az [a, b] -on:
-
tr
b
JwPdx