137 37 12MB
Hungarian Pages [704] Year 2022
Richard Courant Herbert Robbins
Mi a matematika?
Gondolat Könyvkiadó Budapest, 2022
Fordította: Vekerdi László
A fordítást ellenőrizte: Lukács Ernőné
Copyright © Richard Courant, New York, 1941 Copyright © Gondolat Könyvkiadó, Budapest, 1966
A IX. fejezetet Ian Stewart írta Revisions copyright © 1996 by Oxford University Press, Inc. First published as a second edition, 1996 by Oxford University Press, Inc.
Kiadás dátuma: 2022. május 26.
Tartalomjegyzék Tartalomjegyzék
i
Előszó a második kiadáshoz
xiii
Az első kiadás előszava
xvii
A javított kiadások előszava
xix
Hogyan használjuk ezt a könyvet
xxi
Mi a matematika?
xxiii
I. A természetes számok
1
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1. § Számolás egész számokkal . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1. Az aritmetika törvényei . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2. Pozitív egész számok jelölése . . . . . . . . . . . . . . . . . . . . . . .
5
3. Számolás nem tízes számrendszerekben . . . . . . . . . . . . . . . . .
8
*2. § A számrendszer végtelen voltáról. A matematikai indukció . . . . . . . .
11
1. A matematikai indukció elve . . . . . . . . . . . . . . . . . . . . . . .
11
2. Számtani sor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3. Geometriai sor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
4. Az első n egész szám négyzetének összege . . . . . . . . . . . . . . . .
16
*5. Egy fontos egyenlőtlenség . . . . . . . . . . . . . . . . . . . . . . . .
17
*6. A binomiális tétel
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
*7. További megjegyzések a matematikai indukcióról . . . . . . . . . . .
22
Kiegészítés az I. fejezethez. Számelmélet Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
pdf létrehozva: 2022. május 26. 11:30 tex módosítva:
25 25
i
1. § Prímszámok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
1. Alapvető tények . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2. A prímszámok eloszlása . . . . . . . . . . . . . . . . . . . . . . . . . .
30
a) Prímszámokat előállító képletek . . . . . . . . . . . . . . . . .
30
b) Prímszámok a számtani sorokban . . . . . . . . . . . . . . . .
32
c) A prímszámtétel . . . . . . . . . . . . . . . . . . . . . . . . . .
33
d) Két, prímszámokra vonatkozó megoldatlan probléma . . . . .
36
2. § Kongruenciák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
1. Alapfogalmak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
2. A kis Fermat-tétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
3. Kvadratikus maradékok . . . . . . . . . . . . . . . . . . . . . . . . . .
46
3. § Püthagoraszi számok és Fermat elveszett tétele (a „nagy Fermat-tétel”) .
48
4. § Euklidészi algoritmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
1. Általános elmélet . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
2. Az aritmetika alaptételének alkalmazása . . . . . . . . . . . . . . . . .
56
3. Az Euler-féle [Pleaseinsertintopreamble]-függvény. Újból a kis Fermattétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
4. Lánctörtek. Diophantoszi egyenletek . . . . . . . . . . . . . . . . . . .
59
II. A matematika számrendszere
ii
65
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
1. § A racionális számok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
1. Racionális számok mint a mérés eszközei . . . . . . . . . . . . . . . .
65
2. A racionális számok elméleti szükségessége. Az általánosítás elve . . .
68
3. Racionális számok geometriai értelmezése . . . . . . . . . . . . . . . .
70
2. § Inkommenzurábilis szakaszok, irracionális számok, határérték . . . . . . .
72
1. Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
2. Tizedes törtek. Végtelen tizedes törtek . . . . . . . . . . . . . . . . .
75
3. Határérték. Végtelen geometriai sorok . . . . . . . . . . . . . . . . . .
78
4. Racionális számok és szakaszos tizedes törtek . . . . . . . . . . . . . .
82
5. Irracionális számok általános definíciója intervallumskatulyázással . .
84
*6. Más módszerek irracionális számok definiálására. Dedekind-szelet . .
87
3. § Néhány megjegyzés az analitikus geometriával kapcsolatban . . . . . . .
89
1. Alapelvek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
*2. Az egyenes egyenlete. Görbék egyenletei . . . . . . . . . . . . . . . .
91
4. § A végtelen matematikai analízise . . . . . . . . . . . . . . . . . . . . . . .
95
1. Alapfogalmak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
2. A racionális számok megszámlálhatósága és a kontinuum nem megszámlálhatósága . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
3. A Cantor-féle „számosságok” . . . . . . . . . . . . . . . . . . . . . . . 103 4. Az indirekt bizonyítás . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 5. A végtelen paradoxonai . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6. A matematika alapjai . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5. § Komplex számok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 1. A komplex számok eredete . . . . . . . . . . . . . . . . . . . . . . . . 109 2. A komplex számok geometriai szemléltetése . . . . . . . . . . . . . . . 113 3. A de Moivre-képlet és az egységgyökök . . . . . . . . . . . . . . . . . 120 *4. Az algebra alaptétele . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 *6. § Algebrai és transzcendens számok . . . . . . . . . . . . . . . . . . . . . 127 1. Definíciójuk és létezésük . . . . . . . . . . . . . . . . . . . . . . . . . 127 **2. Liouville tétele és transzcendens számok előállítása . . . . . . . . . 128 Kiegészítés a II. fejezethez. A halmazalgebra elemei
133
1. Általános elmélet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 2. A halmazalgebra alkalmazása a matematikai logikában . . . . . . . . . . . 138 3. A halmazalgebra alkalmazásáról a valószínűségszámításban . . . . . . . . . 140 III. Geometriai szerkesztések. Számtestek algebrája
145
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 III.I. A megoldhatatlanság bizonyítása és az algebra
149
1. § Alapvető geometriai szerkesztések . . . . . . . . . . . . . . . . . . . . . . 149 1. A négy alapművelet és a gyökvonás mint szerkesztések . . . . . . . . 149 2. Szabályos sokszögek . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
iii
*3. Az Apollóniosz-féle feladat
. . . . . . . . . . . . . . . . . . . . . . . 156
*2. § Megszerkeszthető számok és számtestek . . . . . . . . . . . . . . . . . . 158 1. Általános elmélet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 2. Minden megszerkeszthető szám algebrai szám . . . . . . . . . . . . . . 166 *3. § A három görög probléma megoldhatatlansága . . . . . . . . . . . . . . . 167 1. A kocka megkettőzése . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 2. Egy harmadfokú egyenletekre vonatkozó tétel
. . . . . . . . . . . . . 169
3. A szög harmadolása . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 4. A szabályos hétszög . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 5. Néhány megjegyzés a kör négyszögesítéséről . . . . . . . . . . . . . . 175 III.II. Különféle szerkesztési módszerek
177
4. § Geometriai transzformációk. Az inverzió . . . . . . . . . . . . . . . . . . 177 1. Általános megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . 177 2. Az inverzió tulajdonságai . . . . . . . . . . . . . . . . . . . . . . . . . 179 3. Inverz pontok geometriai megszerkesztése . . . . . . . . . . . . . . . . 181 4. Vonalszakasz megfelezése és a kör középpontjának meghatározása pusztán körző használatával . . . . . . . . . . . . . . . . . . . . . 183 5. § Egyéb segédeszközöket használó szerkesztések. Mascheroni-féle szerkesztések pusztán körző használatával . . . . . . . . . . . . . . . . . . . . . . . 185 *1. A kocka megkettőzésének klasszikus szerkesztési módja . . . . . . . . 185 2. A körző geometriája . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 3. Rajzolás mechanikus eszközökkel. Mechanikus görbék. Cikloisok . . . 192 *4. Csuklós szerkezetek. Peaucellier-féle és Hart-féle inverzorok . . . . . 195 6. § Az inverzió néhány sajátsága és alkalmazása . . . . . . . . . . . . . . . . 199 1. Szögállandóság. Körseregek . . . . . . . . . . . . . . . . . . . . . . . . 199 2. Alkalmazás az Apollóniosz-féle feladatok megoldására . . . . . . . . . 202 *3. Töbszörös tükrözesek
. . . . . . . . . . . . . . . . . . . . . . . . . . 204
IV. Projektív geometria. Axiomatika. Nem-euklidészi geometriák
207
1. § Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 1. Geometriai tulajdonságok osztályozása. Transzformációk invariánsai . 207
iv
2. Projektív transzformációk . . . . . . . . . . . . . . . . . . . . . . . . . 209 2. § Alapfogalmak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 1. A projektív transzformációk csoportja . . . . . . . . . . . . . . . . . . 210 2. Desargues tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 3. § Kettősviszony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 1. A kettősviszony definíciója és invariáns voltának bizonyítása . . . . . 215 2. A teljes négyoldal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 4. § Párhuzamosság és végtelen . . . . . . . . . . . . . . . . . . . . . . . . . . 224 1. Végtelen távoli pontok mint „ideális pontok” . . . . . . . . . . . . . . 224 2. Ideális elemek és projekció . . . . . . . . . . . . . . . . . . . . . . . . 228 3. Kettősviszony végtelen távoli elemekkel . . . . . . . . . . . . . . . . . 230 5. § Alkalmazások
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
1. Előzetes megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 2. A síkbeli Desargues-tétel bizonyítása
. . . . . . . . . . . . . . . . . . 232
3. Pascal tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 4. Brianchon tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 5. A dualitás elvéről . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 6. § Analitikus előállítási mód . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 1. Bevezető megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . 238 *2. Homogén koordináták. A dualitás algebrai alapja . . . . . . . . . . . 239 7. § Vonalzó használatával megszerkeszthető feladatok . . . . . . . . . . . . . 244 8. § Kúpszeletek és másodrendű felületek . . . . . . . . . . . . . . . . . . . . 246 1. Kúpszeletek elemi metrikus geometriája . . . . . . . . . . . . . . . . . 246 2. Kúpszeletek projektív tulajdonságai . . . . . . . . . . . . . . . . . . . 250 3. Kúpszelet mint burkológörbe . . . . . . . . . . . . . . . . . . . . . . . 255 4. A kúpszeletekre vonatkozó általános Pascal- és Brianchon-féle tételek 259 5. A hiperboloid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 9. § Axiomatika és nem-euklidészi geometria . . . . . . . . . . . . . . . . . . . 264 1. Az axiomatikus módszer . . . . . . . . . . . . . . . . . . . . . . . . . 264 2. Hiperbolikus nem-euklidészi geometria . . . . . . . . . . . . . . . . . 268 3. Geometria és valóság . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
v
4. A Poincaré-féle modell . . . . . . . . . . . . . . . . . . . . . . . . . . 275 5. Elliptikus vagy Riemann-féle geometria . . . . . . . . . . . . . . . . . 276 Függelék *Több dimenziós terek geometriája . . . . . . . . . . . . . . . . . . 279 1. Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 2. Analitikus eljárás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 *3. Geometriai vagy kombinatorikus eljárás . . . . . . . . . . . . . . . . 282 V. Topológia
287
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 1. § Euler poliéder tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 2. § Az alakzatok topologikus tulajdonságai . . . . . . . . . . . . . . . . . . . 293 1. Topologikus tulajdonságok . . . . . . . . . . . . . . . . . . . . . . . . 293 2. Összefüggés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 3. § További példák topológiai tételekre . . . . . . . . . . . . . . . . . . . . . 297 1. Jordan-féle síkgörbetétel . . . . . . . . . . . . . . . . . . . . . . . . . 297 2. A négyszínprobléma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 *3. A dimenzió fogalma . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 *4. Egy fixponttétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 5. Csomók . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 4. § Felületek topológiai osztályozása . . . . . . . . . . . . . . . . . . . . . . . 311 1. A felületek nemszáma . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 *2. A felület Euler-féle karakterisztikája . . . . . . . . . . . . . . . . . . 313 3. Egyoldalú felületek . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 Függelék . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 *1. Az ötszíntétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 2. A Jordan-tétel sokszögek esetében . . . . . . . . . . . . . . . . . . . . 322 **3. Az algebra alaptétele . . . . . . . . . . . . . . . . . . . . . . . . . . 325 VI. Függvény és határérték
329
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 1. § Változók és függvények . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 1. Definíciók és példák . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
vi
2. Az ívmérték . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 3. A függvény grafikus ábrázolása. Inverz üggvény
. . . . . . . . . . . . 336
4. Összetett függvények . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 5. Folytonosság . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 *6. Több változós függvények . . . . . . . . . . . . . . . . . . . . . . . . 345 *7. Függvény és transzformáció . . . . . . . . . . . . . . . . . . . . . . . 348 2. § Határérték . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349 1. Az an sorozat határértéke . . . . . . . . . . . . . . . . . . . . . . . . . 349 2. Monoton sorozatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 3. Az Euler-féle e szám . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 4. A π szám . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 *5. Lánctörtek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 3. § Függvény határértéke folytonos megközelítéssel
. . . . . . . . . . . . . . 366
1. Bevezetés. Általános definíció . . . . . . . . . . . . . . . . . . . . . . . 366 2. Megjegyzések a határérték fogalmáról . . . . . . . . . . . . . . . . . . 369 3. A (sin x)/x határértéke . . . . . . . . . . . . . . . . . . . . . . . . . . 371 4. Határérték, ha x → ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 4. § A folytonosság pontos definíciója . . . . . . . . . . . . . . . . . . . . . . . 375 5. § A folytonos függvények elméletének két alapvető tétele . . . . . . . . . . 378 1. Bolzano tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378 *2. Bolzano tételének bizonyítása . . . . . . . . . . . . . . . . . . . . . . 379 *3. Weierstrass tétele szélső értékek létezéséről . . . . . . . . . . . . . . 380 *4. Egy sorozatokra vonatkozó tétel. Zárt halmazok
. . . . . . . . . . . 382
6. § Bolzano tételének néhány alkalmazása . . . . . . . . . . . . . . . . . . . . 384 1. Geometriai alkalmazások . . . . . . . . . . . . . . . . . . . . . . . . . 384 *2. Egy mechanikai probléma . . . . . . . . . . . . . . . . . . . . . . . . 387 Kiegészítés a VI. fejezethez. További példák a határértékre és a folytonosságra391 1. § Példák a határértékre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 1. Általános megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . 391 2. qn határértéke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392 √ 3. n p határértéke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
vii
4. A szakadásos függvények, mint folytonos függvények határértékei
. . 395
*5. Határérték kiszámítása iterációval . . . . . . . . . . . . . . . . . . . 396 2. § Példa a folytonosságra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398 VII. Szélső értékek
399
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 1. § Elemi geometriai feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . 400 1. Háromszög maximális területe, ha a háromszög két oldala adott . . . 400 2. Héron tétele. A fénysugarak szélső érték tulajdonsága . . . . . . . . . 400 3. A Héron-tétel alkalmazása háromszög-feladatokra . . . . . . . . . . . 403 4. Az ellipszis és hiperbola érintési tulajdonságai. Megfelelő szélső érték tulajdonságok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 *5. Adott görbék extrém távolságai . . . . . . . . . . . . . . . . . . . . . 408 2. § Szélső érték problémák egyik általános alapelve . . . . . . . . . . . . . . 411 1. Az elv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 2. Példák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 3. § Stacionárius pontok és a differenciálszámítás . . . . . . . . . . . . . . . . 414 1. Szélső értékek és stacionárius pontok . . . . . . . . . . . . . . . . . . 414 2. Több változós függvények maximuma és minimuma. Nyeregpontok . 416 3. Minimax pontok és a topológia . . . . . . . . . . . . . . . . . . . . . . 418 4. A pont távolsága egy felülettől . . . . . . . . . . . . . . . . . . . . . . 419 4. § A Schwarz-féle háromszögprobléma . . . . . . . . . . . . . . . . . . . . . 420 1. Schwarz bizonyítása . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 2. Másik bizonyítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 3. Tompaszögű háromszög . . . . . . . . . . . . . . . . . . . . . . . . . . 425 4. Háromszögek fénysugarakból . . . . . . . . . . . . . . . . . . . . . . . 426 *5. Néhány megjegyzés tükrözési problémákról és ergodikus mozgásról . 427 5. § Steiner-féle probléma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 1. A probléma megoldása . . . . . . . . . . . . . . . . . . . . . . . . . . 429 2. A két lehetőség elemzése . . . . . . . . . . . . . . . . . . . . . . . . . 431 3. Egy komplementer probléma . . . . . . . . . . . . . . . . . . . . . . . 433 4. Megjegyzések és feladatok
viii
. . . . . . . . . . . . . . . . . . . . . . . . 434
5. Általánosítás úthálózat-probléma esetére . . . . . . . . . . . . . . . . 435 6. § Szélső pontok és egyenlőtlenségek . . . . . . . . . . . . . . . . . . . . . . 436 1. A két pozitív mennyiség aritmetikai és geometriai közepe . . . . . . . 437 2. Általánosítás n változó esetére . . . . . . . . . . . . . . . . . . . . . . 439 3. A legkisebb négyzetek elve . . . . . . . . . . . . . . . . . . . . . . . . 440 7. § Szélső pont létezése. Dirichlet-féle elv . . . . . . . . . . . . . . . . . . . . 442 1. Általános megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . 442 2. Példák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 3. Elemi szélső érték problémák . . . . . . . . . . . . . . . . . . . . . . . 446 4. A bonyolultabb esetek nehézségeiről . . . . . . . . . . . . . . . . . . . 448 8. § Az izoperimetrikus probléma . . . . . . . . . . . . . . . . . . . . . . . . . 449 *9. § Szélső érték feladatok kerületi feltételekkel. Összefüggés Steiner problémája és az izoperimetrikus probléma között . . . . . . . . . . . . . . . . 453 10. § Variációszámítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 1. Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456 2. Variációszámítás. Fermat elve az optikában . . . . . . . . . . . . . . . 458 3. Bernoulli módszere a brachistochrone-probléma megoldására . . . . . 460 4. Geodetikus vonalak a gömbön. Geodetikus vonalak és maximinimumok462 11. § Minimumproblémák kísérleti megoldása. Szappanbuborék-kísérletek . . 463 1. Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 2. Szappanbuborék-kísérletek . . . . . . . . . . . . . . . . . . . . . . . . 464 3. A Plateau-probléma körébe tartozó új kísérletek . . . . . . . . . . . . 466 4. Egyéb matematikai problémák kísérleti megoldása . . . . . . . . . . . 470 VIII. Az integrál- és differenciálszámítás
477
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477 1. § Az integrál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 1. Terület mint határérték . . . . . . . . . . . . . . . . . . . . . . . . . . 479 2. Az integrál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480 3. Általános megjegyzések az integrálfogalomról. Általános definíció
. . 484
4. Példák integrálásra. xn integrálása . . . . . . . . . . . . . . . . . . . . 487 5. Az integrálszámítás szabályai . . . . . . . . . . . . . . . . . . . . . . . 493
ix
2. § A derivált
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498
1. A derivált mint érintő iránytangense . . . . . . . . . . . . . . . . . . . 498 2. A derivált mint határérték . . . . . . . . . . . . . . . . . . . . . . . . 499 3. Példák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502 4. A trigonometrikus függvények deriváltjai . . . . . . . . . . . . . . . . 506 *5. Differenciálás és folytonosság . . . . . . . . . . . . . . . . . . . . . . 507 6. Derivált és sebesség. Második derivált és gyorsulás . . . . . . . . . . . 507 7. A második derivált geometriai jelentése . . . . . . . . . . . . . . . . . 511 8. Maximum és minimum . . . . . . . . . . . . . . . . . . . . . . . . . . 512 3. § A differenciálás technikája . . . . . . . . . . . . . . . . . . . . . . . . . . 513 4. § Leibniz jelölése és a „végtelen kicsiny” . . . . . . . . . . . . . . . . . . . . 520 5. § Az integrál- és differenciálszámítás alaptétele . . . . . . . . . . . . . . . . 524 1. Az alaptétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524 2. Első alkalmazások. xr , cos x, sin x, arc tg x integrálása . . . . . . . . . 528 3. Leibniz formulája π meghatározására . . . . . . . . . . . . . . . . . . 530 6. § Az exponenciális függvény és a logaritmus . . . . . . . . . . . . . . . . . 532 1. A logaritmus definíciója és tulajdonságai. Az Euler-féle e szám . . . . 533 2. Az exponenciális üggvény . . . . . . . . . . . . . . . . . . . . . . . . . 537 3. Képletek ex , ax , xs , differenciálására . . . . . . . . . . . . . . . . . . . 540 4. e, ex , ln x határértékként való explicit kifejezése . . . . . . . . . . . . 541 5. Végtelen sorok a logaritmusra. Numerikus számítások . . . . . . . . . 544 7. § Differenciálegyenletek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 547 1. Definíció . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 547 2. Az exponenciális függvény differenciálegyenlete. Radioaktív bomlás. A növekedés törvénye. Kamatos kamat . . . . . . . . . . . . . . . . 549 3. További példák. Legegyszerűbb rezgőmozgások . . . . . . . . . . . . . 553 4. Newton dinamikai alaptörvénye . . . . . . . . . . . . . . . . . . . . . 556 Kiegészítés a VIII. fejezethez
559
1. § Elvi kérdések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559 1. Differenciálhatóság . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559 2. Az integrál . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562
x
3. Az integrálfogalom egyéb alkalmazásai. Munka. Hosszúság . . . . . . 563 2. § Nagyságrend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 1. Az exponenciális függvény és x hatványai . . . . . . . . . . . . . . . . 567 2. ln(n!) nagyságrendje
. . . . . . . . . . . . . . . . . . . . . . . . . . . 570
3. § Végtelen sorok és végtelen szorzatok . . . . . . . . . . . . . . . . . . . . . 571 1. Végtelen függvénysorok . . . . . . . . . . . . . . . . . . . . . . . . . . 571 2. Euler képlete: cos x + i sin x = eix . . . . . . . . . . . . . . . . . . . . . 578 3. A harmonikus sor és a zéta-függvény. Euler végtelen sora a szinuszfüggvényre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581 **4. § A prímszámtétel levezetése statisztikus módszerrel . . . . . . . . . . . 585 IX. Újabb fejlemények
591
1. § Prímeket előállító képletek . . . . . . . . . . . . . . . . . . . . . . . . . . 591 2. § A Goldbach-sejtés és az ikerprímek . . . . . . . . . . . . . . . . . . . . . 593 3. § A nagy Fermat-tétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595 4. § A kontinuum-hipotézis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 5. § Halmazelméleti jelölések . . . . . . . . . . . . . . . . . . . . . . . . . . . 599 6. § A négyszín-tétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 600 7. § Hausdorff-dimenziók és fraktálok . . . . . . . . . . . . . . . . . . . . . . . 605 8. § Csomók . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608 9. § Egy mechanikai probléma . . . . . . . . . . . . . . . . . . . . . . . . . . . 612 10. § A Steiner-féle probléma . . . . . . . . . . . . . . . . . . . . . . . . . . . 614 11. § Szappanhártyák és minimum-felületek . . . . . . . . . . . . . . . . . . . 621 12. § Nemsztenderd analízis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626 Függelék. Kiegészítő megjegyzések, problémák és feladatok Aritmetika és algebra
633
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
Analitikus geometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 635 Geometriai szerkesztések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642 A projektív és a nem-euklidészi geometria . . . . . . . . . . . . . . . . . . . . 643 Topológia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 Függvény, határérték és folytonosság . . . . . . . . . . . . . . . . . . . . . . . 648
xi
Maximumok és minimumok . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649 A differenciál- és integrálszámítás . . . . . . . . . . . . . . . . . . . . . . . . . 651 Az integrálás technikája . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653 Javaslat, további olvasmányokra
661
Általános művek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661 I. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 II. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662 III. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663 IV. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664 V. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664 VI. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664 VII. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 VIII. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665 Javaslat, további újabb olvasmányokra
667
Általános művek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667 IX. fejezet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669 1. §. Prímeket előállító képletek . . . . . . . . . . . . . . . . . . . . . . . 669 2. §. A Goldbach-sejtés és az ikerprímek . . . . . . . . . . . . . . . . . . 669 3. §. A nagy Fermat-tétel . . . . . . . . . . . . . . . . . . . . . . . . . . 669 4. §. A kontinuum-hipotézis . . . . . . . . . . . . . . . . . . . . . . . . . 670 5. §. Halmazelméleti jelölések . . . . . . . . . . . . . . . . . . . . . . . . 670 6. §. A négyszín-tétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670 7. §. Hausdorff-dimenziók és fraktálok . . . . . . . . . . . . . . . . . . . 671 8. §. Csomók . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671 9. §. Egy mechanikai probléma . . . . . . . . . . . . . . . . . . . . . . . 672 10. §. A Steiner-féle probléma . . . . . . . . . . . . . . . . . . . . . . . . 672 11. §. Szappanhártyák és minimum-felületek . . . . . . . . . . . . . . . . 672 12. §. Nemsztenderd analízis . . . . . . . . . . . . . . . . . . . . . . . . . 672
xii
Előszó a második kiadáshoz A Mi a matematika a nagy klasszikusok egyike, a matematika legszebb drágaköveinek sziporkázó gyűjteménye. Szerzői e könyvvel szerették volna megcáfolni, hogy „a matematika nem más, mint definíciókból és posztulátumokból levezetett következmények rendszere, melyeknek következeteseknek kell ugyan lennie, de ettől eltekintve a matematikus szabad akarata hívja őket életre”. Röviden, a könyv szerette volna visszaadni a matematika értelmét. De ez az értelem nagyon eltér a fizikai valóságtól, mivel a matematikai objektumok „csupán a matematikailag ‘nem definiált objektumok’ közötti kapcsolatokat és a velük végezhető műveletek szabályait adják meg”. Lényegtelen, hogy mik ezek a matematikai objektumok, csak azt számít, hogy mit tesznek. Ezért aztán a matematika a valóság és a képzelet között lebeg, értelme nem a formális elvonatkoztatásokban van, de nem is megfogható. Ez gondokat okozhat a filozófusoknak, akik szeretik a rendezett kategóriákat, ugyanakkor a matematikának ez a nagy erőssége, amit egy másik alkalommal a matematika „irreális realitásának” hívtam. A matematika kapcsolatot teremt a képzelt fogalmak és fizikai dolgok valós világa között, de sem az egyikben, sem a másikban nincs benne teljesen. A Mi a matematikával először 1963-ban találkoztam. Akkoriban kezdtem tanulmányaimat a Cambridge-i Egyetemen, ahol ez a könyv volt a jövendő matematikus hallgatók ajánlott olvasmánya. Még ma is haszonnal forgathatják a lapjait azok, akik szeretnének előzetes áttekintést kapni az egyetemi szintű matematikáról. De azoknak is sok örömük lehet Courant és Robbins mesterművében, akik nem matematikusok. Ehhez csupán bizonyos mértékű figyelemre és a matematikai iránti érdeklődésre van szükség, és annyi előismeretre, hogy ne érezzük magunkat kényelmetlenül. Elégséges a középiskolai szintű algebra, az alapszintű differenciál- és integrálszámítás, valamint a trigonometrikus függvények ismerete, de nem árt egy kevés euklideszi geometria ismerete sem. Azt hihetnénk, hogy egy olyan könyv, melynek utolsó kiadása majdnem ötven évvel ezelőtt jelent meg, régi vágású, elavult, és a szempontjai sem felelnek meg az aktuális
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173859+02’00’
xiii
irányzatnak. De a valóság az, hogy a Mi a matematika hihetetlenül jól viselte az eltelt éveket. A feladatmegoldásra fektetett hangsúlya megfelel a mai elvárásoknak, és az általa tárgyalt anyag olyan jól bírta az időt, hogy egyetlen szót vagy szimbólumot sem kellett törölni az új kiadásból. Ha azt hiszik, hogy ez azért van így, mert a matematikában soha semmi se változik, akkor kérem, nézzék meg az „Újabb fejlemények” című fejezetet, ami jól mutatja a változások gyorsaságát. Nem, a könyv nem azért viselte jól az eltelt éveket, mert a matematika nem fejlődik, hanem azért, mert olyan témákat tárgyal, amelyekben a régi felfedezések ritkán válnak érvénytelenné. Egy tételt nem lehet „be nem bizonyítottá” tenni. Az persze megeshet, hogy egy jónak hitt bizonyításról kiderül, hogy helytelen – láttunk már ilyet. De akkor eredetileg sem volt bebizonyítva a tétel. Az új szempontok miatt viszont a régi bizonyítások gyakran elavulttá, vagy a korábbi tények érdektelenné válnak. A Mi a matematika azért viselte ilyen jól az eltelt éveket, mert Richard Courant és Herbert Robbins hibátlan érzékkel választotta meg a benne tárgyalt anyagot. A formális matematika olyan, mint a helyesírás vagy a nyelvtan: csak a szabályok helyes alkalmazásától függ. Az értelemmel bíró matematika olyan, mint az újságírás: egy érdekes történetet mesél el. Egyes újságcikkekkel ellentétben a matematika által elmesélt történetnek igaznak kell lennie. A legkiválóbb matematika olyan, mint az irodalom: életre kelt egy történetet, és minket is bevon a történetbe, szellemileg és érzelmileg egyaránt. Matematikailag szólva, a Mi a matematika egy nagyon pontos mű. Az új fejezetnek az a célja, hogy Courant és Robbins történeteit aktualizálja, pl. a négyszín-tétel vagy a nagy Fermat-tétel bizonyításának a leírása révén. Courant és Robbins idejében ezek még megoldatlanok voltak, de azóta sikerült megoldani őket. Csupán egyetlen egy igazi matematikai hiba van a könyvben (lásd az „Újabb fejlemények” 9. §-át). Úgy hiszem, a szóban forgó kérdés jól szemlélteti, hogy mit jelent a nézőpont megváltozása. Courant és Robbins érvelése a megadott feltevések fennállása esetén helyes, de ezek a feltevések ma már kevésbé látszanak észszerűnek. Meg sem próbáltam olyan újabb témákkal bővíteni a tárgyalást, melyek mostanában kerültek az érdeklődés előterébe: pl. a káoszelmélettel, a sérült szimmetriákkal, valamint a XX. század utolsó évtizedeinek sok más érdekes matematikai felfedezésével. Ezek számos egyéb forrásban fellelhetők, pl. A végtelen megszelidítése című könyvemben,
xiv
ami akár úgy is tekinthető, mint a Mi a matematika jelenlegi kiadásának egyfajta kiegészítő kötete. Általában úgy jártam el, hogy csak azzal bővítettem az anyagot, ami az eredetit korszerűvé, aktuálissá tette, bár néhány alkalommal megszegtem ezt a szabályt, és néhány alkalommal erős késztetést éreztem arra, hogy megszegjem a szabályt. Hogy mi a matematika? Egyedülálló csoda. Coventry, 1995. június Ian Stewart.
xv
Az első kiadás előszava Több mint kétezer éve már, hogy minden művelt ember szellemi fegyvertárához tartozik némi jártasság a matematikában. Napjainkban azonban a nevelés terén súlyos veszélyben van a matematikának ez a tradicionális helyzete. Szerencsétlenségünkre, a matematika hivatalos képviselői is felelősek ebben. A matematika tanítása sok helyütt üres feladatmegoldások begyakorlásává süllyedt, ami hasznos lehet ugyan a képletek alkalmazása szempontjából, de sem igazi megértéséhez, sem nagyobb szellemi függetlenséghez nem vezet. Ugyanakkor a matematikai kutatás nagyon hajlamos lett a túlságos szakosodásra, és az absztrakció fontosságának túlzott hangsúlyozására. Elhanyagolják az alkalmazásokat és a rokon területekkel való összefüggéseket. Ezek azonban a legkevésbé sem jogosítanak fel minket a visszavonulásra és elszigetelődésre. Ezeknek a körülményeknek éppen az ellenkező reakciót kell kiváltani mindenkiben, akiben felelősségérzet van. Tanítók, tanulók és a művelt közönség egyaránt konstruktív reformokat igényelnek, nem pedig visszavonulást a legkisebb ellenállás irányába. Az a céljuk, hogy organikus egészként értsék meg a matematikát, mint a természettudományos gondolkodás és cselekvés alapját. Néhány kitűnő matematikus-életrajz és matematikatörténet, meg néhány problémakeltő népszerűsítő írás tudatosította már ezeket a rejtett igényeket. De matematikai tudást ezeken a közvetett utakon keresztül nem lehet szerezni. A matematika megértését éppúgy lehetetlen könnyű szórakozásként közvetíteni, mint ahogy zenei műveltséget sem adhat még a legragyogóbb népszerűsítés sem annak, aki maga nem hallgatott hosszú időn át intenzíven zenét. Az élő matematika tárgyával kell tényleges érintkezésbe kerülni. Ez nem jelenti azt, hogy a technikai részleteknél kell időzni. A matematikának egyaránt mentesnek kell lennie a rutin hangsúlyozásától és attól az ijesztő dogmatizmustól, amely minden célt és motívumot elrejt. Annál is inkább, mert hiszen egyenes út vezet a legegyszerűbb elemektől azokig a kilátókig, ahonnan a modern matematika tárgya és hajtóerői kényelmesen áttekinthetők. Ez a könyv ilyen irányú kísérlet. Nem használ fel többet, mint amit egy jobb középis-
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173859+02’00’
xvii
kolában mindenki megtanult – ennyiben népszerűnek tekinthető, nem akarja az olvasót minden fáradságtól megkímélni. Elég nagyfokú szellemi érettséget kíván olvasójától, és mindenekelőtt azt a készséget, hogy hajlandó legyen saját fejével gondolkozni. A könyvet egyformán szántuk kezdőknek és tudósoknak, diákoknak és tanároknak, filozófusoknak és mérnököknek, tankönyvnek és kézikönyvnek. Lehet, hogy ez a szándék túlságosan igényes. Más munkák sürgető nyomása miatt engedményeket is kellett tennünk, hogy sok évi munka után, de anélkül, hogy mégis teljesen kész lenne, kiadhassuk a könyvet. Minden ötletet és kritikát örömmel fogadunk. Legfőképpen pedig azt reméljük, hogy a könyv hasznos szolgálatokat tesz majd annak az amerikai felsőoktatásnak, amelyik mély hálára kötelezte a szerzőt azzal, hogy otthont és munkalehetőséget adott neki. A könyv tervéért és eszmei kivitelezéséért minden felelősség az előszó aláíróját terheli, akinek mindent, ami a könyv javára írható, meg kell osztania Herbert Robbins-szal. Ő önzetlenül magáévá tette a könyv ügyét, amióta csak csatlakozott a munkához, és közreműködésének lényeges része van abban, hogy a művet jelen formájában befejezhettük. Sok barátomat illeti meg hálás köszönet segítségükért. Hosszú beszélgetések Niels Bohr -ral, Kurt Friedrichs-szel és Ottó Neugebauer -rel erősen hatottak a könyv filozófiai és történeti szempontjaira. Edna Kramer a pedagógus szemszögéből bírálta a művet, s kritikájával javított a könyvön. David Gilbarg készítette az első jegyzetet előadásaimból, s ebből nőtt ki később a könyv. A kézirat gépelésének és újra gépelésének fárasztó munkájában Ernest Courant, Norman Davids Charles de Prima, Alfred Horn, Herbert Mintzer, Wolfgang Wasow és mások segítettek, nekik egyben sok részletjavítás is köszönhető. Donald Flanders értékes ötletekkel segítette, és ő hozta nyomdakész állapotba a kéziratot. A rajzokat John Knudsen, Hertha von Gumppenberg, Irving Ritter és Otto Neugebauer készítették. A példák gyűjtésében és a függelék összeállításában H. Whitney is részt vett. A Rockefeller-alapítvány kiadói tanácsa készségesen segített azoknak a jegyzeteknek a megjelentetésében, amelyek később a könyv alapjául szolgáltak. Köszönet illeti a Wawerly nyomdát, elsősorban C. Orth igazgatót a kivételesen szakszerű munkáért, és az Oxfordi Egyetemi Nyomdát, elsősorban Philip Vaudrin és W. Oman urakat, bátorító kezdeményezésükért és közreműködésükért. R. Courant.
xviii
New Rochelle, N.Y., 1941. augusztus 22.
A javított kiadások előszava A legutóbbi évek eseményeinek kényszerítő ereje hirtelen megnövelte a matematikai felvilágosítás és nevelés szükségességét. Ezzel párhuzamosan még inkább növekedett a csalódás és a kiábrándulás veszélye, feltéve, hogy diákok és tanárok nem kísérlik meg a matematikai képletek és eljárások mögé való bepillantást, és nem kísérlik meg felfogni a matematika valódi lényegét. Ezt a könyvet ilyen diákoknak és tanároknak írtuk, és az első kiadás fogadtatása alapján a szerzők azt remélik, hogy nem eredménytelenül. Az olvasók kritikája alapján számos helyen kiigazítottuk és javítottunk a könyvön. Hálás köszönet illeti meg Natasa Artin úrhölgyet, aki önzetlenül segített a negyedik kiadás előkészítésében. New Rochelle, N.Y., 1943. március 18. 1945. október 10. 1947. október 28. R. Courant.
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173859+02’00’
xix
Hogyan használjuk ezt a könyvet A könyvet határozott sorrend szerint írtuk, de azért az olvasónak nem kell lapról lapra, fejezetről fejezetre átrágnia magát rajta. Pl. a történelmi és filozófiai bevezetést akkor legcélszerűbb elolvasni, amikor már az egész könyvet feldolgoztuk. Az egyes fejezetek nagymértékben függetlenek egymástól. Gyakran előfordul, hogy egy fejezet elején könnyen érthető, de azután meredekebbé válik az út, és a fejezet vége a hozzátartozó kiegészítésekkel már elég nehéz. Így az az olvasó, akinek nem szaktudásra, hanem általános információra van szüksége, megelégedhet egy olyan válogatással, amelyik a részletesebb tárgyalásokat kihagyja. Kevés matematikai előismerettel rendelkező diákoknak szükségképpen válogatniuk kell. Csillaggal (*) vagy kisbetűs szedéssel jelezzük azokat a részeket, amik az első olvasáskor nyugodtan elhagyhatók, anélkül, hogy a kihagyások a későbbiek megértését zavarnák. Még annak sincs semmi akadálya, hogy az olvasó kizárlólag az őt érdeklő fejezetek áttanulmányozására szorítkozzék. A legtöbb feladat különbözik a megszokottaktól, a nehezebbeket csillaggal jelöltük. Ne ijedjen meg az olvasó, ha legnagyobb részüket nem sikerül majd megoldania. Középiskolák felső tagozataiban tanító tanárok sok értékes anyagot találnak majd tehetségesebb diákjaikból alakított szakköreik számára a geometriai szerkesztésekről és a szélső érték számításról szóló fejezetekben. Reméljük, hogy a könyv az egyetemi hallgatók hasznos segítsége lesz elsőéves koruktól az államvizsgáig, ugyanúgy azoknak a természettudományos szakmákban dolgozó embereknek is, akiket őszintén érdekel a tudomány. Az sem lehetetlen, hogy még a matematika alapjairól tartott egyetemi kollégiumok vezérfonalául is szolgálhat, ha ezt a tantárgyat nem a megszokott értelemben kívánná előadni valaki. A III., IV. és V. fejezet geometriai kollégiumokban használható, a VI. és VIII. fejezet együtt teljes bevezetés az infinitezimális számításba, inkább a megértésre, semmint a gyakorlatra helyezve a hangsúlyt. Jól használható bevezető szövegként, ha az előadó azután a speciális szükségletnek megfelelően kiegészíti az anyagot, elsősorban numerikus példákkal. A szövegben elszórt,
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173859+02’00’
xxi
és a könyv végén egybegyűjtött sok feladat azt a célt szolgálja, hogy megkönnyítse a könyv oktatásban való felhasználását.
xxii
Mi a matematika? A matematika az emberi gondolkodás jellegzetes terméke. A megfigyelő értelem, a vállalkozó kedv és az esztétikai érzék egyaránt a legtisztábban fejeződik ki benne. Egyesíti magában a logikát és a szemléletet, az analízist és a szerkesztést, a jelenségek individualizálását és a megjelenési formák absztrakcióját. Lehet, hogy a divat vagy a hagyományok ezek közül az egyik vagy a másik szempontot helyezik előtérbe, a matematika tudományának életereje és legnagyobb értéke azonban ezeknek az ellentéteknek összhangján és a szintézisükre való törekvésen alapul. Kétségtelen, hogy a fejlődést a matematika minden ágában valamilyen gyakorlati igény és a valóságos dolgok megfigyelése indította el, s ez még akkor is így van, ha ezt az összefüggést az oktatásban és a specializálódott kutatásban már elfelejtették. Ha azonban a fejlődés az alkalmazás szükségességének nyomása alatt elindult, többnyire átlendül a közvetlen felhasználhatóság határain. Ez az átmenet az alkalmazott tudományokból az elméleti tudományokba jól észlelhető az ókori fejlődésben, s ezt támasztja alá az a sok felfedezés is, amivel fizikusok és mérnökök gazdagították a modern matematikát. A matematika története az ókori Keleten kezdődik, ahol i. e. 2000 körül a babilóniaiak gazdag – mai ismereteink szerint az elemi algebra körébe sorolható – anyagot gyűjtöttek össze. Mai értelemben vett tudományként azonban csak jóval később, görög földön jelent meg a matematika az i. e. V. és IV. században. A Kelet és Görögország közötti kapcsolat a perzsa birodalom idején kezdődött, és Nagy Sándor korát követően érte el tetőpontját, megismertetve a görögökkel a babilóniaiak matematikai és csillagászati eredményeit. Nemsokára ezután a matematika a görög városállamok intellektuális köreiben szokásos filozófiai viták tárgya lett. E viták során a görög gondolkodók felismerték, hogy milyen nehézségek rejlenek az olyan fogalmakban, mint a mozgás, a végtelen és a tetszőleges mennyiségeknek adott egységekkel történő mérése. A nehézségeket csodálatra méltó módon oldották meg. Az eredmény Eudoxosz kontinuum elmélete volt. Ehhez fogható teljesítményt csak 2000 év múlva láthatunk az irracionális számok modern elméletében.
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173859+02’00’
xxiii
A matematika deduktív, axiomatikus felfogása is Eudoxosz korában keletkezett, s Euklidész Elemei -ben kristályosodott ki. Jóllehet a görög matematikának az elméleti és axiomatikus vonás a legfőbb jellegzetessége, és máig is ebben van a legnagyobb hatása, nem lehet eléggé hangsúlyozni, hogy az alkalmazások és a fizikai valósággal létesíthető kapcsolat legalább ilyen fontos volt az antik matematikában. Ennek megfelelően gyakran szívesen alkalmaztak az euklideszinél kevésbé szigorú bizonyítást is. Nem lehetetlen, hogy az inkommenzurábilis mennyiségekkel összefüggő nehézségek korai felfedezése térítette el a görögöket a numerikus számolás továbbfejlesztésétől, bár ez Keleten már igen előrehaladott volt. Ehelyett utat vágtak maguknak a tiszta axiomatikus geometria sűrűjébe. A tudománytörténet egyik legkülönösebb kitérője jött ezáltal létre, s az emberiség talán nagyon nagy lehetőségeket mulasztott el. A görög geometriai tradíció tekintélye ugyanis csaknem kétezer évig késleltette a számfogalom és az algebrai módszerek elkerülhetetlen fejlődését, ami ma a modern természettudomány alapja. Az egy helyben topogás hosszú korszaka és lassú előkészítés után a XVII. században robbant ki a matematika és a természettudományok forradalma az analitikus geometriával s az infinitezimális számítással. Az új matematika úttörői valósággal tobzódtak az eredményekben, s a matematika kincsesházának lenyűgöző új világát hódították meg. A görög geometria megőrizte fontosságát, de a kristálytiszta axiomatizáció és a rendszeres dedukció ideálja eltűnt a XVII. és XVIII. század folyamán. A matematika úttörői lényegtelennek vélték a tiszta definíciókból és önellentmondás-mentes „evidens” axiómákból kiinduló pontos logikai okfejtést. Az összefüggések intuitív megsejtése és az újonnan felfedezett formális módszerek szinte emberfeletti erejéről való vak meggyőződés keveredett a logikailag megfoghatatlan „végtelen kicsi” majdnem misztikus tiszteletével, s ez késztetett az új hódításokra. A haladás önkívületét azután fokról fokra felváltotta a kritikai önfegyelem szelleme, amikor a francia forradalom után a tudományos élet alapja óriási mértékben kiszélesedett, és az új módszerek fölötti uralom nem lehetett többé csupán a biztos matematikai érzékkel rendelkező tudósok kis rétegének fenntartva. A tudósok az új matematika alapelveinek revideálására és magyarázására kényszerültek. Kiváltképpen szükséges volt, hogy a differenciál- és integrálszámítást s a határértékfo-
xxiv
galmat a tanulni vágyók szélesebb rétegei számára hozzáférhetővé tegyék. Így a XIX. század nemcsak az új haladás százada lett, hanem a pontosság és a szigorú bizonyítás klasszikus ideáljaihoz való visszatérésé is. Utóbbi tekintetében olyan sikeres volt, hogy még a görög tudomány nyújtotta példaképet is felülmúlta. Az inga ismét a tiszta logika és absztrakció oldalára lendült. Méghozzá olyan mértékben, hogy a „tiszta” matematika és létfontosságú alkalmazási területei között veszélyes szakadék keletkezett. Lehet, hogy a matematikusok és az egyéb tudósok közötti elidegenedés a kritikai revízió korszakában elkerülhetetlen volt. Mégis úgy látszik, s mindenesetre remélhető, hogy az elszigetelődésnek ez a korszaka lezárult. A visszanyert belső erő és az az óriási egyszerűsödés, amelyet a mélyebb megértés hozott létre, ma már lehetővé teszi a matematikai elmélet tökéletes ismeretét anélkül, hogy alkalmazásait el kellene hanyagolni. A közeljövőben éppen az lesz a matematikusok legfontosabb feladata, hogy helyreállítsák a tiszta és alkalmazott tudomány közötti szerves egységet, s józan egyensúlyt teremtsenek absztrakt általánosság és színes részletek között. Nincs itt helye részletekbe menő filozófiai vagy pszichológiai analízisnek. Néhány fontosabb tény említésére szorítkozunk csupán. Igen veszélyesnek tartjuk a matematika deduktív-posztulációs jellegének jelenleg uralkodó túlságos hangsúlyozását. Igaz, nem lenne könnyű egyszerűen leírni, hogy mi a teremtő feltalálás, az irányító és alakító intuíció, pedig ez rejlik minden, még a legabsztraktabb matematikai eredmény mélyén is. Lehet, hogy a kikristályosodott deduktív forma a cél, de a hajtóerő akkor is az intuíció és az alkotókedv. Egyenesen a természettudomány létét fenyegeti az az állítás, hogy a matematika semmi más, mint definíciókból és posztulátumokból levezetett tételek önellentmondás-mentes, de egyébként teljesen a matematikus szabad akarata által teremtett rendszere. Ha ez igaz lenne, egyetlen értelmes embert sem vonzana a matematika. Hiszen akkor definíciókkal, szabályokkal és szillogizmusokkal való játék lenne az egész, minden cél és értelem nélkül. Csalárd féligazság az az állítás, hogy az elménk önkénye szerint tud értelmes posztulációs rendszereket teremteni. Csak a szerves egész iránt érzett felelősség fegyelme alatt, belső szükségszerűség által vezettetve képes a szabad elme tudományos értékű eredmények elérésére. A logikai analízis kontemplatív irányzata semmiképpen sem képviseli tehát a matematika egészét, azt azonban el kell ismerni, hogy a matematikai tények s kölcsönös
xxv
összefüggéseiknek mélyebb megértését eredményezte, és a matematikai fogalmak lényegének tisztább felfogására vezetett. Ebből fejlődött ki a matematikában az a modern szempont, ami annyira jellemző ma a természettudományokra általában. Bármilyen filozófiai állásponton legyünk is egyébként, el kell ismernünk azt a tényt, hogy a természettudományos megfigyelés szempontjából bármely objektum teljesen leírható a közötte és a megfigyelő szubjektum vagy mérőműszer között lehetséges relációk összessége által. Természetesen a puszta megfigyelés még nem tudomány és nem megértés; valami szerint rendezni és interpretálni kell a megfigyeléseket. Ez a valami, ha úgy tetszik „magánvaló”, nem közvetlen fizikai megfigyelés tárgya, a metafizikába tartozik. A természettudományos módszer azonban megköveteli, hogy a későbbiek során azután minden metafizikai jellegű elemet gondosan eltávolítsunk, s kizárólag a megfigyelhető tényeket tekintsük fogalmaink és leírásaink végső forrásának. Lehet, hogy a naiv lelkesedő keserű csalódásnak érzi ezt a lemondást arról, hogy megértsük a „magánvalót”, megismerjük a „végső igazságot”, feltárjuk a világ legbelső lényegét. Lehet, azonban ne felejtsük el, hogy az újkori gondolkodásnak éppen ez a lemondás volt az egyik leggyümölcsözőbb tette. A fizika néhány kiemelkedő eredményét éppen annak köszönhetjük, hogy bátran ragaszkodtunk a metafizika kiküszöböléséhez. Einstein úgy találta meg a kulcsot a relativitás-elméletéhez, hogy a „különböző helyen egyidejűleg végbemenő események” fogalmát megkísérelte visszavezetni megfigyelhető jelenségekre, és metafizikai előítéletként leplezte le azt a hiedelmet, hogy ennek a fogalomnak önmagában bármiféle tudományos értelme lenne. Niels Bohr és tanítványai felismerték, hogy minden fizikai megfigyelésben szükségképpen hat a mérőműszer a megmért objektumra; így derült ki, hogy egy részecske helye és sebessége fizikai értelemben véve nem határozható meg egyidejűleg pontosan. Minden fizikus jól tudja, hogy ez a felfedezés, beépülve az újabb kvantumelméletbe, milyen messzemenő következményekhez vezetett. A XIX. században az a felfogás uralkodott, hogy a mechanikai erő fogalma és az anyagi pont térben történő mozgása nem szorul további magyarázatra, viszont az elektromosság, a fény és a mágnesesség „megmagyarázandók”, azaz mechanikai jelenségekre vezetendők vissza úgy, amint az a hő esetében történt. Kitalálták az „étert” olyan hipotetikus közegként, amelyik a számunkra fény vagy elektromosság formájában jelentkező, nem teljesen megmagyará-
xxvi
zott mechanikus mozgásokat végzi. Csak lassan látták be, hogy ez az éter szükségképpen megfigyelhetetlen: a metafizikába tartozik s nem a fizikába. Sokan búsultak ezen, mások megkönnyebbülten sóhajtottak fel, de akárhogyan is éreztek, a fény és elektromosság mechanikai magyarázatát s ezzel együtt az étert, végleg el kellett vetni. Hasonló a helyzet, csak még élesebb, a matematikában. A matematikusok tudományuk tárgyait, mint amilyenek a számok, pontok stb. mind ez idáig mindig valami magánvalónak, önmagukban értelmes dolognak tekintették. Csak miután ezek a dolgok folyton kibújtak valamilyen kielégítő leírás lehetősége alól, a XIX. század matematikusainak kezdett lassanként derengeni, hogy talán egyáltalán nem is lehet ezeket a dolgokat a matematikán belül önmaguktól létező dolgoknak tekinteni. A rájuk érvényes megállapítások nem vonatkoznak semmiféle szubsztanciális realitásra; matematikailag „definiálatlan objektumok” közötti összefüggéseket szögeznek le ezek a megállapítások, és a definiálatlan objektumokkal végezhető műveletek szabályait rögzítik. Nem lehet, és nem is kell a matematikában arról beszélni, hogy mik a pontok, egyenesek, számok „valójában”. Ami fontos a matematikában, s ami „igazolható” tényeknek felel meg az a struktúra és az összefüggés: pl. az a tény, hogy két pont meghatároz egy egyenest, hogy a számok megadott műveleti szabályok szerint újabb számokká kapcsolhatók stb. A modern posztulációs szemlélet egyik legfontosabb és leggyümölcsözőbb eredménye éppen annak a belátása volt, hogy a matematika alapvető elemi fogalmainak nem szabad önálló jelentést tulajdonítani, „deszubsztancializálni” kell őket. Szerencsére, az alkotó elmék tüstént elfelejtik a dogmatikus filozófiai fogalmakat, mihelyst a hozzájuk való ragaszkodás gátolja a teremtő fejlődést. Egyedül az aktív matematikai tapasztalás, nem a filozofálgatás, válaszolhat tudósnak és be nem avatottnak egyaránt arra a kérdésre, hogy mi a matematika?
xxvii
xxviii
I. A természetes számok Bevezetés A szám a modern matematika alapja. De mi maga a szám? Mit jelent az, hogy 12 + 12 = 1, 1 2
·
1 2
=
1 4
és (−1) · (−1) = 1? Azt megtanuljuk az iskolában, hogyan kell számolni
törtekkel és negatív számokkal, de ha valóban meg akarjuk érteni a számrendszert, egyszerűbb elemekig kell visszamennünk. A görögök a pont és az egyenes geometriai fogalmát választották matematikájuk alapjául, a modern matematika vezérelve ezzel szemben az, hogy végső soron minden matematikai állítás a természetes számokra (1, 2, 3,. . .) legyen visszavezethető. „A természetes számokat Isten teremtette, minden egyéb az ember műve.” Ezekkel a szavakkal jelölte ki Leopold Kronecker (1823–1891) azt a biztos alapot, amire a matematika struktúrája felépíthető. A számokat az emberi elme azért hozta létre, hogy a legkülönfélébb együttesekben megszámolhassa a bennük foglalt tárgyakat, s így a számoknak semmi köze sincs a megszámlált tárgyak egyedi tulajdonságaihoz. A hatos szám pl. minden hat dolgot tartalmazó valóságos összesség absztrakciója, nem függ a dolgok vagy a használt jelölések semmilyen specifikus tulajdonságától. Meglehetősen magas intellektuális szint szükséges ahhoz, hogy a számnak ez az absztrakt jellege nyilvánvalóvá váljon. A gyerek mindig megfogható tárgyakhoz, pl. ujjakhoz vagy gyöngyszemekhez társítja a számokat, a primitív nyelvek is a szám konkrét felfogását árulják el azáltal, hogy különböző fajta tárgyakra különféle számneveket használnak. Szerencsére a matematikusnak nem kell törődnie azzal, miféle filozófiai természetű átmenet vezet át a tárgyak konkrét megszámlálásáról az absztrakt számfogalomra. Egyszerűen adottnak vesszük a természetes számokat, az összekapcsolásukra szolgáló két alapművelettel: az összeadással és a szorzással együtt.
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526102605+02’00’
1
1. § Számolás egész számokkal 1. Az aritmetika törvényei A természetes számok vagy pozitív egész számok matematikai elméletét aritmetikának nevezik. Az aritmetika azon a tényen alapul, hogy az egész számok összeadására és szorzására meghatározott törvények érvényesek. Ha ezeket a törvényeket teljesen általánosan akarjuk kimondani, nem használhatunk konkrét egész számokra vonatkozó jelöléseket, mint pl. 1, 2, 3. Az az állítás, hogy 1 + 2 = 2 + 1, csupán speciális esete annak az általános törvénynek, hogy két egész szám összege független az összeadás sorrendjétől. Ha azt akarjuk kifejezni, hogy egy egész számok között fennálló összefüggés attól függetlenül érvényes, hogy milyen konkrét egész számok szerepelnek benne, jelképesen a, b, c,. . . betűkkel jelöljük az egész számokat. Ebben megállapodva, öt, az olvasó által ismert alaptörvényt mondunk ki az aritmetikában: 1) a + b = b + a,
2) ab = ba,
3) a + (b + c) = (a + b) + c,
4) a(bc) = (ab)c,
5) a(b + c) = ab + ac. Az első kettő, az összeadás illetve a szorzás kommutatív törvénye, azt állítja, hogy az összeadásban illetve a szorzásban szereplő elemek sorrendje felcserélhető. A harmadik, az összeadás asszociatív törvénye azt mondja ki, hogy három szám összeadása ugyanarra az eredményre vezet, akár az első kettő összegéhez adjuk hozzá a harmadikat, akár az elsőhöz adjuk hozzá a második és a harmadik összegét. A negyedik a szorzás asszociatív törvénye. Az utolsó, az ún. disztributív törvény, azt a tényt fejezi ki, hogy valamely egész számmal egy összeget úgy lehet megszorozni, hogy az összeg minden tagját megszorozzuk az egész számmal, és a szorzatokat összeadjuk. Az aritmetikának ezek a törvényei olyan egyszerűek, hogy maguktól értetődőnek látszhatnak. De nem feltétlenül szükséges, hogy az egész számokon kívül más dolgokra is
2
érvényesek legyenek. Pl. ha a és b nem egész számokat, hanem kémiai anyagokat jelölnek, és ha az összeadáson „hozzátevést” értünk, akkor nyilvánvaló, hogy a kommutatív törvény nem mindig érvényes. Mert ha pl. kénsavat adunk hozzá vízhez, híg oldatot kapunk, míg vizet adva tiszta kénsavhoz, pórul járhat a kísérletező. Hasonló példán lehetne bemutatni, hogy egy ilyen jellegű „aritmetikában” az összeadás asszociatív és disztributív törvénye nem feltétlenül érvényes. Így el lehet képzelni olyan aritmetikákat, amelyekben a fenti 1) – 5) törvényből egy vagy több nem érvényes. A modern matematikában valóban tanulmányoztak ilyen rendszereket. A természetes szám absztrakt fogalmának egy konkrét modellje megmutatja, milyen egyszerűen szemléltethetők az 1) – 5) törvények. Ahelyett, hogy a szokásos 1, 2, 3 stb. számjeleket használnánk, jelöljük egy adott összességben (lehet ez pl. egy almafán levő almák összessége) levő tárgyak számából adódó egész számot egy négyszögletes dobozba zárt pontok halmazával úgy, hogy minden tárgynak éppen egy pont feleljen meg. Az egész számok aritmetikájának a törvényeit ezekkel a dobozokkal végzett műveletekben fogjuk tanulmányozni. Két a és b egész számot úgy adunk össze, hogy végükkel egymás mellé illesztjük a dobozokat és eltávolítjuk a közfalat. Két számot, a-t és b-t úgy szorzunk
1. ábra. Összeadás össze, hogy a megfelelő két dobozban sorokba rendezzük a pontokat, és egy új dobozt képezünk, amelyikben a pontok a sorban és b oszlopban helyezkednek el. Látjuk hogy az 1) – 5) törvények megfelelnek azoknak a műveleteknek, amelyeket a dobozokkal közvetlen szemlélet alapján végeztünk.
2. ábra. Szorzás Két egész szám összeadásának a definíciója alapján most már definiálhatjuk a kisebb, ill. nagyobb relációt. Annak a két ekvivalens állításnak, hogy a < b (olv. a kisebb, mint b) és b > a (olv. b nagyobb, mint a) mindegyike azt jelenti, hogy b dobozt meg
3
3. ábra. A disztributív törvény
4. ábra. Kivonás lehet kapni a dobozból egy megfelelőképpen választott harmadik c doboz hozzáadásával, jelekben: b = a + c. Ebben az esetben felírhatjuk, hogy c = b − a, ami a kivonás műveletét definiálja. Az összeadást és a kivonást egymás inverz műveletének nevezik, mivel ha egy d egész szám a egész számhoz való hozzáadása után az összegből kivonjuk a d egész számot, az eredmény az eredeti a egész szám lesz: (a + d) − d = a. Jegyezzük meg, hogy a b − a egész számot csak arra az esetre definiáltuk, ha b > a. A b − a egész számnak negatív egész számként való értelmezését abban az esetben ha b < a, később tárgyaljuk (68. és következő oldalak). Ha az a > b állítást akarjuk tagadni, sokszor kényelmesebb a b = a (olv. b nagyobb vagy egyenlő a) vagy a 5 b (olv. a kisebb vagy egyenlő b) jelölések egyikét használni. Így pl. 2 = 2 és 3 = 2. Kissé kibővíthetjük a dobozba zárt pontokkal ábrázolt egész számok tartományát, ha bevezetjük a nulla egész számot, amit üres dobozzal fogunk ábrázolni. Ha ezt az üres dobozt a szokásos 0 jellel jelöljük, az összeadás s a szorzás definíciója szerint: a + 0 = a, a · 0 = 0, minden a egész számra. Hiszen az a + 0 azt jelenti, hogy az üres dobozt adjuk hozzá az a dobozhoz, 0 · a pedig egy oszlop nélküli dobozt jelent, ami nem más, mint az üres
4
doboz. Természetes módon kínálkozik a kivonás definícióját kibővíteni a − a = 0-val minden a egész számra. Ezek a nulla jellegzetes aritmetikai tulajdonságai. Ilyenféle geometriai modelleket, mint a pontos dobozok, amilyen pl. az ókori abacus is volt, sokféleképpen használtak a numerikus számítások elvégzéséhez egészen a középkor végéig, amikor lassan kezdték kiszorítani őket a tízes számrendszeren alapuló sokkal magasabb rendű jelölés módszerek. 2. Pozitív egész számok jelölése Gondosan meg kell különböztetnünk egymástól magát az egész számot és azt az 5, V, . . . stb. jelet, amit jelölésére használunk. A tízes számrendszerben tíz számjegyet használunk a nulla és az első kilenc pozitív egész szám jelölésére: 0, 1, 2, 3, . . ., 9-et. Valamely nagyobb egész szám, mint pl. „háromszázhetvenkettő”, a következőképpen fejezhető ki: 300 + 70 + 2 = 3 · 100 + 7 · 10 + 2, és a tízes számrendszerben ezt a 372 jellel jelöljük. Ebben a jelölési módban az a lényeg, hogy a 3, 7, 2 számjegyek értéke a helyüktől függ, attól, hogy az egyesek, a tízesek, vagy százasok helyén állanak-e. Ebben a „helyi érték”-rendszerben bármely egész számot felírhatunk mindössze tíz számjegy különféle elrendezésével. Az általános szabály szerint egy egész szám a következő alakban írható: z = a · 103 + b · 102 + c · 10 + d, ahol a, b, c, d a nullától kilencig terjedő számjegyek valamelyike. Ebben az esetben a z egész szám az abcd
5
rövidített szimbólummal írható fel. Megjegyezzük, hogy a d, c, b, a együtthatók nem egyebek, mint a z tízzel való egymás utáni osztásainak a maradékai. Pl. 372 : 10
37
maradék 2
37 : 10
3 maradék 7
3 : 10
0 maradék 3.
A z-re fent megadott kifejezés csak tízezernél kisebb egész számokra érvényes, ennél nagyobb egész számok öt vagy több számjegyet igényelnek. Ha z valamely tízezer és százezer közötti szám, akkor z = a · 104 + b · 104 + c · 102 + d · 10 + e alakban fejezhető ki, és az abcde jellel jelölhető. Hasonlóan írhatók le a százezer és millió közötti egész számok, és így tovább. Igen hasznos valamennyi egész számot egyetlen, általános formulával kifejezni. Jelöljük ebből a célból a különböző e, d, c,. . . együtthatókat különböző „indexekkel” ellátott egyetlen a betűvel a0 , a1 , a2 , a3 , . . .. Jelölje továbbá 10n , ahol n tetszőleges természetes szám lehet, azt a tényt, hogy 10 hatványai szükségszerinti nagyok lehetnek, s nem kell, mint a fenti példákban, megállani 103 vagy 104 -nél. Ezzel az általános módszerrel egy z egész számot a tízes számrendszerben így írjuk le: z = an · 10n + an−1 · 10n−1 + . . . + a1 · 10 + a0 .
(1)
vagy szimbólummal an an−1 an−2 . . . a1 a0 . Akárcsak a fenti speciális esetben, most is azt látjuk, hogy az a0 , a1 , a2 , . . ., an számjegyek a z ismételt 10-zel való osztásánál kapott maradékok. A tízes számrendszerben a tízes számot választottuk a számrendszer alapjául. A nem szakember talán nem veszi rögtön észre, hogy ez a választás egyáltalán nem lényeges, nemcsak tíz, bármely egynél nagyobb egész szám szolgálhat ugyanerre a célra. Pl. a hetes (az alap 7) számrendszert a következőképpen kellene használni. Ebben a számrendszerben
6
egy egész számot a bn · 7n + bn−1 · 7n−1 + . . . + b1 · 7 + b0
(2)
kifejezés írja le, ahol a b-k nullától hatig terjedő számjegyek. A (2) által kifejezett számot bn bn−1 . . . b1 b0 jellel jelöljük. Pl. „egyszázkilenc” hetes számrendszerben a 214 jellel lenne jelölhető, aminek a jelentése 2 · 72 + 1 · 7 + 4 Az olvasóra bízzuk, hogy gyakorlásképpen bizonyítsa be: a tízes alapú számrendszerről valamely más B alapú számrendszerre áttérni úgy lehet, hogy z számot ismételten elosztjuk B-vel; az így kapott maradékok lesznek a B alapú számrendszerben a szám számjegyei. Pl.: 109 : 7
15
maradék 4
15 : 7
2 maradék 1
2 :7
0 maradék 2.
109 (tízes számrendszerben) = 214 (hetes számrendszerben) Természetesen kérdéses, hogy vannak-e különleges előnyei az alap valamilyen speciális megváltoztatásának. Látjuk majd, hogy túl kicsi alap több szempontból előnytelen, túl nagy alapnál meg túl sok számjegyet kell megtanulni és a szorzótábla is bonyolult. Ajánlották a tizenkettes alap választását, mert tizenkettő maradék nélkül osztható kettővel, hárommal, néggyel, hattal, és ennek következtében az olyan feladatok, ahol osztás vagy törtek szerepelnek, jóval egyszerűbbé válnak. Ha egy tetszőleges egész számot tizenkettes alappal akarunk kifejezni (tizenkettes számrendszerben), akkor két új számjegyet kell bevezetnünk a tíz és a tizenegy számára. Jelöljük a tízet α-val, a tizenegyet β-val. Akkor a tizenkettes számrendszerben „tizenkettő” 10-zel jelölhető, „huszonkettő” 1α-val, „huszonhárom” 1β-val és „százharmincegy” αβ-val. A helyértékrendszer, aminek a felfedezését a suméroknak vagy a babiloniaknak tulajdonítják, és amit a hinduk tökéletesítettek, óriási jelentőségű volt a kultúra történetében.
7
A korai számrendszerek tisztán az összeadás elvén alapultak. Pl. a római jelölésben CXVIII = száz + tíz + öt + egy + egy + egy. Az egyiptomi, héber, görög számrendszerek mind ugyanezen a szinten állottak. Minden tisztán additív jelölési módnak egyik hátránya, hogy amint a számok növekednek, újabb jeleket kell bevezetni. (Természetesen a régi tudósoknak még nem kellett a mi csillagászati vagy atomi nagyságrendjeinkkel bajlódni.) De az antik rendszerek, például a római írásmód fő hibája, hogy annyira nehéz volt velük a számolás, hogy a legegyszerűbb probléma megoldására is csak külön specialisták mertek vállalkozni. Ezzel szemben a hindu helyértékrendszernek, amit ma használunk, óriási előnyei vannak. (Ezt a számrendszert a középkorban honosították meg Európában az olasz kereskedők, akik az araboktól tanulták.) A helyértékrendszernek először is az az előnye, hogy bármely szám, akár nagy, akár kicsi, leírható benne viszonylag kis számú jel segítségével (a tízes számrendszerben ezek az „arab számok”: 0, 1, 2, . . ., 9). Ezzel együtt jár az a sokkal fontosabb előny, hogy könnyű benne a számolás. A helyértékrendszerben felírt számok esetében a számolás szabályai az összeadó- és szorzótáblákban foglalhatók össze, a könnyen emlékezetben tartható számjegyekre. A számolás ősi művészetét, ami egykor csupán néhány beavatott titka volt, ma az elemi iskolában tanítják. Nem sok egyéb példát lehetne felhozni ezenkívül arra, hogy a tudomány haladása ilyen mélyen áthatotta s ennyire megkönnyítette a mindennapi életet. 3. Számolás nem tízes számrendszerekben A tízes alap használata megtalálható már a civilizáció hajnalán és kétségkívül annak a ténynek köszönhető, hogy tíz ujjunk van. De sok nyelv számnevei utalnak más alapokra is, mint pl. a tizenkettő (angol, német) vagy húsz (csaknem minden nyelvben). Az angol és a német például a 11-et és a 12-t (eleven, elf; twelve, zwölf) nem a tízes elv alapján nevezi el, tehát nem úgy, mint például a 13-at vagy a 14-et, a 10 szóhoz függesztve a megfelelő számjegyet, hanem a 11, 12 szavak nyelvileg függetlenek a tíz szótól. Franciában a 20 és 80 elnevezése: „vingt” és „quatrevingt” mutatja, hogy egykor egyes célokra olyan rendszert használhattak, amelyben húsz volt az alap. Dán nyelvben a
8
70 neve „halvfjerds”, félutat jelent, a négyszer húszhoz (ti. a háromszor húsztól). A babilóniai csillagászok számrendszere részben a hatvanas volt (alap 60), és úgy tartják, hogy innen ered az óra és a fok 60 percre való osztása. Valamilyen nem tízes számrendszerben a számolási szabályok ugyanazok, mint a tízesben, de más összeadó- és szorzó (egyszeregy) táblákban mások a számjegyek. Annyira megszoktuk a tízes számrendszert, és nyelvünk számnevei is annyira ehhez kötnek, hogy ezt először meglehetősen zavarónak találhatjuk. Próbáljunk elvégezni egy szorzást pl. a hetes számrendszerben. Mielőtt hozzákezdenénk, tanácsos lejegyezni a használandó összeadó- és szorzótáblát: Összeadás 1 2 3 4 5 6
1 2 3 4 2 3 4 5 3 4 5 6 4 5 6 10 5 6 10 11 6 10 11 12 10 11 12 13
Szorzás 5 6 10 11 12 13 14
6 10 11 12 13 14 15
1 2 3 4 5 6
1 1 2 3 4 5 6
2 3 2 3 4 6 6 12 11 15 13 21 15 24
4 4 11 15 22 26 33
5 5 13 21 26 34 42
6 6 15 24 33 42 51
Szorozzuk most meg 265-öt 24-gyel, a számjegyek itt hetes számrendszerben felírva értendők. (A feladat tízes számrendszerben felírva 145 szorozva 18-cal lenne.) A szorzás szabályai ugyanazok, mint a tízes számrendszerben. Először 5-öt szorozzuk meg 4-gyel, ez, amint a szorzótábla mutatja, 26. Leírjuk a 6-ot az egyesek helyére, „továbbvisszük” a 2-t. A következő lépésben azt találjuk, hogy 4 · 6 = 33, és 33 + 2 = 35. Leírjuk az 5-öt, és így haladunk, míg minden részletszorzást el nem végeztünk. Összeadva 1456-ot és 563-at, az egyesek helyén 6 + 0 = 6-ot kapunk, a hetesek helyén 5 + 3 = 11-et. Újból leírjuk az 1-et és 1-et továbbviszünk a negyvenkilencesek helyére, ahol 1 + 6 + 4 = 14-et kapunk. A végeredmény 265 · 24 = 10416. 256 · 24 1456 563 10416
9
Az eredmény próbájaként végezzük el ugyanezt a szorzást a tízes számrendszerben is. 10416 (hetes számrendszer) tízes számrendszerbe való átírásához lejegyezzük 7 hatványait a negyedikig: 72 = 49, 73 = 343, 74 = 2401. Tehát a tízes számrendszerben 10416 = 2401 + 4 · 49 + 7 + 6. Összeadva ezeket a számokat, azt találjuk, hogy azt a számot, amit a hetes számrendszerben 10416-tal jelöltünk, a tízes számrendszerben 2610-zel kell jelölni. A tízes számrendszerben 145-öt megszorozva 18-cal, az eredmény valóban 2610, a számolás tehát helyes volt. Gyakorlatok: 1. Írjuk fel a tizenkettes számrendszer összeadó- és szorzótábláját, és hajtsunk végre néhány fentihez hasonló szorzást. 2. Fejezzük ki „harmincat” és „százharminchármat” olyan számrendszerekben, amelyekben az alap 5, 7, ill. 12. 3. Mit jelent a 11111 és a 21212 jel ezekben a számrendszerekben? 4. Képezzünk összeadó- és szorzótáblát 5, 11, 13 alapok esetében.
Kitüntetett helyet foglal el elméleti szempontból a 2 alapú számrendszer, ugyanis 2 a lehető legkisebb alap. A kettes vagy diadikus számrendszer ben 0 és 1 az egyedüli számjegyek. Minden egyéb z számot ennek a két jelnek valamilyen sorozata fejez ki. Az összeadó- és szorzótáblák az 1 + 1 = 10 és 1 · 1 = 1 szabályokból állanak. A rendszer nyilvánvaló hátránya, hogy már kis számok jelölésére is hosszú kifejezések szükségesek. Így pl. hetvenkilenc, ami 2 hatványaival 1 · 26 + 0 · 25 + 0 · 24 + 1 · 23 + 1 · 22 + 1 · 2 + 1-ként állítható elő, a kettes számrendszerben 1001111 alakú lesz. A kettes számrendszerben nagyon egyszerű a szorzás, példaként szorozzuk meg hetet öttel. Hét és öt kettes számrendszerben felírva 111 illetve 101. Emlékezzünk rá, hogy ebben a rendszerben 1 + 1 = 10, tehát 111 · 101 111 111 100011 = 25 + 2 + 1, azaz valóban harmincötöt kaptunk.
10
Gottfried Wilhelm Leibniz (1646–1716), korának egyik legnagyobb elméje, nagyra becsülte a kettes számrendszert. Laplace-t idézve, „Leibniz a diadikus aritmetikát a teremtés tükörképének tekintette. Úgy képzelte, hogy az Egység az Istent jelöli, a nulla az űrt, és hogy a Legfelsőbb Lény mindent a semmiből teremtett, éppen úgy, ahogy az egységgel és a nullával minden más számot ki lehet fejezni a kettes számrendszerben”. Gyakorlat: Vizsgáljuk meg azt a problémát, hogyan kell jelölni az egész számokat az a alapú számrendszerben. Az egész számok elnevezéséhez ebben a rendszerben külön nevet kell találni a 0, 1, . . ., a − 1 számjegyeknek és a különböző a, a2 , a3 , . . . hatványainak. Hány külön szó szükséges a nullától ezerig menő számok elnevezésére a = 2, 3, 4, 5, . . ., 15 esetében? Melyik alapnál van a legkevesebb számnévre szükség? (Példák: ha a = 10, tíz szó szükséges a számjegyek elnevezésére és további három a 10, 100, 1000 kimondására, ami összesen 13. a = 20 esetében húsz szó szükséges a számjegyek és további kettő a 20 és 400 elnevezésére, ami összesen 22 szó. Ha a = 100, 100 + 1 szóra van szükség.)
*2. § A számrendszer végtelen voltáról A matematikai indukció 1. A matematikai indukció elve A természetes számok 1, 2, 3, 4,. . . sorozatának soha nincsen vége, mert bármely n egész szám után felírhatjuk a következő számot, n + 1-et. A természetes számok sorozatának ezt a tulajdonságát szavakban úgy fejezzük ki, hogy végtelen sok természetes szám van. A természetes számok összessége a legegyszerűbb és legközönségesebb példája a matematikai végtelennek, ami igen fontos szerepet játszik a modern matematikában. Ebben a könyvben lépten-nyomon foglalkozunk majd olyan összességekkel vagy „halmazok”-kal, amelyek végtelen sok matematikai tárgyat tartalmaznak. Ilyen pl. az egyenes pontjainak halmaza vagy az egy síkban fekvő összes háromszög halmaza. A természetes számok végtelen sorozata legegyszerűbb példa végtelen halmazra. Az az eljárás, amellyel a természetes számok végtelen sorozata előállítható, az ui., hogy lépésről lépésre térünk át n-ről n + 1-re, egyben az egyik legfontosabb matematikai bizonyításmódnak, a matematikai indukciónak is alapja. Az „empirikus indukció” a természettudományokban az az eljárás, amikor valamilyen jelenség egy adott megfi-
11
gyeléssorozatából olyan általános törvényre következtetnek, amely az illető jelenség előfordulásának minden esetében érvényes. Az így megállapított törvény bizonyosságának mértéke a megfigyelt esetek számától és bizonyító erejétől függ. Az induktív bizonyításnak ez a módja sok esetben teljesen meggyőző. Az a megállapítás például, hogy a Nap holnap reggel keleten felkél, olyan biztonsággal mondható ki, mint amilyen biztos egyáltalán lehet valami, ennek az állításnak a jellege mégis merőben más, mint egy olyan tételé, amit szigorú logikai vagy matematikai következtetéssel bizonyítottak be. Egészen más értelemben alkalmazzák a matematikai indukciót, amely azáltal bizonyítja egy matematikai tétel igaz voltát, hogy megállapítja a tétel érvényességét az első, második, harmadik, és így tovább, végtelen sok esetre, kivétel nélkül minden esetre. Jelöljön A valamely állítást, amelyben egy tetszőleges n egész szám szerepel. Legyen pl. A az az állítás, hogy „egy n + 2 oldalú konvex sokszög szögeinek összege n-szer 180 fok”. Vagy legyen A 0 az az állítás, hogy „egy sík n egyenessel nem osztható 2n -nél több részre.” Ha egy ilyen tételt minden n természetes számra be akarunk bizonyítani, nem elegendő az első 10, 100 vagy akár 1000 n értékre bebizonyítani azt. Az ilyen eljárás felelne meg az empirikus indukciónak. A matematikában azonban szigorú, nem empirikus jellegű következtetést kell alkalmazni. Ennek jellegét a fenti A és A 0 példa esetében mutatjuk be. Vegyük először A példát. Tudjuk, hogy ha n = 1, akkor háromszögről van szó. Az elemi geometriában ismeretes, hogy a háromszögben a szögek összege 1 · 180◦ . Négyszög esetében, amikor n = 2, húzzunk egy átlót, ami a négyszöget két háromszögre bontja. Közvetlenül adódik, hogy a négyszög szögeinek összege egyenlő a két háromszög szögeinek összegével: 180◦ + 180◦ = 2 · 180◦ . Következik az ötszög, ennél n = 3. Bontsuk fel ezt egy háromszögre és egy négyszögre; mivel utóbbiban, mint azt éppen most bizonyítottuk, a szögek összege 2 · 180◦ , a háromszögben pedig 180◦ , az 5-szög szögeinek összege 3 · 180◦ . Nyilvánvaló, hogy ezen a módon megállás nélkül haladhatunk tovább, bebizonyítva a tételt n = 4, azután n = 5 esetére és így tovább, a végtelenségig. Mindegyik állítás ugyanolyan módon következik a megelőzőből, úgyhogy A általános tételt bizonyítottnak tekinthetjük minden n-re. Hasonlóan bizonyíthatjuk be A 0 tételt. n = 1-re nyilvánvalóan igaz, mivel egy egyenes a síkot két részre osztja. Vegyünk most egy második egyenest hozzá. Ez az egyenes
12
az előző két rész mindegyikét újból két részre osztja, feltéve, hogy nem párhuzamos az elsővel. Ha n = 2, egyik esetben sem kapunk 4 = 22 -nél több részt. Vegyünk most egy harmadik egyenest is. Az előbbi tartományok mindegyike újból vagy két részre osztódik, vagy érintetlen marad. Így a részek összege nem nagyobb, mint 22 · 2 = 23 . Ezt bebizonyítva, ugyanígy haladhatunk a következő esetre, és így tovább, a végtelenségig. A fenti meggondolásnak az a lényege, hogy a minden n-re érvényes általános A tétel speciális A1 , A2 ,. . . eseteinek sorozatos, egymás utáni igazolásával bizonyítjuk be. Ennek a bizonyításnak a lehetősége két dolgon alapul: a). Megadható egy általános módszer annak az igazolására, hogy ha valamely Ar állítás igaz, akkor a közvetlenül következő Ar+1 állítás is igaz. b). Az első A1 állításról tudjuk hogy igaz. Az már, hogy ez a két feltétel elegendő minden A1 , A2 , A3 ,. . . állítás igaz voltának bizonyítására, logikai elv, s éppen olyan alapvető a matematikában, mint a klasszikus arisztotelészi logika szabályai. Ez az elv a következőképpen fogalmazható meg: Be kell bizonyítani az A általános tételt alkotó A1 , A2 , A3 , . . . matematikai állítások végtelen sorozatát. Ha a) valamilyen matematikai meggondolással kimutattuk, hogy az r tetszőleges egész szám, és ha az Ar állításról tudjuk, hogy igaz, akkor ebből következik az Ar+1 állítás igaz volta és b) ha a legelső A1 állításról tudjuk, hogy igaz, akkor a sorozat minden állításának igaznak kell lennie, és A bizonyítást nyert. Ezt az elvet éppen úgy el kell fogadnunk a matematikai érvelés alapelveként, mint ahogyan a közönséges logika egyszerű szabályait elfogadjuk. Ugyanis minden An állítás igaz voltát be tudjuk bizonyítani az A1 igaz voltát kimondó b) állításból kiindulva a) állítás ismételt alkalmazásával egymás után igazolva A2 , A3 , A4 stb. állításokat, amíg el nem jutunk An -ig. A matematikai indukció elve tehát azon a tényen alapul, hogy minden r egész szám után következik r + 1, a következő egész szám, és hogy minden n egész szám elérhető véges számú lépéssel, kiindulva az 1 egész számból. A matematikai indukció elvét gyakran alkalmazzák anélkül, hogy explicite hivatkoznának rá, vagy csupán egy odavetett „stb.”-vel, vagy „és így tovább”-bal jelzik. Különösen gyakran járnak el így az elemi bevezetésekben. Bonyolultabb bizonyításokban azonban
13
elengedhetetlen az induktív érvelés explicit használata. A következőkben néhány példát mutatunk be az elv egyszerű, de nem egészen triviális alkalmazására. 2. Számtani sor Az első n egész szám 1 + 2 + 3 + . . . + n összege bármely n-re egyenlő
n(n+1) . 2
A tételt
matematikai indukcióval bizonyítjuk: ki kell mutatni, hogy az alábbi An állítás 1 + 2 + 3 + ... + n =
n(n + 1) 2
(1)
minden n-re igaz. a) Ha r valamely egész szám, és ha Ar állításról tudjuk, hogy igaz, azaz ha, tudjuk, hogy 1 + 2 + 3 + ... + r =
r(r + 1) , 2
akkor az egyenlet mindkét oldalához hozzáadva (r + 1)-et, 1 + 2 + 3 + ... + r + r + 1 =
r(r + 1) r(r + 1) + 2(r + 1) (r + 1)(r + 2) +r+1= = 2 2 2
egyenletet kapjuk, amely nem más, mint Ar+1 állítás, b) Az A1 állítás nyilvánvalóan igaz, mivel 1 =
1·2 . 2
Tehát a matematikai indukció elve alapján An állítás minden n-re
igaz, ami bizonyítandó volt. Rendszerint úgy szokták ezt kimutatni, hogy az 1 + 2 + 3 + . . . + n összeget két különböző, Sn = 1 + 2 + . . . + (n − 1) + n és Sn = n + (n − 1) + . . . + 2 + 1 alakban írják. Összeadva látjuk, hogy minden azonos oszlopban álló két szám összege n + 1, és mivel összesen n oszlop van, következik, hogy 2Sn = n(n + 1), ami a kívánt eredményt adja. (1)-ből azonnal levezethetjük azt a képletet, amely bármely számtani sor első (n + 1)
14
tagjának az összegét megadja: Pn = a + (a + d) + (a + 2d) + . . . + (a + nd) =
(n + 1)(2a + nd) ; 2
(2)
mivel Pn = (n + 1)a + (1 + 2 + . . . + n)d = (n + 1)a + =
n(n + 1)d = 2
(n + 1)(2a + nd) 2(n + 1)a + n(n + 1)d = . 2 2
a = 0, d = 1 esetére ez az egyenlet ekvivalens (1)-gyel. 3. Geometriai sor Az általános geometriai sorral hasonlóan lehet eljárni. Be fogjuk bizonyítani, hogy n minden értékére
1 − qn+1 Gn = a + aq + aq + . . . + aq = a . 1−q 2
n
(3)
(Feltételezzük, hogy q 6= 1, ebben az esetben ugyanis (3) jobb oldala nincs értelmezve.) Az állítás bizonyosan igaz n = 1 esetére, amikor is azt állítja, hogy G1 = a + aq = a
1 − q2 a(1 + q)(1 − q) = = a(1 + q). 1−q (1 − q)
És ha feltesszük, hogy Gr = a + aq + aq2 + . . . + aqr = a
1 − qr+1 , 1−q
akkor következésképpen azt találjuk, hogy Gr+1 = (a + aq + . . . + aqr ) + aqr+1 = Gr + aqr+1 = a =a
1 − qr+1 + aqr+1 = 1−q
(1 − qr+1 ) + qr+1 (1 − q) 1 − qr+1 + qr+1 − qr+2 1 − qr+2 =a =a . (1 − q) 1−q 1−q
Azonban ez pontosan (3) állítás n = r + 1 esetére. Ezzel a bizonyítás teljes.
15
Elemi tankönyvekben az alábbi bizonyítás szokásos. Legyen adva Gn = a + aq + . . . + aqn , szorozzuk meg az egyenlet mindkét oldalát q-val: qGn = aq + aq2 + . . . + aqn+1 . A két egyenlet megfelelő oldalait kivonva egymásból Gn − qGn = a − aqn+1 ,
= a(1 − qn+1 ),
(1 − q)Gn
Gn = a
1 − qn+1 . 1−q
4. Az első n egész szám négyzetének összege A matematikai indukció elvének egy további érdekes alkalmazása az első n egész szám négyzetének az összegére vonatkozik. Behelyettesítéssel – legalábbis kis n értékekre azt találjuk, hogy n(n + 1)(2n + 1) , 6
12 + 22 + 32 + . . . + n2 =
(4)
és sejteni lehet, hogy ez a figyelemre méltó képlet minden n természetes számra érvényes. Ennek a sejtésnek a bizonyítására ismét a matematikai indukció elvét alkalmazzuk. Először is meg kell állapítanunk, hogy ha az An állítás, amelyik jelen esetben (4) egyenlet, igaz n = r esetére, úgy hogy 12 + 22 + 32 + . . . + r 2 =
r(r + 1)(2r + 1) , 6
akkor az egyenlet mindkét oldalához (r + 1)2 -ent adva, az 12 + 22 + 32 + . . . + r2 + (r + 1)2 =
16
r(r + 1)(2r + 1) + (r + 1)2 = 6
=
r(r + 1)(2r + 1) + 6(r + 1)2 (r + 1)[r(2r + 1) + 6(r + 1)] = = 6 6
=
(r + 1)(2r2 + 7r + 6) (r + 1)(r + 2)(2r + 3) = 6 6
egyenletet kapjuk, amelyik jelen esetben éppen az Ar+1 , állítás, ugyanis r + 1-et helyettesítve n helyébe kapható (4)-ből. A bizonyítás teljessé tételéhez még csak azt kell megjegyezni, hogy az A1 állítás, jelen esetben az 12 =
1(1 + 1)(2 + 1) 6
egyenlet nyilvánvalóan igaz. Tehát (4) egyenlet minden n esetére igaz. Hasonló képleteket lehet levezetni az egész számok magasabb hatványösszegeire, 1k + 2k + 3k + . . . + nk esetében, ahol k tetszőleges pozitív egész szám. Bizonyítsuk be gyakorlatként matematikai indukcióval, hogy
n(n + 1) 1 + 2 + 3 + ... + n = 2 3
3
3
3
2 .
(5)
Megjegyzendő, hogy jóllehet a matematikai indukció elve elegendő (5) igazolására, ha már egyszer ez a képlet fel van írva, azonban semmiféleképpen nem magyarázza h i2 n(n+1) meg, hogyan jutottunk éppen ehhez a képlethez. Miért éppen az kifejezésről 2 sejtjük azt, hogy megadja az első n szám köbének az összegét, s nem például az h i2 i h 2 n(n+1) 19n −41n+24 vagy bármely egyéb hasonló típusú kifejezésről? Az a tény, vagy 3 2 hogy valamely tétel bizonyítása egyszerű logikai szabályok alkalmazásából áll, nem teszi nélkülözhetővé a matematikában a teremtő elemet, ami éppen a vizsgálandó lehetőségek közötti választásban áll. Az a kérdés, hogy honnan ered az (5) hipotézis, olyan tartományba vezet, ahol nem adhatók meg általános szabályok. Kísérletnek, analógiának, konstruktív intuíciónak egyaránt megvan itt a szerepe. Ha azonban sikerült a helyes hipotézist formulába önteni, akkor a bizonyításra már gyakran elegendő a matematikai indukció elve. Figyelembe véve azonban, hogy ilyen bizonyítás semmi felvilágosítást sem ad magára a felfedezésre vonatkozóan, helyesebb lenne ebben az esetben igazolásról beszélni. *5. Egy fontos egyenlőtlenség A következő fejezetek egyikében szükségünk lesz az (1 + p)n = 1 + np
(6)
17
egyenlőtlenségre, amelyik minden p > −1 számra és minden n pozitív egész számra érvényes. (Az általánosság kedvéért p-re minden −1-nél nagyobb számot megengedve, negatív és nem egész számokat is használunk, holott ezeket még nem vezettük be. Az általános eset ugyanis pontosan úgy bizonyítható, mint amikor p valamely pozitív egész szám.) Ismét matematikai indukciót használunk. a) Ha igaz, hogy (1 + p)r = 1 + rp, akkor ennek az egyenlőtlenségnek mindkét oldalát megszorozva a pozitív 1 + p számmal, (1 + p)r+1 = 1 + rp + p + rp2 egyenlőtlenséget kapjuk. Ha elhagyjuk az rp2 tagot, ezáltal az egyenlőtlenség csak élesedik, úgyhogy (1 + p)r+1 = 1 + (r + 1)p, látjuk tehát, hogy a (6) egyenlőtlenség a következő egész számra, (r + 1)-re is érvényes. b) Nyilvánvalóan igaz, hogy (1 + p)1 = 1 + p. Ezzel igazoltuk, hogy (6) minden n-re igaz. A p > −1 számokra való szorítkozás lényeges, ugyanis ha p < −1, akkor 1 + p negatív, és az a) alatti érvelés hamis, mivel ha egy egyenlőtlenség mindkét oldalát szorozzuk egy negatív mennyiséggel, az egyenlőtlenség értelme megfordul. (Pl., ha 3 > 2 egyenlőtlenség mindkét oldalát szorozzuk −1-gyel, −3 < −2 lesz az eredmény, vagyis −3 > −2 hamis.) *6. A binomiális tétel Gyakran van szükség valamely kéttagú kifejezés n-edik hatványának, képletben (a + b)n nek, explicit formában való megadására. A kijelölt műveletet elvégezve, azt találjuk,
18
hogy n = 1 esetére (a + b)1 = a + b, n = 2 esetére (a + b)2 = (a + b)(a + b) = = a(a + b) + b(a + b) = a2 + 2ab + b2 , n = 3 esetére (a + b)3 = (a + b)(a + b)2 = = a(a2 + 2ab + b2 ) + b(a2 + 2ab + b2 ) = = a3 + 3a2 b + 3ab2 + b3 , és így tovább. Milyen általános képzési törvény húzódik meg az „és így tovább” szavak mögött? Vizsgáljuk meg, hogyan számoltuk ki (a + b)2 kifejezést. Mivel (a + b)2 = (a + b)(a + b), úgy jártunk el, hogy az (a + b) kifejezés minden egyes tagját megszoroztuk először a-val, azután b-vel, és a szorzatokat összeadtuk. Ugyanezt az eljárást használtuk (a + b)3 = (a + b)(a + b)2 kiszámítására. Folytathatjuk ezt a számolási módszert (a + b)4 , (a + b)5 kiszámítására, és így tovább a végtelenségig. Az (a + b)n kifejtését úgy kapjuk meg, hogy a megelőzően nyert (a + b)n−1 kifejezés mindegyik tagját megszorozzuk először a-val, azután b-vel, és összegezünk. Ez az eljárás az alábbi diagramra vezet:
a+b
=
a a
(a + b)2
=
a2
=
.& +
a
(a + b)3
a3 a
b
+
b
b
a
.& +
2ab
3a2 b
.& +
b
a
a
b
b
.& +
b2
3ab2
.& +
b
a b
a
b
b3 a
b
.& .& .& .& 4 4 3 2 2 3 (a + b) = a + 4a b + 6a b + 4ab + b4 ......................................................................... ami azonnal megadja az együtthatók általános képzési szabályát (a + b)n kifejtésében. Rendezzük el háromszög alakban az egész számokat az a + b együtthatóiból, 1-ből kiindulva úgy, hogy mindegyik szám egyenlő legyen a megelőző sorban levő két vele szomszédos szám összegével. Ezt az elrendezést Pascal-féle háromszögnek hívják.
19
1 1 1 1 1 1
2 3
4 5
6
1 1 3 6
10 15
1 4
10 20
1 5
15
1 6
1
1 7 21 35 35 21 7 1 ........................................................ Ennek az elrendezésnek az n-edik sora megadja (a + b)n -nek az együtthatóit a csökkenő és b növekvő hatványai szerinti kifejtésében. Pl. (a + b)7 = a7 + 7a6 b + 21a5 b2 + 35a4 b3 + + 35a3 b4 + 21a2 b5 + 7ab6 + b7 . Rövidített alsó- és felsőindexes jelölést használva, következőképpen jelölhetjük a Pascalféle háromszög n-edik sorának a számait: Cn0 = 1, Cn1 , Cn2 , Cn3 , . . . , Cnn−1 , Cnn = 1. Ezekkel a jelölésekkel az (a + b)n -re megadott képlet a következőképpen írható: (a + b)n = an + Cn1 an−1 b + Cn2 an−2 b2 + . . . + Cnn−1 abn−1 + Cnn bn .
(7)
A Pascal-féle háromszög képzési törvénye szerint n−1 Cni = Cn−1 . i−1 + Ci
(8)
A gyakorlottabb olvasó feladatképpen használja fel ezt a képletet és a C10 = C11 = 1 összefüggést annak matematikai indukcióval való bizonyítására, hogy Cni =
n(n − 1)(n − 2) . . . (n − i + 1) n! = . 1 · 2 · 3... · i i!(n − i)!
(9)
(Az n! (olv.: „n faktoriális”) jelölés bármely n pozitív egész számra az első n egész szám szorzatát jelöli: n! = 1 · 2 · 3 · . . . · n. Célszerű a 0!-t úgy definiálni, hogy 0! = 1
20
legyen, így (9) érvényes lesz i = 0 és i = n esetére is.) A kéttagúak kifejtésében az együtthatókra adott explicit képletet gyakran nevezik binomiális tételnek. (Lásd még 576. o.) Gyakorlatok: Bizonyítsuk be matematikai indukcióval a következőket: 1. 1 1 1 n + + ... + = . 1·2 2·3 n(n + 1) n+1 2. 1 n n+2 2 + ... + n = 2 − n . + 2 22 2 2 *3. 1 + 2q + 3q2 + . . . + nqn−1 =
1 − (n + 1)qn + nqn+1 . (1 − q)2
*4.
n+1
n
(1 + q)(1 + q2 )(1 + q4 ) . . . (1 + q2 ) =
1 − q2 . 1−q
Határozzuk meg a következő geometriai haladványok összegét: 5. 1 1 1 + + ... + . 1 + x2 (1 + x2 )2 (1 + x2 )n 6. 1+ 7.
x x2 xn + + . . . + . 1 + x2 (1 + x2 )2 (1 + x2 )n
x 2 − y2 + x 2 + y2
x2 − y2 x2 + y2
2
+ ... +
x 2 − y2 x 2 + y2
n .
Bizonyítsuk be (4) és (5) képletek felhasználásával az alábbiakat: *8. 12 + 32 + . . . + (2n + 1)2 =
(n + 1)(2n + 1)(2n + 3) . 3
*9. 13 + 33 + . . . + (2n + 1)3 = (n + 1)2 (2n2 + 4n + 1). 10. Igazoljuk ugyanezt az eredményt közvetlenül, matematikai indukcióval.
21
*7. További megjegyzések a matematikai indukcióról A matematikai indukció elve általánosítható egy kissé a következőképpen: „Ha adva van valamilyen állítások As , As+1 , As+2 , . . . sorozata, ahol s valamely pozitív egész szám, továbbá ha a) bármely r = s értékre Ar+1 következik Ar -ből, és b) As -ről tudjuk, hogy igaz, akkor az összes As , As+1 , As+2 , . . . állítás igaz; azaz An igaz minden n = s-re.” Pontosan azt a matematikai érvelést alkalmazhatjuk itt is, amit a közönséges matematikai indukció elvének a bizonyításában használtunk, azzal a különbséggel, hogy az 1, 2, 3, . . . sorozatot s, s + 1, s + 2, s + 3, . . . sorozattal helyettesítjük. Ebben az alakjában használva az elvet, élesíthetjük a 17.. oldalon megadott egyenlőtlenséget, kiküszöbölve az „=” jel lehetőségét. Azt állítjuk, hogy minden p 6= 0 és > −1 számra és minden n = 2 egész számra (1 + p)n > 1 + np.
(10)
A bizonyítást az olvasóra bízzuk. A matematikai indukció elvének közeli rokona a „legkisebb egész szám elve”, amely azt állítja, hogy pozitív egész számok minden nem üres C halmazában van egy legkisebb szám. Egy halmazt akkor mondunk üresnek, ha egyetlen eleme sincs, pl. az egyenes körök halmaza vagy az olyan n egész számok halmaza, amelyekre n > n. Magától értetődően az ilyen halmazokat kizárjuk tételünk állításából. A C halmaz lehet véges, mint pl. az 1, 2, 3, 4, 5 halmaz, vagy végtelen, mint pl. a páros számok halmaza: 2, 4, 6, 8, 10, . . . . Bármely nem üres C halmazban kell lennie legalább egy természetes számnak, legyen ez n, és a C-be tartozó 1, 2, 3, . . ., n egész számok közül a legkisebb lesz a legkisebb C-be tartozó egész szám. Ennek az elvnek a jelentőségét leginkább az mutatja, hogy nem alkalmazható minden, tetszőleges számokat tartalmazó C halmazra. Ha a halmaz például az összes 0, ±1, ±2 . . . egész számokat tartalmazza, nincs legkisebb eleme. Ugyancsak nincs legkisebb eleme a pozitív törtek 1, 1/2, 1/3, 1/4, . . . halmazának sem. Logikai szempontból érdekes, hogy a legkisebb egész szám elvét fel lehet használni a matematikai indukció elvének mint tételnek a bizonyítására. Tekintsünk ebből a célból
22
bármely olyan A1 , A2 , A3 , . . . állítássorozatot, amelyben a) Ar+1 következik Ar -ből, r bármely pozitív egész szám és b) A1 -ről tudjuk, hogy igaz. Kimutatjuk, hogy az a feltevés, hogy az A-k akármelyike is hamis, tarthatatlan. Ugyanis ha csak egyetlen A hamis lenne, azoknak az n pozitív egész számoknak a C halmaza, amelyikre An hamis, nem lenne üres halmaz. Így a legkisebb egész szám elve szerint Cnek kellene tartalmaznia egy olyan legkisebb p egész számot, amelyik b) miatt nagyobb, mint 1. Ezért Ap hamis lenne, Ap−1 pedig igaz, ami ellentmond a)-nak. Még egyszer hangsúlyozzuk, hogy a matematikai indukció elve egészen másvalami, mint az, amit a természettudományokban indukció alatt értenek. Egy általános törvény igazolása akármilyen nagy, de véges számú esetben sohasem szolgáltathatja a törvény szigorú, matematikai értelemben vett bizonyítását, még akkor sem, ha az adott időben egyetlen kivételről sem tudunk. Egy ilyen törvény legfeljebb nagyon valószínű hipotézis marad, nyitva hagyva a lehetőségét későbbi tapasztalatok szerinti változtatásoknak. A matematikában viszont törvényt vagy tételt csak akkor nevezünk bizonyítottnak, ha ki lehet mutatni, hogy valamilyen érvényesnek elfogadott feltevésekből logikai szükségszerűséggel következik. Sok példa hozható olyan matematikai állításra, amit minden eddig tárgyalt egyedi esetre igazoltak, azonban nem bizonyították az általános érvényességét (egy ilyen példa található az 36. oldalon). Számos példán való igazolás után sejthetjük egy tételről, hogy általánosságban igaz, s megkísérelhetjük bizonyítani matematikai indukcióval. Ha a kísérlet sikerrel jár, bebizonyítottuk a tételt, ha nem, a tétel lehet igaz vagy hamis, s egyszer még sikerülhet valamilyen más módon bebizonyítani vagy megcáfolni. Ha a matematikai indukciót használjuk, mindig meg kell győződni, hogy az a) és b) feltételek valóban teljesülnek-e. Ennek az elővigyázati szabálynak az elhanyagolása az alábbiakban bemutatandó értelmetlenséghez hasonló dolgokra vezethet. Be fogjuk „bizonyítani”, hogy bármely két pozitív egész szám egyenlő, pl. 5 = 10. Az olvasóra bízzuk annak a felfedezését, hol van a gondolatmenetben a hiba. Először egy definíció: Ha a és b két nem egyenlő pozitív egész szám, jelentse max(a, b) a nagyobbat a és b közül; ha pedig a = b, legyen max(a, b) = a = b. Így pl. max(3, 5) = max(5, 3) = 5, és max(4, 4) = 4. Legyen most An a következő állítás: „ha a és b bármely két
23
olyan pozitív egész szám, amelyekre max(a, b) = n, akkor a = b.” Tételezzük fel, hogy Ar igaz. Legyen a és b bármely két olyan pozitív egész szám, amelyekre max(a, b) = r + 1. Tekintsük α=a−1 és β=b−1 egész számokat; akkor max(α, β) = r. Tehát α = β, mert feltételezzük, hogy Ar igaz. b) A1 nyilvánvalóan igaz, mivel ha max(a, b) = 1, akkor a és b egyaránt egyenlő kell legyen 1-gyel, mivel feltevésünk szerint mind a kettő pozitív egész szám. Ezért a matematikai indukció elve szerint következik, hogy An minden n-re igaz. Mármost, ha a és b két tetszőleges pozitív egész szám, jelöljük max(a, b)-t r-rel. Mivel kimutattuk, hogy An minden n-re igaz, azért igaz Ar is, tehát a = b.
24
Kiegészítés az I. fejezethez. Számelmélet Bevezetés A természetes számok lassanként elvesztették misztikus nimbuszukat, de a matematikusok és laikusok érdeklődése sohasem csökkent a számok világának törvényei iránt. Euklidész hírneve Elemei nek geometriai részén alapul; az Elemek a mai napig erősen hat az iskolai geometriaoktatásra. Pedig Euklidész geometriája lényegileg régebbi eredmények összefoglalása, míg a számelméletben valószínűleg önálló eredményeket ért el. Alexandriai Diophantosz (i. sz. 275 körül), az algebra egyik korai nagymestere is rajta hagyta kézjegyét a számelméleten. Pierre de Fermat (1601–1665), Toulouse-i jogász, kora egyik legnagyobb matematikusa indította el ezen a területen a modern értelemben vett kutatást. Euler (1707–1783) minden idők legtermékenyebb matematikusa, sok számelméleti jellegű problémával is foglalkozott. A matematika annaleszeinek nagy nevei – Legendre, Dirichlet, Riemann – folytatják a sort. Gauss (1777–1855), az újkor egyik legnagyobb és legsokoldalúbb matematikusa, aki a matematika számos ágával foglalkozott, állítólag azt mondotta volt, hogy a „matematika a tudományok királynője, a matematika királynője pedig a számelmélet”.
1. § Prímszámok 1. Alapvető tények A számelmélet állításai, mint egyébként a matematika állításai általában, nem egyetlen objektumra – mondjuk az 5-ös vagy 32-es számra – vonatkoznak, hanem az objektumok egy egész, valamilyen közös tulajdonsággal rendelkező osztályára, amilyen pl. az összes páros szám osztálya: 2, 4, 6, 8, . . . ,
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526102851+02’00’
25
vagy az összes hárommal osztható számból álló osztály: 3, 6, 9, 12, . . . , vagy az egész számok négyzeteinek az osztálya: 1, 4, 9, 16, . . . és így tovább. Alapvető fontosságú a számelméletben a prímszámok osztálya. A legtöbb egész szám kisebb tényezőkre bontható fel: 10 = 2 · 5, 111 = 3 · 37, 144 = 3 · 3 · 2 · 2 · 2 · 2 stb. Azokat a számokat, amelyek nem bonthatók fel további tényezőkre, prímszámoknak vagy prímeknek nevezzük. Pontosabban, az olyan egynél nagyobb p egész számot nevezzük prímszámnak, amelyiknek egyen és önmagán kívül nincs más osztója. (Egy a egész számot akkor mondunk egy másik b egész szám osztójának vagy faktor ának, ha létezik egy olyan c egész szám, amelyik kielégíti a b = ac egyenlőséget.) A 2, 3, 5, 7, 11, 13, 17, . . . számok prímszámok, míg pl. 12 nem az, mert 12 = 3 · 4. A prímszámok osztályának a fontossága annak köszönhető, hogy minden egész szám kifejezhető prímszámok szorzataként : ha valamely szám maga nem prím, lépésenként faktorizálható, míg minden faktora prímszám lesz: így pl. 360 = 3·120 = 3·30·4 = 3·3·10·2·2 = 3·3·5·2·2·2 = 23 ·32 ·5. Valamely 0-tól és 1-től különböző egész számot, amely nem prímszám, összetett számnak nevezünk. Egyik legelső kérdés a prímszámok osztályával kapcsolatban az, hogy véges sok prímszám létezik-e, vagy pedig a prímszámok osztályának ugyanúgy végtelen sok eleme van, mint az egész számok osztályának, amelynek a prímszámok osztálya egy részét képezi. A felelet az, hogy végtelen sok prímszám létezik. A prímszámok halmazának végtelenségét bizonyító euklidészi következtetésmód örök példaképe a matematikai bizonyításnak. Euklidész az indirekt bizonyítást alkalmazta. Abból a feltevésből indulunk ki, hogy a tétel nem igaz. Jelen esetben ez a feltevés annyit jelent, hogy csak véges sok prímszám létezik, talán nagyon sok – egy billió akár, vagy még több – vagy, általános és meg nem kötött módon kifejezve: n, ami meghatározott véges szám. Indexeket használva, jelöljük p1 , p2 , . . ., pn -nel ezeket a prímszámokat. Minden
26
más szám összetett szám, s így oszthatónak kell lennie a p1 , p2 , . . ., pn prímszámok közül legalább eggyel. Ki fogjuk mutatni, hogy ez az állítás ellentmondásra vezet, mert előállíthatunk egy olyan A számot, amelyik a p1 , p2 , . . ., pn prímszámok mindegyikétől különbözik, mert mindegyiküknél nagyobb, s mégsem osztható egyikőjükkel sem. Ez a szám A = p1 p2 . . . pn + 1, azaz 1-gyel nagyobb az összes feltételezett prímszám szorzatánál. A nagyobb, mint a p számok bármelyike, ezért összetett számnak kell lennie. De ha A-t elosztjuk p1 -gyel vagy p2 -vel, vagy bármelyik p számmal, mindig marad 1, ezért egyik p szám sem osztója A-nak. Mivel azonban ez ellentmond annak a feltevésünknek, hogy csak véges sok prímszám létezik, a feltevés abszurd, s az ellenkezője kell, hogy igaz legyen. Ezzel bebizonyítottuk tételünket. Bár ez a bizonyítás indirekt, mégis könnyen módosítható úgy, hogy – legalábbis elméletben – módszert kapjunk a prímszámok egy végtelen sorozatának az előállítására. Induljunk ki valamilyen prímszámból, legyen pl. p1 = 2, és tételezzük fel, hogy ismerünk n prímszámot: p1 , p2 , . . ., pn -et. Megjegyezzük (mint fentebb), hogy a p1 p2 . . . pn + 1 szám vagy maga is prím, vagy van egy prímosztója, amely különbözik a már ismertektől. Mivel ez a prímosztó próbálkozással mindig egyszerűen megtalálható, bizonyosak lehetünk, hogy minden esetben található legalább egy új pn+1 prímszám. Ezen a módon haladva belátható, hogy az előállítható prímszámok sorozata sehol sem ér véget. Gyakorlat: Állítsunk elő a fentiek alapján p1 = 2 és p2 = 3-ból kiindulva további 5 prímszámot.
Prímszámok szorzataként előállított számban a prímtényezők tetszőleges sorrendbe írhatók. Rövid próbálgatással beláthatjuk, hogy ettől az egy önkényességtől eltekintve, valamely N szám prímtényezőkre való felbontása egyértelmű: minden 1-nél nagyobb N egész szám egy és csakis egyféleképpen bontható fel prímtényezők szorzatára. Ez az állítás első pillanatra annyira nyilvánvalónak látszik, hogy a nem szakember kész minden további nélkül elfogadni. Mégsem trivialitás, és a bizonyítása – jóllehet teljesen elemi eszközökkel oldható meg – egy kis éleselméjűséget követel. A klasszikus bizonyítás, amit Euklidész erre az „aritmetika alaptételé”-nek nevezett tételre ad, két szám legnagyobb közös osztójának a megkeresésére szolgáló „algoritmus”-on alapul. Ezt a módszert a
27
51. oldalon fogjuk tárgyalni. Itt ehelyett egy újabb bizonyítást adunk, ami valamivel rövidebb és talán szellemesebb, mint az Euklidészé. A levezetés tipikus példája az indirekt bizonyításnak. Először is feltételezzük, hogy létezik olyan természetes szám, amelyet két, lényegesen különböző módon lehet prímtényezők szorzatára bontani, és ebből a feltevésből vezetjük le az ellentmondást. Ez az ellentmondás azt mutatja, hogy tarthatatlan feltevés a két lényegesen különböző prímtényezőre való felbontás lehetősége, tehát minden szám prímtényezőkre való felbontása egyértelmű. *Ha létezik olyan pozitív egész szám, amely két lényegesen különböző módon bontható prímtényezők szorzatára, akkor kell lennie egy legkisebb ilyen tulajdonságú számnak (l. 22. o.), legyen ez m: m = p1 p2 . . . pr = q1 q2 . . . qs ,
(1)
ahol a p-k és q-k prímszámok. Ha a p és q számokat szükség szerint átrendezzük, feltehetjük, hogy p1 5 p2 5 . . . 5 pr
és
q 1 5 q2 5 . . . 5 qs .
p1 nem lehet egyenlő q1 -gyel, mivel ha egyenlő lenne, az (1) egyenlet mindkét oldalán elhagyhatnánk az első tényezőt, és így olyan egész számnak kapnánk két lényegesen különböző prím felbontását, amelyik kisebb, mint m, holott feltevésünk szerint m a legkisebb ilyen tulajdonságú egész szám. Tehát vagy p1 < q1 , vagy q1 < p1 . Tegyük fel, hogy p1 < q1 (Ha q1 < p1 , egyszerűen megcseréljük az alábbi bizonyításban a p és a q betűt.) Képezzük az m 0 = m − (p1 q2 q3 . . . qs )
(2)
egész számot. Ha m helyébe az (1) egyenletben megadott két előállítást helyettesítjük, az m 0 egész számot kétféleképpen írhatjuk: m 0 = (p1 p2 . . . pr ) − (p1 q2 . . . qs ) = p1 (p2 p3 . . . pr − q2 q3 . . . qs ),
(3)
m 0 = (q1 q2 . . . qs ) − (p1 q2 . . . qs ) = (q1 − p1 )(q2 q3 . . . qs ).
(4)
vagy
Mivel p1 < q1 , (4)-ből következik, hogy m 0 pozitív egész szám, (2)-ből pedig következik,
28
hogy m 0 kisebb, mint m. Tehát, a tényezők sorrendjétől eltekintve, m 0 prímtényezőkre való bontásának egyértelműnek kell lennie, (3)-ból látható azonban, hogy a p1 prímszám m 0 egyik tényezője, tehát (4) miatt p1 -nek vagy (q1 − p1 )-ben vagy (q2 q3 . . . qs )-ben kell prímtényezőként előfordulnia. (Ez az m 0 prímfelbontásának feltételezett egyértelműségéből következik, l. a következő § végét.) Az utóbbi eset lehetetlen, mivel a q-k mind nagyobbak, mint p1 . Tehát p1 -nek q1 − p1 prímtényezőjének kell lennie, ezért létezik olyan h egész szám, amely q1 − p1 = p1 h
tehát
q1 = p1 (h + 1).
Eszerint azonban p1 a q1 osztója lenne, ami ellentmond annak a ténynek, hogy q1 prímszám. Ebből az ellentmondásból következik, hogy kiinduló feltevésünk tarthatatlan, és ezzel bebizonyítottuk az aritmetika alaptételét. Az alaptétel fontos korolláriuma a következő: Ha egy p prímszám osztója az ab szorzatnak, akkor p osztója vagy a-nak, vagy b-nek. Ugyanis ha p sem a-nak, sem bnek nem lenne osztója, akkor a és b prímfelbontásainak szorzata az ab egész szám olyan prímfelbontása lenne, amelyik nem tartalmazza p-t. Másrészt, mivel p-ről feltettük, hogy ab prímosztója, létezik olyan t egész szám, amelyik kielégíti az ab = pt egyenlőséget. Tehát ha t egy prímfelbontását megszorozzuk p-vel, az ab egész szám p-t tartalmazó prímfelbontását kapnánk, ami ellentmond annak a ténynek, hogy ab prímfelbontása egyértelmű. Példák: Ha igazoltuk, hogy 13 prímosztója 2652-nek, és hogy 2652 = 6·442, következik, hogy 13 prímosztója 442-nek. Másrészről, 6 tényezője 240-nek és 240 = 15 · 16, de 6 nem tényezője sem 15-nek, sem 16-nak. Látjuk ebből, hogy lényeges követelmény az, hogy p prímszám legyen. Gyakorlat : Bármely a szám összes osztóját megkapjuk, ha a-t felbontjuk a = pα1 1 pα2 2 . . . pαr r szorzatra, ahol a p-k egymástól különböző prímszámok, mindegyik valamilyen hatványon. a
29
összes osztója megadható mint valamely b = pβ1 1 pβ2 2 . . . pβr r szám, ahol β = 0 tetszőleges egész számok, amelyek kielégítik a 0 5 β1 5 α1 ,
0 5 β2 5 α2 , . . . ,
0 5 βr 5 αr
egyenlőtlenségeket. Bizonyítsuk be ezt az állítást. Mutassuk ki, ennek a tételnek következményeképpen, hogy a egymástól különböző osztóinak a számát (beleértve az osztókba a-t és 1-et is) az (α1 + 1)(α2 + 1) . . . (αr + 1) szorzat adja meg. Pl. 144 = 24 · 32 osztóinak a száma 5 · 3. Ezek: 1, 2, 4, 8, 16, 3, 6, 12, 24, 48, 9, 18, 36, 72, 144.
2. A prímszámok eloszlása Egy adott N természetes számnál nem nagyobb prímszámok táblázata a következőképpen állítható elő: írjuk fel sorrendben az összes N-nél kisebb egész számot, hagyjuk el 2 többszöröseit, azután hagyjuk el a megmaradtakból 3 többszöröseit, és így tovább, amíg minden összetett számot elhagytunk. Ez az „Eratoszthenész szitája” néven ismert eljárás minden prímszámot „kiszűr” N-ig. Ennek a módszernek a finomításaival kb. 10 000 000-ig állítottak össze prímszámtáblázatokat, amelyek a prímszámok eloszlására és tulajdonságaira vonatkozó adatok tömegét szolgáltatják. Ezeknek a táblázatoknak alapján sok igen valószínű sejtést lehet kimondani (mintha csak a számelmélet kísérleti tudomány volna), amelyeket gyakran nagyon nehéz bebizonyítani. a) Prímszámokat előállító képletek Megkíséreltek olyan aritmetikai képleteket találni, amelyek csupa prímszámot állítanak elő, még ha nem is adják meg az összes prímszámot. Fermat -tól származik az a híres
30
sejtés (de határozott állítása nem), hogy az n
F(n) = 22 + 1 alakú számok mind prímszámok. Valóban, n = 1, 2, 3, 4 esetére F(1) = 22 + 1 = 5, 2
F(2) = 22 + 1 = 24 + 1 = 17, 3
F(3) = 22 + 1 = 28 + 1 = 257, 4
F(4) = 22 + 1 = 216 + 1 = 65 537, mind prímszámok. De 1732-ben Euler felfedezte, hogy 22 + 1 = 641 · 6 700 417 szorzat 5
formájában állítható elő F(5), tehát nem prímszám. Később több ilyen „Fermat-féle szám” is összetettnek bizonyult, a közvetlen próbálgatás legyőzhetetlen nehézsége miatt mindegyik esetben bonyolultabb számelméleti megfontolásra volt szükség. Mai napig még azt sem sikerült igazolni, hogy van-e egyáltalán n > 4 esetére az F(n) számok között prím. Egy másik figyelemre méltó és egyszerű, sok prímszámot előállító kifejezés a következő: f(n) = n2 − n + 41. n = 1, 2, 3, . . ., 40 esetére f(n) prímszám, n = 41 esetében azonban f(n) = 412 , ami már nem prímszám. Az n2 − 79n + 1601 kifejezés csupa prímszámot ad egészen n = 79-ig, de ha n = 80, már nem. Egészében véve, csupa prímszámot szolgáltató egyszerű kifejezések keresése hiábavaló munkának bizonyult. Még reménytelenebb vállalkozás lenne olyan algebrai képletet keresni, amelyik az összes prímszámot megadná.
31
b) Prímszámok a számtani sorokban Egyszerű volt annak az igazolása, hogy az egész számok 1, 2, 3, 4, . . . sorozatában végtelen sok prímszám van. Sokkal nehezebb lépés volt már ennek a tételnek az általánosítása olyan sorozatokra, mint pl. 1, 4, 7, 10, 13, . . . vagy 3, 7, 11, 15, 19, . . ., vagy általánosságban, bármely olyan a, a+d, a+2d, . . ., a+nd, . . . számtani sorra, amelyben a és d számoknak nincs közös osztója. Minden megfigyelés arra utalt, hogy az ilyen számtani sorokban éppen úgy végtelen sok prímszám van, mint a természetes számok 1, 2, 3, . . . sorozatában. Az általános tétel bizonyítása azonban nagyon fáradságos volt. A XIX. század egyik legkiválóbb matematikusa, Lejeune-Dirichlet (1805–1859) oldotta meg a kérdést a matematikai analízis akkoriban leghaladottabbnak számító eszközeivel. Eredeti közleményei ma is a matematika kiemelkedő eredményei közé tartoznak, de száz év alatt sem sikerült bizonyítását annyira egyszerűsíteni, hogy az az infinitezimális számításban és a függvénytanban kevésbé járatosak számára is hozzáférhető legyen. Nem kísérelhetjük meg e helyen Dirichlet általános tételének a bizonyítását, viszont egyes speciális számtani sorokra, mint amilyen pl. 4n + 3 vagy 6n + 5, könnyen általánosíthatjuk Euklidész prímszámok végtelenségére vonatkozó bizonyítását. Vegyük a 4n + 3 esetet. Minden 2-nél nagyobb prímszám páratlan (egyébként osztható lenne 2-vel) és így vagy 4n + 1 vagy 4n + 3 alakú, ahol n tetszőleges egész szám. Továbbá két 4n + 1 alakú szám szorzata újból ilyen alakú szám, mivel (4a + 1)(4b + 1) = 16ab + 4a + 4b + 1 = 4(4ab + a + b) + 1. Tételezzük fel már most, hogy véges számú 4n + 3 alakú p1 , p2 , . . ., pn prímszám létezik, és tekintsük az N = 4(p1 p2 . . . pn ) − 1 = 4(p1 p2 . . . pn − 1) + 3 számot. Vagy N maga prímszám, vagy felbontható a p1 , . . ., pn számoktól különböző prímszámok szorzatára, ugyanis a p1 , . . ., pn prímszámok bármelyikével osztva −1 maradékot kapunk. Továbbá N minden prímtényezője nem lehet 4n + 1 alakú, mivel N nem ilyen alakú, és láttuk, hogy 4n + 1 alakú számok szorzata újból 4n + 1 alakú. Kell tehát lenni legalább egy 4n + 3 alakú prímtényezőnek N felbontásában, de ez lehetetlen, hiszen láttuk, hogy a p számok egyike sem lehet N prímtényezője, márpedig feltevésünk
32
szerint a p számokon kívül nincs több 4n + 3 alakú prímszám. Tehát az a feltevés, hogy véges sok 4n + 3 alakú prímszám létezik, ellentmondásra vezetett, és így végtelen sok 4n + 3 alakú prímszámnak kell lenni. Gyakorlat. Bizonyítsuk be a megfelelő tételt a 6n + 5 számtani haladványra.
c) A prímszámtétel A prímszámok eloszlását megadó törvény keresésében döntő lépés volt, hogy a matematikusok feladták az összes prímszámot vagy az első n egész szám között található prímek pontos számát megadó, egyszerű matematikai képlet megtalálásának hiú reményét, és ehelyett a prímszámok egész számok közötti átlagos sűrűsége iránt kezdtek érdeklődni. Jelölje An bármely n természetes szám esetén az 1, 2, 3, . . ., n egész számok között előforduló prímek számát. Aláhúzva az első természetes számok sorozatában a prímeket: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, . . . megállapíthatjuk An néhány első értékét: A1 = 0, A2 = 1, A3 = A4 = 2, A5 = A6 = 3, A7 = A8 = A9 = A10 = 4, A11 = A12 = 5, A13 = A14 = A15 = A16 = 6, A17 = A18 = 7, A19 = 8 és így tovább. Ha vesszük az n értékeinek bármely, minden határon túl növekvő sorozatát, mondjuk n = 10, 102 , 103 , 104 , . . . sorozatot, akkor a megfelelő An értékek A10 , A102 , A103 , A104 , . . . sorozata is minden határon túl növekszik (bár lassabban). Tudjuk, hogy végtelen sok prímszám létezik, így az An értékei előbb-utóbb bármely véges számon túlhaladnak. A prímszámok első n egész szám közötti „sűrűségét” az An /n arány adja meg. Ez az arány prímszámtáblázatokból n-nek néhány nagy értékére empirikusan kiszámítható. A táblázat utolsó bejegyzése pl. úgy tekinthető, mint annak a valószínűsége, hogy egy,
33
n
An /n
103
0, 168
106
0, 078498
109
0, 050847478
...
............
5. ábra. A hiperbola alatti vonalkázott rész területe definiálja ln n-et az első 109 egész szám közül véletlenszerűen választott egész szám prím lesz, ugyanis a 109 lehetséges választás közül A109 számú választás vezet prímszámra. Az egyes prímszámoknak a természetes számok közötti eloszlása roppant szabálytalan. De ez a „kicsiben” észlelhető szabálytalanság eltűnik, ha az
An n
arány által megadott
átlagos prímszám sűrűséget tekintjük. A matematika egyik legmeglepőbb felfedezése, hogy milyen egyszerű törvény szabja meg ennek az aránynak a viselkedését. Ennek a prímszámtételnek a kimondásához azonban szükségünk van n egész szám „természetes logaritmusá”-nak a definiálására. Vegyünk fel a síkban két egymásra merőleges tengelyt, és tekintsük a sík azon pontjainak az összességét, amelyekre a tengelyektől vett x és y távolságok szorzata 1-gyel egyenlő. Ezt a „geometriai hely”-et x és y koordinátákban kifejezve az xy = 1 egyenlet definiálja, s a neve „egyenlő szárú hiperbola”. Mármost definíciószerűen ln n az a terület, amit az 5. ábrán az egyenlő szárú hiperbola, az x-tengely és az x = 1, x = n függőlegesek határolnak. (A logaritmus bővebb tárgyalása a nyolcadik fejezetben található.) Gauss a prímszámtáblázatok empirikus tanulmányozásából arra a következtetésre jutott, hogy az
An n
arány megközelítően egyenlő
1 -nel, ln n
és hogy ez
a megközelítés n növekedtével egyre pontosabb. A megközelítés pontosságát az
34
An /n 1/ ln n
arány adja meg, melynek értékét n = 1000, 1 000 000, 1 000 000 000 esetében az alábbi táblázatban közöljük: n
An /n
1/ ln n
An /n 1/ ln n
103
0, 168
0, 145
1, 159
106
0, 078498
0, 072382
1, 084
9
0, 050847478
0, 048254942
1, 053
...
............
............
.....
10
Ilyen empirikus adatok alapján Gauss azt a sejtést mondotta ki, hogy az
An n
arány
„aszimptotikusan egyenlő” 1/ ln n értékével. Ezen azt kell érteni, hogy növekvő n értékek valamely, mondjuk a fenti 10, 102 , 103 , 104 , . . . sorozatát tekintve, az egymás utáni n értékekre számított An /n 1/ ln n arány egyre inkább megközelíti 1-et, és az arány 1-től való különbsége tetszőlegesen kicsinnyé tehető, ha elegendően nagynak választjuk n értékét. Ezt a tényt szimbolikusan a ∼ jellel fejezzük ki: 1 An ∼ n ln n tehát azt jelenti, hogy An /n 1/ ln n n növekedtével 1-hez tart. Abból a tényből is nyilvánvaló, hogy a ∼ jelet nem szabad a közönséges = egyenlőségjellel felcserélni, mert míg An mindig egész szám, n/ ln n nem az. Igen figyelemre méltó felfedezés, hogy a prímszámok eloszlása leírható a logaritmus függvénnyel. Meglepő ugyanis, hogy két látszólag annyira távol álló matematikai fogalom ilyen szoros kapcsolatban van egymással. A Gauss sejtésében kimondott állítást könnyű megérteni, de a sejtés szigorú matematikai bizonyítása messze meghaladta a Gauss-korabeli matematika lehetőségeit. Jóllehet a tétel csak a legelemibb matematikai fogalmakat tartalmazza, bizonyítása a
35
modern matematika leghaladottabb módszereit igényelte. Csaknem száz évig tartott, amíg az analízis odáig fejlődött, hogy Hadamard Párizsban (1896) és de la Vallée Poussin Louvainban (1896) a prímszámtétel teljes bizonyítását tudták adni. Később von Mangoldt és Landau egyszerűsítették és jelentősen módosították a bizonyítást. Jóval Hadamard előtt Riemann (1826–1866) végzett ezen a területen döntő úttörő munkát, kijelölve egy híres értekezésében a támadás fő stratégiai vonalait. Újabban Norbert Wiener amerikai matematikusnak sikerült kiküszöbölni a bizonyításból a gondolatmenet egy fontos lépésében addig használt komplex számokat. De a prímszámtétel bizonyítása még így sem könnyű, felsőéves matematika szakos hallgatónak sem. A 585. és következő oldalakon még visszatérünk majd a kérdésre. d) Két, prímszámokra vonatkozó megoldatlan probléma Míg a prímszámok átlagos sűrűségének problémája kielégítően megoldódott, addig sok más olyan sejtés van a számelméletben, amelyet alátámaszt ugyan a tapasztalat, de amelyet még a mai napig nem sikerült bebizonyítani. Ezek közé tartozik a híres Goldbach-sejtés. Goldbach (1690–1764), azzal vált jelentőssé a matematika történetében, hogy 1742-ben, Euler hez írott levelében felvetette ezt a problémát. Megfigyelte, hogy az általa kipróbált esetekben bármely páros számot elő lehetett állítani két prímszám összegeként (a 2 kivételével, amelyik maga is prímszám). Pl.: 4 = 2 + 2, 6 = 3 + 3, 8 = 5 + 3, 10 = 5 + 5, 12 = 5 + 7, 14 = 7 + 7, 16 = 13 + 3, 18 = 11 + 7, 20 = 13 + 7, . . ., 48 = 29 + 19, . . ., 100 = 97 + 3 és így tovább. Goldbach azt kérdezte Euler től, be tudja-e bizonyítani, hogy ez a tétel minden páros számra áll, vagy tud-e ellenpéldát adni. Euler erre sohasem válaszolt, s mostanáig senki sem találta meg a bizonyítást vagy az ellenpéldát. A tapasztalat igen erősen amellett szól, hogy minden páros szám előállítható ilyen módon, amint azt bárki számos példán kipróbálhatja. A probléma azért olyan nehéz, mert a prímszámokat szorzás útján definiáljuk, míg itt összeadásról van szó. Az egész számok multiplikatív és additív tulajdonságai között pedig egyébként is nehéz összefüggéseket találni. Goldbach sejtése egészen a legutóbbi időkig teljesen megközelíthetetlen volt a bizonyítás szempontjából. Ma a megoldás nem látszik többé reménytelennek. Az első váratlan és minden hozzáértő számára megdöbbentő eredményt 1931-ben érte el egy akkoriban fiatal
36
és ismeretlen orosz matematikus, Snirelmann (1905–1938), bebizonyítva, hogy minden pozitív egész szám előállítható 300 000-nél nem több prímszám összegeként. Lehet, hogy ez az eredmény nevetségesen szerénynek látszik a Goldbach-sejtés eredeti céljához képest, mégis ez volt a legelső lépés a bizonyítás irányába. Snirelmann bizonyítása direkt, konstruktív, bár nem ad gyakorlati módszert tetszőleges egész szám prímfelbontására. Újabban I. M. Vinogradov orosz matematikusnak sikerült – Hardy, Littlewood és indiai munkatársuk, Rámánudzsan eredményeinek a felhasználásával – lecsökkenteni ezt a számot 300 000-ről 4-re. Vinogradov azonban csak minden „elegendően nagy” egész számra bizonyította be tételét, pontosabban azt bizonyította be, hogy létezik olyan N egész szám, amelynél nagyobb minden n egész szám előállítható legfeljebb 4 prímszám összegeként. Vinogradov bizonyítása alapján nem lehet megbecsülni N-et, ellentétben Snirelmann tételével, Vinogradové lényege szerint indirekt, nem konstruktív bizonyítás. Vinogradov voltaképpen azt a tételt bizonyította be, hogy a következő állítás: „nem lehet végtelen sok egész számot legfeljebb 4 prímszám összegére felbontani”, ellentmondásra vezet. Íme egy jó példa a két bizonyítástípus, direkt és indirekt közötti lényeges különbségre. (L. általános tárgyalását a 106. oldalon.) Végül említsünk meg még egy megoldatlan problémát, amely legalább olyan érdekes, mint a Goldbach-sejtés, s amelynek megoldása még sehol sem tart. Megfigyelték, hogy a prímszámtáblázatokban gyakran fordulnak elő p és p + 2 alakú párok. Ilyenek pl. 3 és 5, 11 és 13, 29 és 31 stb. Nyilvánvalónak látszik az a feltevés, hogy végtelen sok ilyen pár létezik, de eddig még nem történt döntő lépés a bizonyítására.
2. § Kongruenciák 1. Alapfogalmak Mindenütt, ahol egész számok valamely rögzített d egész számmal való osztásáról van szó, a (Gausstól származó) „kongruencia”-fogalom használatos a tárgyalás tisztábbá és egyszerűbbé tételére. A fogalom bevezetése kedvéért vizsgáljuk, hogy milyen maradékokat kapunk, ha az
37
egész számokat rendre 5-tel osztjuk: 0=0·5+0
7= 1 · 5 + 2
− 1 = −1 · 5 + 4
1=0·5+1
8= 1 · 5 + 3
− 2 = −1 · 5 + 3
2=0·5+2
9= 1 · 5 + 4
− 3 = −1 · 5 + 2
3=0·5+3
10= 2 · 5 + 0
− 4 = −1 · 5 + 1
4=0·5+4
11= 2 · 5 + 1
− 5 = −1 · 5 + 0
5=1·5+0
12= 2 · 5 + 2
− 6 = −2 · 5 + 4
6=1·5+1
és így tovább
és így tovább.
Láthatjuk, hogy bármely egész számot 5-tel elosztva, a maradék a 0, 1, 2, 3, 4 egész számok egyike. Ha két egész szám, a és b 5-tel osztva ugyanazt a maradékot adja, akkor azt mondjuk, hogy a két szám „kongruens modulo 5”. Így pl. 2, 7, 12, 17, 22, . . ., −3, −8, −13, −18, . . . valamennyi kongruens modulo 5, mivel 5-tel osztva mindegyik 2-t ad maradékul. Általában, azt mondjuk, hogy két egész szám a és b kongruens modulo d, ahol d meghatározott egész szám, ha a és b d-vel osztva ugyanazt a maradékot adják, azaz ha létezik olyan n egész szám, amelyik kielégíti az a − b = nd egyenletet. Pl. 27 és 15 kongruens modulo 4, mivel 27 = 6 · 4 + 3,
15 = 3 · 4 + 3.
A kongruencia fogalma annyira hasznos, hogy kívánatos rövid jelölést bevezetni rá. Jelölje a≡b
(mod d)
azt a tényt, hogy a és b kongruens modulo d. Ha a modulust illetően nem lehet kétség, a „mod d” elhagyható a formulából. (Azt a tényt, hogy a nem kongruens b-vel modulo d, a következőképpen jelöljük: a 6≡ b (mod d).) Kongruenciákkal gyakran találkozunk mindennapi életünkben. Például az óra mutatói modulo 12 mutatják az időt, az autó kilométerjelzője modulo 100 000 mutatja a megtett kilométereket. Mielőtt rátérnénk a kongruenciák részletes tárgyalására, kérjük az olvasót, figyelje
38
meg, hogy az alábbi állítások ekvivalensek: 1. a kongruens b-vel modulo d. 2. van olyan n egész szám, amelyre a = b + nd. 3. d osztója (a − b)-nek. A Gauss-féle kongruencia-jelölés azért olyan hasznos, mert valamely rögzített modulus szerint vett kongruencia formális szempontból sok tekintetben hasonlít a közönséges egyenlőséghez. Az a = b reláció legfontosabb formális tulajdonságai a következők: 1) Bármely a-ra a = a. 2) Ha a = b, akkor b = a. 3) Ha a = b és b = c, akkor a = c. Továbbá, ha a = a 0 és b = b 0 , akkor 4) a + b = a 0 + b 0 . 5) a − b = a 0 − b 0 . 6) ab = a 0 b 0 . Ezek a tulajdonságok igazak maradnak akkor is, ha az a = b egyenlőséget az a ≡ b (mod d) kongruenciával helyettesítjük. Tehát 1’) Bármely a-ra a ≡ a. 2’) Ha a ≡ b (mod d), akkor b ≡ a (mod d). 3’) Ha a ≡ b (mod d) és b ≡ c (mod d), akkor a ≡ c (mod d). Ezeknek a tényeknek az igazolása triviális, az olvasóra bízzuk. Továbbá, ha a ≡ a 0 (mod d) és b ≡ b 0 (mod d), akkor 4’) a + b ≡ a 0 + b 0 (mod d). 5’) a − b ≡ a 0 − b 0 (mod d). 6’) ab ≡ a 0 b 0 (mod d). Tehát ugyanazon modulus szerint vett kongruenciák összeadhatók, kivonhatók és szorozhatók. Ennek a három állításnak a bizonyítására elég a következőt megemlíteni: Ha a = a 0 + rd,
b = b 0 + sd,
39
akkor a + b = a 0 + b 0 + (r + s)d, a − b = a 0 − b 0 + (r − s)d, ab = a 0 b 0 + (a 0 s + b 0 r + rsd)d, amiből fenti állításunk következik.
6. ábra. Az egész számok geometriai ábrázolása Jobban megvilágosítja a kongruencia fogalmát geometriai interpretációja. Ha az egész számokat geometriailag akarjuk ábrázolni, általában veszünk egy egységnyi hosszúságú szakaszt, s ezt mindkét irányban meghosszabbítva, ismételten felmérjük az így kapott egyenesre. Az így nyert pontok mindegyikét megfeleltethetjük egy-egy egész számnak, amint az a 6. ábrán látható. Ha azonban modulo d tekintjük az egész számokat, akkor bármely két kongruens számot azonosnak kell tekinteni a d-vel való osztás szempontjából, mivel ugyanazt a maradékot adják. Ezt a tényt geometriailag d egyenlő részre osztott körrel ábrázolhatjuk. Bármely egész számot osztva d-vel a 0, 1, . . ., d − 1 számok valamelyikét kapjuk maradékként, ezeknek feleltetjük meg a d egyenlő részre osztott kör osztási pontjait. Minden egész szám kongruens modulo d a 0, 1, . . ., d − 1 számok valamelyikével, és így geometriailag a kör osztáspontjainak valamelyikével ábrázolható; két szám akkor kongruens, ha ugyanaz a pont ábrázolja. A 7. ábra d = 6 esetre érvényes. Az óra számlapja a mindennapi életből vett illusztráció a d = 12-re. A kongruenciák 6 0 ) multiplikatív tulajdonságának a felhasználására szolgáló példaként határozzuk meg a maradékot 10 hatványainak valamely adott számmal való osztásaiban. Pl.: 10 ≡ −1
40
(mod 11),
7. ábra. Egész számok geometriai ábrázolása modulo 6 mivel 10 = −1 + 11. Szorozva ezt a kongruenciát egymás után önmagával: 102 ≡ (−1)(−1) = 1 (mod 11), 103 ≡ −1
(mod 11),
104 ≡ 1
(mod 11) stb.
Kimutathatjuk ennek alapján, hogy a tízes számrendszerben kifejezett bármely z = a0 + a1 · 10 + a2 · 102 + . . . + an · 10n egész szám 11-gyel osztva ugyanazt a maradékot adja, mint váltakozó előjellel vett számjegyeinek összege: t = a0 − a1 + a2 − a 3 + . . . . Ugyanis z − t = a1 · 11 + a2 (102 − 1) + a3 (103 + 1) + a4 (104 − 1) + . . . .
41
Mivel pedig a 11, 102 − 1, 103 + 1, . . . számok mind kongruensek 0-val modulo 11, kongruens z − t is, és így z-t osztva 11-gyel ugyanazt a maradékot kapjuk, mint ha t-t osztjuk 11-gyel. Következésképpen valamely szám akkor és csakis akkor osztható 11-gyel (azaz akkor lesz a maradék 0), ha a számjegyeinek váltakozó előjellel vett összege osztható 11-gyel. Pl. mivel 3 − 1 + 6 − 2 + 8 − 1 + 9 = 22, a z = 3 162 819 szám osztható 11-gyel. Még könnyebb a 3-mal vagy 9-cel való oszthatóság szabályát megtalálni, mivel 10 ≡ 1 (mod 3 vagy 9), tehát 10n ≡ 1 (mod 3 vagy 9) bármilyen egész szám is n. Következésképpen z szám akkor és csak akkor osztható 3-mal vagy 9-cel, ha számjegyeinek s = a0 + a1 + a 2 + a3 + . . . + an összege osztható 3-mal, illetve 9-cel. Modulo 7 vett kongruenciák esetében 10 ≡ 3, 102 ≡ 2, 103 ≡ −1, 104 ≡ −3, 105 ≡ −2, 106 ≡ 1. A további maradékok azután ismétlődnek. Tehát z akkor és csak akkor osztható 7-tel, ha az r = a0 + 3a1 + 2a2 − a3 − 3a4 − 2a5 + a6 + 3a7 + . . . kifejezés osztható 7-tel. Feladat: Keressünk hasonló szabályt a 13-mal való oszthatóságra.
Tekintsünk rögzített modulusú kongruenciákat, legyen pl. d = 5. Ebben az esetben a kongruenciák összeadásánál és szorzásánál mindig elkerülhetjük a nagy számokat, ha valamely a számot egy vele kongruens számmal helyettesítjük a 0, 1, 2, 3, 4 számok közül. Így a modulo 5 vett egész számok összegeinek és szorzatainak a kiszámítására csupán az alábbi összeadó- és szorzótáblára van szükség. A második táblából látszik, hogy valamely ab szorzat akkor és csak akkor kongruens 0-val (mod 5), ha vagy a vagy b ≡ 0 (mod 5). Ez a tény az alábbi általános szabályra
42
a·b
a+b b≡0 a≡0 0 1 1 2 2 3 3 4 4
1 1 2 3 4 0
2 2 3 4 0 1
3 3 4 0 1 2
b≡0 a≡0 0 1 0 2 0 3 0 4 0
4 4 0 1 2 3
1 0 1 2 3 4
2 0 2 4 1 3
3 0 3 1 4 2
4 0 4 3 2 1
utal: 7) ab ≡ 0 (mod d) akkor és csak akkor, ha vagy a ≡ 0 vagy b ≡ 0 (mod d). Ez a szabály általánosítása az egész számokra érvényes ama szabálynak, hogy ab = 0 akkor és csak akkor igaz, ha vagy a = 0 vagy b = 0. A 7) szabály akkor és csak akkor igaz, ha d modulus prímszám. Ugyanis az ab ≡ 0 (mod d) kongruencia annyit jelent, hogy d osztója ab-nek, és láttuk, hogy d prímszám akkor és csak akkor osztója ab szorzatnak, ha osztója a-nak vagy b-nek: azaz ha a ≡ 0 (mod d),
vagy
b ≡ 0 (mod d).
Ha d nem prímszám, a szabály nem szükségképpen érvényes, legyen pl. d = r · s, ahol r és s kisebbek, mint d úgy, hogy r 6≡ 0
(mod d),
s 6≡ 0 (mod d),
rs = d ≡ 0
(mod d).
de
Pl. 2 6≡ 0 (mod 6) és 3 6≡ 0 (mod 6), de 2 · 3 = 6 ≡ 0 (mod 6). Gyakorlat: Mutassuk ki, hogy prím modulusú kongruenciákra érvényes az alábbi egyszerűsítési szabály: Ha ab ≡ ac és a 6≡ 0, akkor b ≡ c. Gyakorlatok:
43
1) Melyik 0 és 6 közötti számmal (ezt a kettőt is beleértve) kongruens a 11 · 18 · 2322 · 13 · 19 szorzat modulo 7? 2) Melyik 0 és 12 közötti számmal (0-t és 12-t is beleértve) kongruens a 3·7·11·17·19·23·29·113 szorzat modulo 13? 3) Melyik 0 és 4 közötti számmal (0-t és 4-et is beleértve) kongruens modulo 5 az 1 + 2 + 22 + . . . + 219 összeg?
2. A kis Fermat-tétel A modern számelmélet megalapítója, Fermat, aki a XVII. században élt, a következő igen fontos tételt fedezte fel: Ha egy tetszőleges p prímszám nem osztója az a egész számnak, akkor ap−1 ≡ 1
(mod p).
Ez a tétel azt állítja, hogy az a szám (p − 1)-edik hatványát p-vel osztva a maradék 1. Fenti számításaink egynémelyike megerősíti ezt a tételt; pl. azt találtuk, hogy 106 ≡ 1 (mod 7), 102 ≡ 1 (mod 3) és 1010 ≡ 1 (mod 11). Hasonlóképpen kimutathatjuk, hogy 212 ≡ 1 (mod 13) és 510 ≡ 1 (mod 11). Az utóbbi két kongruencia ellenőrzésére nem szükséges ténylegesen kiszámítanunk a bennük szereplő magas hatványokat, mivel a kongruenciák multiplikatív tulajdonságát figyelembevéve: 24 ≡ 16 ≡ 3
(mod 13),
28 ≡ 9 ≡ −4
(mod 13),
212 ≡ −4 · 3 = −12 ≡ 1
(mod 13),
illetve 52 ≡ 3
(mod 11),
54 ≡ 9 ≡ −2
(mod 11),
58 ≡ 4
(mod 11),
510 ≡ 3 · 4 = 12 ≡ 1
44
(mod 11).
Fermat tételének bizonyítására tekintsük a többszöröseit: m1 = a, m2 = 2a, m3 = 3a, . . . , mp−1 = (p − 1)a. Ezen egész számok között nem lehet kettő kongruens modulo p, mivel akkor lenne olyan egész szám pár r, s 1 5 r < s 5 (p − 1), amelyre ms − mr = (s − r)a prímtényezője lenne p, márpedig 7) szabály szerint ez nem lehetséges; ugyanis mivel s − r kisebb, mint p, p nem lehet s − r osztója, és feltevésünk szerint p nem prímosztója a-nak sem. Hasonlóképpen, az m számok egyike sem lehet kongruens 0-val. Tehát az m1 , m2 , . . . , mp−1 számok mindegyike kongruens kell legyen az 1, 2, 3, . . ., p − 1 számok közül eggyel-eggyel. Következésképpen m1 m2 . . . mp−1 = 1 · 2 · 3 · . . . (p − 1)ap−1 ≡ 1 · 2 · 3 · . . . (p − 1)
(mod p),
vagy, bevezetve 1 · 2 · 3 · . . . (p − 1)-re a K rövidítést, K(ap−1 − 1) ≡ 0 (mod p). De K nem osztható p-vel, mivel egyetlen tényezője sem osztható p-vel; tehát a 7) szabály szerint (ap−1 − 1)-nek kell oszthatónak lenni p-vel, azaz ap−1 − 1 ≡ 0
(mod p).
Ez éppen Fermat tétele. Ellenőrizzük a tételt még egyszer. Legyen p = 23 és a = 5. Akkor, mindig modulo 23, 52 ≡ 2, 54 ≡ 4, 58 ≡ 16 ≡ −7, 516 ≡ 49 ≡ 3, 520 ≡ 12, 522 ≡ 24 ≡ 1. Ha a nem 5, hanem 4, megint csak modulo 23, 42 ≡ −7, 43 ≡ −28 ≡ −5, 44 ≡ −20 ≡ 3, 48 ≡ 9, 411 ≡ −45 ≡ −1, 422 ≡ 1. A fenti a = 4, p = 23 példában és a többi példákban is megfigyelhetjük, hogy a-nak nem csak a (p − 1)-edik hatványa, alacsonyabb hatványai is kongruensek lehetnek 1-gyel. Mindig áll, hogy a legkisebb ezen hatványkitevők közül – pl. az utolsó példában 11 – osztója (p − 1)-nek. (L. alább a 3) feladatot.) Feladatok:
45
1) Mutassuk ki hasonló számítással, hogy 28 ≡ 1 (mod 17); 38 ≡ −1 (mod 17); 314 ≡ −1 (mod 29); 214 ≡ −1 (mod 29); 414 ≡ 1 (mod 29); 514 ≡ 1 (mod 29). 2) Ellenőrizzük Fermat tételét p = 5, 7, 11, 17 és 23 esetére, különböző a értékekkel. 3) Bizonyítsuk be a következő általános tételt: Az ae ≡ 1 (mod p) kongruenciát kielégítő legkisebb e pozitív egész szám osztója (p − 1)-nek. (Elosztva (p − 1)-et e-vel, az eredmény p − 1 = ke + r, ahol 0 5 r < e, továbbá használjuk fel azt a tényt, hogy ap−1 ≡ ae ≡ 1 (mod p).)
3. Kvadratikus maradékok Az előző pontban Fermat tételére felhozott példákban azt látjuk, hogy nem csupán az ap−1 ≡ 1 (mod p) kongruencia igaz minden a egész számra, hanem egyes a értékekre (ha 0
p 2-től különböző prímszám, s így páratlan és p = 2p 0 + 1 alakú) áll az ap = a(p−1)/2 ≡ 1 (mod p) kongruencia is. Ez a tény érdekes vizsgálatokra ösztönöz. A Fermat-tételt a következő formában írhatjuk fel: 0
0
0
ap−1 − 1 ≡ a2p − 1 = (ap − 1)(ap + 1) ≡ 0
(mod p).
Mivel valamely szorzat csak akkor osztható p-vel, ha tényezőinek egyike p-vel osztható, 0
0
azonnal látjuk, hogy vagy ap − 1 vagy ap + 1 osztható p-vel, úgyhogy bármely p > 2 prímszámra és bármely p-vel nem osztható a egész számra vagy az a(p−1)/2 ≡ 1 (mod p), vagy az a(p−1)/2 ≡ −1 (mod p) kongruencia érvényes. Amióta csak foglalkoznak modern számelmélettel, azóta érdekli a matematikusokat, melyek azok az a számok, amelyekre az első, s melyek, amelyekre a második eset érvényes. Tételezzük fel, hogy a kongruens valamely x szám négyzetével modulo p: a ≡ x2
46
(mod p).
Ekkor a(p−1)/2 ≡ xp−1 , ami Fermat tétele szerint kongruens 1-gyel modulo p. Olyan a számot amely nem többszöröse p-nek és kongruens valamely szám négyzetével modulo p, p kvadratikus maradék ának nevezünk, olyan b számot pedig, amelyik nem többszöröse p-nek, és nem kongruens egyetlen szám négyzetével sem, p kvadratikus nem-maradék ának nevezünk. Éppen most láttuk, hogy p minden a kvadratikus maradéka eleget tesz az a(p−1)/2 ≡ 1 (mod p) kongruenciának. Nagyobb nehézség nélkül bebizonyítható, hogy minden b nem-maradék pedig a b(p−1)/2 ≡ −1 (mod p) kongruenciának tesz eleget. Alább kimutatjuk, hogy 1, 2, 3, . . ., p − 1 számok között pontosan (p − 1)/2 kvadratikus maradék és (p − 1)/2 kvadratikus nem-maradék van. Bár sok tapasztalati adatot sikerült összegyűjteni a kvadratikus maradékok és nemmaradékok eloszlására vonatkozóan, de ezt megszabó általános törvényt nem volt könnyű találni. Az első ide vonatkozó lényeges megfigyelés Legendre-tól (1752–1833) származik, később ezt Gauss a kvadratikus reciprocitás törvényének nevezte el. A törvény két, p és q prímszám viselkedésével foglalkozik, és azt mondja ki, hogy q akkor és csak akkor kvadratikus maradéka p-nek, ha p kvadratikus maradéka q-nak, feltéve, hogy a
p−1 2
· q−1 2
szorzat páros. Ha ez a szorzat páratlan, akkor viszont p akkor és csak akkor kvadratikus maradéka q-nak, ha q kvadratikus nem-maradéka p-nek. Az ifjú Gauss egyik első nagy teljesítménye éppen ennek a figyelemre méltó, a matematikusok próbálkozásának régóta ellenálló tételnek a legkorábbi szigorú bizonyítása volt. Gauss első bizonyítása nagyon bonyolult, s még ma sem könnyű egyszerű módon levezetni a reciprocitás törvényét, bár nagyon sok különféle bizonyítását közölték azóta. A tétel igazi jelentősége csak újabban derült ki, az algebrai számelmélet modern fejlődésével kapcsolatban. Legyen a kvadratikus maradékok eloszlásának az illusztrálására például p = 7. Ekkor, mivel 0 ≡ 0, 12 ≡ 1, 22 ≡ 4, 32 ≡ 2, 42 ≡ 2, 52 ≡ 4, 62 ≡ 1 mind modulus 7 szerint, és mivel a 6-nál nagyobb számok négyzeteivel ugyanez a sorozat ismétlődik, 7 kvadratikus maradékai az 1, 2 vagy 4-gyel kongruens számok, nemmaradékai pedig a 3, 5 vagy 6-tal kongruens számok. Általánosságban, p kvadratikus maradékai az 12 -nel, 22 -nel, . . ., (p − 1)2 -nel kongruens számok. Azonban ezek páronként kongruensek, mivel x2 ≡ (p − x)2
(mod p),
47
(pl. 22 ≡ 52 (mod 7)), ugyanis (p − x)2 = p2 − 2px + x2 ≡ x2 (mod p). Tehát az 1, 2, . . ., p − 1 számok fele p kvadratikus maradéka, fele kvadratikus nem-maradéka. Legyen a kvadratikus reciprocitás törvényének az illusztrálására p = 5, q = 11. Mivel 11 ≡ 12 (mod 5), 11 kvadratikus maradék (mod 5); mivel az ((5 − 1)/2) · ((11 − 1)/2) szorzat páros, a reciprocitás törvénye szerint 5 is kvadratikus maradék (mod 11). Ezt azzal a megállapítással igazoljuk, hogy 5 ≡ 42 (mod 11). Másrészről, ha p = 7, q = 11, akkor ((7 − 1)/2) · ((11 − 1)/2) szorzat páratlan, s valóban a maradék 11 (mod 7), ugyanis 11 ≡ 22 (mod 7), míg 7 nem-maradék (mod 11). Feladatok: 1) 62 = 36 ≡ 13 (mod 23). 23 kvadratikus maradék (mod 13)? 2) Láttuk, hogy x2 ≡ (p − x)2 (mod p). Mutassuk ki, hogy ezek az egyedüli kongruenciák 12 , 22 , 32 , . . ., (p − 1)2 számok között.
3. § Püthagoraszi számok és Fermat elveszett tétele (a „nagy Fermat-tétel”) A számelmélet érdekes problémája fűződik Püthagorasz tételéhez. A görögök tudták, hogy egy olyan háromszög, amelynek oldalai 3, 4 és 5, derékszögű háromszög. Ennek analógiájára kérdezhetjük, általánosságban milyen derékszögű háromszögek oldalai adhatók még meg valamely hosszegység egész szamú többszöröseként? Püthagorasz tételének algebrai alakja a2 + b2 = c2 ,
(1)
ahol a és b a derékszögű háromszög befogóinak, c az átfogójának a hosszúsága. Így a valamennyi egész számmal megadható oldalhosszúságú derékszögű háromszög megtalálásának problémája ekvivalens (1) egyenlet összes egész a, b és c-re adható megoldásának megkeresésével. Minden egész számokból álló számhármast, ami kielégíti (1) egyenletet, püthagoraszi számhármasnak nevezünk. A püthagoraszi számhármasok könnyen megtalálhatók. Legyen adva (a, b, c) püthagoraszi számhármas, tehát a2 + b2 = c2 . Alkalmazzunk rövidítés kedvéért a/c = x, b/c = y jelöléseket. x és y racionális számok, amelyekre áll az x2 + y2 = 1 egyenlet. Tehát y2 = (1 − x)(1 + x) vagy y/(1 + x) = (1 − x)/y. Ezen egyenlet két oldalának közös
48
értékét t-vel jelölve, ahol t kifejezhető két egész szám u/v hányadosaként, y = t(1 + x) és (1 − x) = ty írható, tehát tx − y = −t, Ebből a két egyenletből x=
1 − t2 , 1 + t2
x + ty = 1.
y=
2t . 1 + t2
Behelyettesítve x, y és t értékét: a v2 − u 2 = 2 , c u + v2
2uv b = 2 . c u + v2
Tehát a = (v2 − u2 )r,
(2)
b = (2uv)r, c = (u2 + v2 )r, valamely r arányossági tényezőre. Ebből az eredményből láthatjuk, hogy ha (a, b, c) püthagoraszi számhármas, a arányos (v2 −u2 )-nel, b arányos 2uv-vel és c arányos (u2 +v2 )nel. Könnyű kimutatni a megfordítottját is, ti. hogy bármely (a, b, c) számhármas, amit a (2) egyenletek definiálnak, püthagoraszi számhármas, ugyanis (2)-ből a2 = (u4 − 2u2 v2 + v4 )r2 , b2 = (4u2 v2 )r2 , c2 = (u4 + 2u2 v2 + v4 )r2 , tehát a2 + b2 = c2 . Eredményünk némileg egyszerűsíthető. Bármely (a, b, c) püthagoraszi számhármasból végtelen sok további (sa, sb, sc) püthagoraszi számhármas képezhető, bármely s pozitív egész számmal. Pl. (3, 4, 5)-ből (6, 8, 10), (9, 12, 15) stb. Ilyen számhármasok nem lényegesen különbözőek, hiszen hasonló derékszögű háromszögeknek felelnek meg. Azért primitívként definiáljuk az olyan számhármasokat, amelyekben a, b és c számoknak
49
nincs közös osztójuk. Ennek a definíciónak az alapján ki lehet mutatni, hogy az összes püthagoraszi számhármas megkapható az a = v2 − u2 , b = 2uv, c = u 2 + v2 formulákból, ahol u és v relatív prímek, v > u, és nem lehet mind a kettő páratlan, egyébként tetszőlegesek. *Feladat: bizonyítsuk be az utóbbi állítást.
Primitív püthagoraszi számhármasok pl. u = 1, v = 2: (3, 4, 5), u = 2, v = 3: (5, 12, 13), u = 3, v = 4: (7, 24, 25), . . ., u = 7, v = 10: (51, 140, 149) stb. Ez után a püthagoraszi számhármasokra vonatkozó eredmény után természetesen kérdezhetnénk, vajon találhatók-e olyan a, b, c egész számok, amelyek az a3 + b3 = c3 , vagy a4 + b4 = c4 , vagy általában bármely 2-nél nagyobb pozitív n kitevővel felírt an + bn = cn
(3)
egyenletnek eleget tesznek. A kérdésre Fermat válaszolt, híressé vált módon. Fermat, a számelmélet antik nagymestere, Diophantosz könyvének tanulmányozása közben a mű margóját jegyzetekkel írta tele. Sok tételt jegyzett le ily módon, a bizonyítás közlése nélkül. Ezeket a tételeket később, egyetlen fontos tétel kivételével, mind igazolták. A püthagoraszi számokat kommentálva, Fermat megjegyezte, hogy (3) egyenlet nem oldható meg 2-nél nagyobb egész kitevők esetében. De a tételre adott elegáns bizonyítás szerencsétlenségünkre túl hosszú volt ahhoz, hogy leírhatta volna a margóra. Azóta sem sikerült bebizonyítani, igaz-e vagy hamis Fermat elveszett tétele, pedig a legnagyobb matematikusok próbálkoztak vele. Nagyon sok n értékre bebizonyították a tételt, többek között pl. minden 619-nél kisebb n-re, de nem minden n-re, bár ellenpéldát sem sikerült soha találni. A tétel önmagában véve nem túlságosan jelentős, de a bizonyítására irányuló próbálkozások nagyon sok fontos számelméleti eredményre vezettek. A probléma nem-matematikus körökben is sokfelé érdeklődest keltett, részben
50
amiatt, mert a megoldó számára 100 000 márkás jutalom volt letétbe helyezve a Göttingai Királyi Akadémián. Amíg az első világháborút követő németországi infláció semmivé nem tette ennek a jutalomnak az értékét, minden évben nagyszámú helytelen „megoldást” küldtek be a jutalom gondnokainak. Még komoly matematikusok is becsapták néha önmagukat, s bizonyítást küldtek be vagy közöltek, „bizonyítást”, ami néhány felületes hiba felfedezése után nyomban összeomlott. A márka devalvációja óta alábbhagyott a tétel iránti nagy érdeklődés, bár időről időre olvasható a napisajtóban, hogy a problémát megoldotta valahol egy addig ismeretlen lángelme.
4. § Euklidészi algoritmus 1. Általános elmélet Mindenki tudja, hogyan kell egy a egész számot egy másik b egész számmal osztani, és tudja, hogy a művelet addig folytatható, amíg a maradék kisebb nem lesz, mint az osztó. Pl. ha a = 648 és b = 7, a hányados q = 92 és a maradék r = 4. 648 : 7 = 92
648 = 7 · 92 + 4
18 4 Kimondhatjuk általános tételként, hogy ha a és b 0-nál nagyobb egész számok, akkor mindig található olyan q egész szám, amely eleget tesz az a=b·q+r
(1)
egyenlőségnek, ahol r egész szám, amely a 0 5 r < b egyenlőtlenségnek tesz eleget. Az állítás bizonyítására, az osztási művelet felhasználása nélkül, csupán azt kell tekinteni, hogy minden a egész szám vagy maga is többszöröse b-nek, a = b · q,
51
vagy b két egymás után következő többszöröse között van, bq < a < b(q + 1) = bq + b. Az első esetben áll az (1) egyenlet r = 0 mellett. A második esetben a fenti két egyenlőtlenség elsőjéből a − bq = r > 0, a másodikból pedig a − bq = r < b, úgyhogy 0 < r < b, amint azt (1) megköveteli.
Ebből az egyszerű tényből sokféle fontos következményt fogunk levezetni, például két egész szám legnagyobb közös osztójának a megkeresésére szolgáló módszert. Legyen a és b két tetszőleges egész szám, és ne legyen mind a kettő egyszerre 0. Tekintsük az összes olyan pozitív egész számok halmazát, amelyek a-nak és b-nek egyaránt osztói. Ez a halmaz bizonyosan véges, mivel pl. ha a 6= 0, nem lehet a abszolút értékénél nagyobb egész szám az osztója, a-nak tehát csak véges számú osztója van, s ugyanez áll b-re. Tehát a-nak és b-nek csupán véges számú közös osztója lehet, jelöljük d-vel ezek között a legnagyobbat. A d egész számot a és b legnagyobb közös osztójának nevezzük és d = (a, b)-veljelöljük. Így pl. ha a = 8 és b = 12, próbálgatással azt találjuk, hogy (8, 12) = 4, míg a = 5 és b = 9 esetében, hogy (5, 9) = 1. Ha a és b nagy számok, mondjuk a = 1804 és b = 328, (a, b) közvetlen kipróbálással való megkeresése nagyon fáradságos lenne. Rövid és biztos módszer ekkor is az euklidészi algoritmus. (Algoritmusnak nevezünk általában valamilyen rendszeres számolási módszert.) Azon a tényen alapul, hogy minden a=b·q+r
(2)
alakú összefüggésből következik, hogy (a, b) = (b, r). Minden olyan u szám ugyanis, amelyik egyaránt osztja a-t és b-t: a = su,
52
b = tu,
(3)
egyben r-nek is osztója, mivel r = a − bq = su − qtu = (s − qt)u; és megfordítva, minden v szám, amelyik osztja b-t és r-et, b = s 0 v,
r = t 0 v,
osztója a-nak is, mivel a = bq + r = s 0 vq + t 0 v = (s 0 q + t 0 )v. Tehát a és b minden közös osztója közös osztója b-nek és r-nek is, és megfordítva. Így mivel a és b összes közös osztójának a halmaza azonos b és r közös osztóinak a halmazával, a és b legnagyobb közös osztójának azonosnak kell lenni b és r legnagyobb közös osztójával, ami bizonyítja (3)-at. Az összefüggés hasznát azonnal látjuk. Térjünk vissza 1804 és 328 legnagyobb közös osztójának a megkeresésére. Elvégezve közönséges módon az osztást 1804 : 328 = 5, a maradék 164, 164 azt találjuk, hogy 1804 = 5 · 328 + 164. Tehát (3) szerint (1804, 328) = (328, 164). Figyeljük meg hogy (1804, 328) megkeresését kisebb számokéval helyettesítettük. Az eljárás folytatható. Mivel 328 : 164 = 2, vagyis 328 = 2 · 164 + 0, úgyhogy (328, 164) = (164, 0) = 164. Tehát (1804, 328) = (328, 164) = (164, 0) = 164, ami a kívánt eredmény. Ez a módszer két szám legnagyobb közös osztójának a megtalálására Euklidész Elemei ben geometriai alakban van megadva. Aritmetikai formában két tetszőleges a és b egész számra, amelyek közül nem mind a kettő 0, a következőképpen irható le.
53
Feltételezhetjük, hogy b 6= 0, mivel (a, 0) = a. Egymás utáni osztásokkal haladunk a = bq1 + r1
(0 < r1 < b)
b = r1 q2 + r2
(0 < r2 < r1 )
r1 = r2 q3 + r3
(0 < r3 < r2 )
r2 = r3 q4 + r4
(0 < r4 < r3 )
(4)
egészen addig, amíg az r1 , r2 , r3 , . . . maradékok nem 0-k. A jobb oldalon álló egyenlőtlenségeket megfigyelve látjuk, hogy az egymás utáni maradékok a pozitív számok állandóan csökkenő sorozatát képezik: b > r1 > r2 > r3 > r4 > . . . > 0.
(5)
Tehát legfeljebb b lépés után (gyakran sokkal hamarabb, mivel két egymás után következő r különbsége rendszerint nagyobb, mint 1) meg kell jelenni a 0 maradéknak: rn−2 = rn−1 qn + rn rn−1 = rn qn+1 + 0. Ha ez bekövetkezett, tudjuk, hogy (a, b) = rn ; másként kifejezve, (a, b) az utolsó pozitív maradék (5) sorozatban. Következik ez (3) egyenlőség (4) egyenletekre való egymás utáni alkalmazásából, mivel (4) egymás után következő soraiból (a, b) = (b, r1 );
(b, r1 ) = (r1 , r2 );
(r1 , r2 ) = (r2 , r3 );
(r2 , r3 ) = (r3 , r4 ), . . . , (rn−1 , rn ) = (rn , 0) = rn . Feladat: Keressük meg euklidészi algoritmussal a) 187 és 77; b) 105 és 385; c) 245 és 193 számok legnagyobb közös osztóját.
54
(a, b) igen fontos tulajdonsága vezethető le a (4) egyenletből. Ha d = (a, b), akkor lehet olyan pozitív vagy negatív k és l egész számokat találni, amelyek a (6)
d = ka + lb egyenletnek tesznek eleget.
Tekintsük ennek a kimutatására az egymás utáni maradékok (5) sorozatát, (4) első egyenletéből r1 = a − q1 b úgyhogy r1 felírható k1 a + l1 b alakban is (ebben az esetben k1 = 1, l1 = −q1 ). A következő egyenletből r2 = b − q2 r1 = b − q2 (k1 a + l1 b) = (−q2 k1 )a + (1 − q2 l1 )b = k2 a + l2 b. Ez a folyamat nyilvánvalóan ismételhető az egymás után következő r3 , r4 , . . . maradékokon keresztül, amíg az rn = ka + lb előállításhoz jutunk, ami bizonyítandó volt. Tekintsük példaként a (61, 24) megkeresésére szolgáló euklidészi algoritmust. A legnagyobb közös osztó 1, és az 1 kívánt előállítása az alábbi egyenletekből számítható ki: 61 = 2 · 24 + 13,
24 = 1 · 13 + 11,
11 = 5 · 2 + 1,
13 = 1 · 11 + 2,
2 = 2 · 1 + 0.
Az első egyenletből 13 = 61 − 2 · 24, a másodikból 11 = 24 − 13 = 24 − (61 − 2 · 24) = −61 + 3 · 24,
55
a harmadikból 2 = 13 − 11 = (61 − 2 · 24) − (−61 + 3 · 24) = 2 · 61 − 5 · 24, és a negyedikből 1 = 11 − 5 · 2 = (−61 + 3 · 24) − 5(2 · 61 − 5 · 24) = −11 · 61 + 28 · 24. 2. Az aritmetika alaptételének alkalmazása Azt a tényt, hogy d = (a, b) mindig előállítható d = ka+lb alakban, felhasználhatjuk az aritmetika alaptételének a 28. oldalon adott bizonyításától független igazolására. Először a 29. oldalon közölt korolláriumot bizonyítjuk be mint segédtételt, azután levezetjük ebből a lemmából az alaptételt, megfordítva így a bizonyítás előbbi sorrendjét. Lemma: Ha egy p prímszám osztója egy ab szorzatnak, akkor p valamelyik tényezőnek is osztója kell legyen. Ha p prímszám nem osztója a egész számnak, akkor (a, p) = 1, mivel p egyedüli osztói p és 1. Találhatók tehát olyan k és l egész számok, amelyek eleget tesznek az 1 = ka + lp egyenletnek. Szorozzuk az egyenlet mindkét oldalát b-vel: b = kab + lpb. Mármost ha p osztója ab-nek ab = pr, tehát b = kpr + lpb = p(kr + lb), amiből látjuk, hogy p osztója b-nek. Így kimutattuk, hogy ha p osztója ab-nek, de nem osztója a-nak, akkor osztója kell legyen b-nek, úgyhogy p mindenképpen osztója kell legyen a és b közül valamelyiknek, ha osztója ab-nek. A kettőnél több egész szám szorzatára való kiterjesztés azonnal adódik. Pl. ha p
56
osztója abc szorzatnak, akkor a lemma kétszeri alkalmazásával kimutathatjuk, hogy p az a, b, c egészek valamelyikének osztója kell legyen. Mert ha p nem osztója sem a-nak, sem b-nek, sem c-nek, akkor nem lehet osztója ab-nek, tehát nem lehet osztója (ab)c = abc szorzatnak sem. Feladat: Az érvelés tetszőleges n tényezőjű szorzatokra való kiterjesztése a matematikai indukció elvének explicit vagy implicit alkalmazását követeli meg. Végezzük el ezt a bizonyítást.
Ebből az eredményből azonnal következik az aritmetika alaptétele. Tételezzük fel, hogy adva lenne egy N egész szám bármilyen két prímfelbontása: N = p1 p2 . . . pr = q1 q2 . . . qs . Mivel p1 osztja az egyenlet bal oldalát, osztania kell a jobb oldalát is, tehát, az előbbi feladat szerint, osztania kell a q-tényezők valamelyikét, pl. qk -t. Azonban qk prímszám, s így p1 szükségképpen egyenlő kell legyen ezzel a qk -val. Egyszerűsítve ezzel a tényezővel, következik, hogy p2 osztója kell legyen a megmaradó q tényezők közül valamelyiknek, pl. qt -nek, és így egyenlő kell legyen vele. Töröljük tehát p2 -t és qt -t, és hasonlóan járunk el p3 , . . ., pr esetében. A végén mindegyik p-vel egyszerűsítettünk, úgyhogy a baloldalon 1 maradt. De akkor a jobb oldalon sem maradhatott egyetlen q sem, mivel a q-tényezők mind nagyobbak voltak mint 1. Tehát a p-k és a q-k páronként egyenlőek, s a két prímfelbontás, a tényezők sorrendjétől eltekintve, azonos egymással. 3. Az Euler-féle ϕ-függvény. Újból a kis Fermat-tétel Két a és b egész számot akkor mondunk relatív prímnek, ha legnagyobb közös osztójuk 1: (a, b) = 1. Pl. 24 és 35 relatív prímek, 12 és 18 nem azok. Ha a és b relatív prímek, akkor alkalmasan választott k és l pozitív vagy negatív egész számokkal felírható a ka + lb = 1
57
egyenlet. Következik ez (a, b) 55. oldalon megadott tulajdonságából. Feladat: Bizonyítsuk be a következő tételt: Ha egy r egész szám osztója egy ab szorzatnak, és relatív prím a tényezőhöz, akkor r-nek osztania kell b tényezőt. (Útmutatás: ha r relatív prím a-hoz, akkor lehet olyan k és l egész számokat találni, amelyek eleget tesznek a kr + la = 1 egyenletnek. Szorozzunk mind a két oldalon b-vel.) Ez a tétel speciális esetként foglalja magába a 56. oldalon ismertetett lemmát, mivel egy p prímszám akkor és csak akkor relatív prím egy a egész számhoz, ha nem osztója a-nak.
Jelentse ϕ(n) bármely n pozitív egész számra az egész számok 1-től n-ig terjedő sorozatában az n-hez relatív prímszámoknak a számát. ϕ(n)-függvény, amit Euler vezetett be először, egyik igen fontos ún. „számelméleti függvény”. ϕ(n) értékei kis n esetében könnyen kiszámíthatók: ϕ(1) = 1
mivel
1-hez 1 relatív prím,
ϕ(2) = 1
mivel
2-höz 1 relatív prím,
ϕ(3) = 2
mivel
3-hoz 1 és 2 relatív prímek,
ϕ(4) = 2
mivel
4-hez 1 és 3 relatív prímek,
ϕ(5) = 4
mivel
5-höz 1, 2, 3, 4 relatív prímek,
ϕ(6) = 2
mivel
6-hoz 1, 5 relatív prímek,
ϕ(7) = 6
mivel
7-hez 1, 2, 3, 4, 5, 6 relatív prímek,
ϕ(8) = 4
mivel
8-hoz 1, 3, 5, 7 relatív prímek,
ϕ(9) = 6
mivel
9-hez 1, 2, 4, 5, 7, 8 relatív prímek,
ϕ(10) = 4
mivel
10-hez 1, 3, 7, 9 relatív prímek
stb. Megállapíthatjuk, hogy ha p prímszám, ϕ(p) = p − 1, mivel prímszámnak önmagán és 1-en kívül nincs más osztója, s így az 1, 2, 3, . . ., p − 1 egész számok mindegyikéhez
58
relatív prím. Ha n olyan összetett szám, amelynek prímfelbontása n = pα1 1 pα2 2 . . . pαr r , ahol a p-k egymástól különböző prímszámokat jelölnek valamilyen hatványon, akkor 1 1 1 ϕ(n) = n 1 − · 1− ... 1 − . p1 p2 pr Pl., mivel 12 = 22 · 3,
1 ϕ(12) = 12 1 − 2
1 1 2 · 1− = 12 = 4, 3 2 3
amint annak lenni is kell valóban. A bizonyítás elemi, de itt nem közöljük. Feladat: Általánosítsuk az 44. oldalon megadott kis Fermat-tételt az Euler-féle ϕ-függvény segítségével. Az általános tétel így szól: Ha n tetszőleges egész szám, és a relatív prím n-hez, akkor aϕ(n) ≡ 1
(mod n).
4. Lánctörtek. Diophantoszi egyenletek Két egész szám legnagyobb közös osztójának megkeresésére szolgáló euklidészi algoritmus közvetlenül felhasználható két egész szám hányadosának összetett törtként való előállítására. Pl. 840 és 611 számokra alkalmazva az euklidészi algoritmust, az alábbi egyenletsorozatot kapjuk, 840 = 1 · 611 + 229,
611 = 2 · 229 + 153,
229 = 1 · 153 + 76,
153 = 2 · 76 + 1,
amiből mellékesen látjuk, hogy (840, 611) = 1. Ezekből az egyenletekből az alábbi
59
kifejezéseket vezethetjük le: 1 840 229 =1+ =1+ 611 611 611 229 611 153 1 =2+ =2+ 229 229 229 153 229 76 1 =1+ =1+ 153 153 153 76 153 1 =2+ . 76 76 Összekapcsolva ezeket az egyenleteket, a 840/611 racionális számot a következő kifejtett alakban kapjuk meg: 1
840 =1+ 611
1 2+ 1 1+ 1 2+
76
Általában, egy 1
(7)
a = a0 + 1 a1 + 1 a2 + ..
.+
1 an
alakú kifejezést, ahol az a-k pozitív egész számok, lánctört nek nevezünk. Az euklidészi algoritmus lehetővé teszi bármely racionális szám ilyen alakban való kifejezését.
60
Feladat: Fejtsük lánctörtbe az alábbi törteket: 2 ; 5
43 ; 30
169 70
* A lánctörtek nagyon fontosak a magasabb aritmetika diophantoszi analízis néven ismert ágában. Diophantoszi egyenlet nek olyan egy vagy több ismeretlenű, egész együtthatójú algebrai egyenletet nevezünk, amelynek keressük egész megoldásait. Lehet egy ilyen egyenletnek véges sok megoldása, lehet végtelen sok, de lehet, hogy nincs egyetlenegy sem. Legegyszerűbb eset a kétismeretlenű lineáris diophantoszi egyenlet: ax + by = c,
(8)
ahol a, b, c adott egész számok és egész x, y számokat keresünk megoldásként. Egy ilyen egyenlet teljes megoldása az euklidészi algoritmus segítségével történhet. Elöször is keressük meg az euklidészi algoritmussal d = (a, b) legnagyobb közös osztót; s akkor k és l egész számok megfelelő választásával ak + bl = d.
(9)
Tehát x = k, y = l (8) egyenlet egy partikuláris megoldása c = d esetben. Általánosabban, ha c=d·q szerint bármely többszöröse d-nek, (9)-ből a(kq) + b(lq) = dq = c, tehát x = x∗ = kq, y = y∗ = lq egy partikuláris megoldása (8)-nak. Megfordítva, ha x, y egy adott c-re megoldása (8)-nak, akkor c többszöröse kell legyen d = (a, b)-nek, mivel d a-nak is, b-nek is osztója, és ezért osztania kell c-t. Bebizonyítottuk tehát, hogy (8) egyenletnek akkor és csak akkor van megoldása, ha c többszöröse (a, b)-nek. Határozzuk meg most (8) többi megoldását. Ha x = x 0 , y = y 0 a fentebb az euklidészi algoritmussal kiszámított x∗ és y∗ -tól különböző megoldások, akkor nyilván x = x 0 − x∗ , y = y 0 − y∗ megoldása kell, hogy legyen az ax + by = 0
(10)
61
„homogén” egyenletnek. Ugyanis ha ax 0 + by 0 = c
és
ax∗ + by∗ = c,
akkor a második egyenletet kivonva az elsőből a(x 0 − x∗ ) + b(y 0 − y∗ ) = 0 egyenletet kapjuk. Mármost (10) egyenlet általános megoldása x = rb/(a, b), y = −ra/(a, b), ahol r tetszőleges egész szám. (A bizonyítást az olvasóra bízzuk. Útbaigazítás: Osszunk (a, b)-vel és használjuk a 58. oldalon közölt feladatot.) Azonnal következik, hogy x = x∗ + rb/(a, b),
y = y∗ − ra/(a, b).
Összefoglalva: ax + by = c lineáris diophantoszi egyenletnek, akkor és csak akkor van megoldása, ha c többszöröse (a, b)-nek. a, b és c, valamint a megoldások csak egész számok lehetnek. Egy x = x∗ , y = y∗ partikuláris megoldást ebben az esetben euklidészi algoritmussal találhatunk, s a legáltalánosabb megoldás x = x∗ + rb/(a, b),
y = y∗ − ra/(a, b)
alakú, ahol r tetszőleges egész szám. Példák: 3x + 6y = 22 egyenletnek nincs egész megoldása, mivel (3, 6) = 3, s ez nem osztója 22-nek. 7x + 11y = 13 egyenlet egy partikuláris megoldása x = −39, y = 26, amit a következőképpen találunk meg: 11 = 1 · 7 + 4,
7 = 1 · 4 + 3,
4 = 1 · 3 + 1,
(7, 11) = 1.
1 = 4 − 3 = 4 − (7 − 4) = 2 · 4 − 7 = 2(11 − 7) − 7 = 2 · 11 − 3 · 7. Tehát 7 · (− 3)+11 · ( 2) = 1, 7 · (−39)+11 · (26) = 13.
62
A többi megoldásokat x = −39 + 11r,
y = 26 − 7r
adja, ahol r tetszőleges egész szám. Feladat: Oldjuk meg a következő diophantoszi egyenleteket: a) 3x − 4y = 29, b) 11x − 12y = 58, c) 153x − 34y = 51.
63
64
II. A matematika számrendszere Bevezetés Alaposan ki kell bővítenünk a szám fogalmát a természetes számhoz képest, ha olyan eszközt akarunk teremteni belőle, amelyik kielégíti a gyakorlat és az elmélet igényeit. Hosszú és habozásokkal tarkított fejlődés vezetett a zérus, a negatív egész számok és a törtek pozitív egész számokkal való egyenjogúságának az elfogadásáig, s ma mégis minden átlagos értelmi színvonalú iskolás gyerek uralja e számoknak a műveleti szabályait. Ahhoz azonban, hogy az algebrai műveletekkel teljesen szabadon dolgozhassunk, be kell venni a számfogalomba irracionális és komplex mennyiségeket is. Évszázadok óta használják már a természetes számok fogalmának ezeket a bővítéseit, s ezek az újkori matematikának úgyszólván az alapjai, de logikailag szilárd megalapozásuk csak az újabb időkben sikerült. Ebben a fejezetben erről a fejlődésről számolunk be.
1. § A racionális számok 1. Racionális számok mint a mérés eszközei Az egész szám véges sok tárgyból álló együttesek megszámlálásából létrejött absztrakció. Mindennapi életünk azonban nemcsak a különféle egyedi tárgyak megszámlálását követeli meg tőlünk, hanem mérnünk is kell a mennyiségeket, olyanokat, mint amilyen a hosszúság, terület, súly, idő. Ezeket a mennyiségeket tetszőlegesen kicsiny részekre lehet osztani, ha tehát korlátozás nélkül akarunk mérni, ki kell terjesztenünk aritmetikánkat az egész számokon túlra. Első lépésként redukáljuk a mérés problémáját a megszámlálás problémájára. Először is válasszunk egy teljesen tetszőleges mértékegységet – pl. méter, centiméter, kilogramm, gramm vagy másodperc, már amint a helyzet megköveteli –, és tekintsük a mértékét 1-nek. Azután számoljuk meg, hány ilyen egység a megmérendő mennyiség. Pl. egy adott ólomtömeg pontosan 27 kilogrammot nyomhat. Általában
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526103222+02’00’
65
azonban az egységek megszámolása „nem jön ki”, az adott mennyiség nem mérhető pontosan a választott egység egész számú többszöröseivel. Legfeljebb azt mondhatjuk, hogy az illető mérték az egység két egész számú többszöröse közé esik, mondjuk jelen példánkban 26 és 27 kilogramm közé. Ha ez így van, második lépésként új alapegységet választunk, amit az eredeti egység n egyenlő részre való osztásával kapunk. A köznyelvben ezeknek az alapegységeknek külön nevük lehet, pl. a méter 100 centiméterre van osztva, a kilogramm 1000 grammra, a font 16 unciára, az óra 60 percre, a perc 60 másodpercre stb. A matematika jelrendszerében azonban az eredeti egység, az 1, n egyenlő részre történő osztása által nyert alapegységet 1/n-nel jelöljük, és ha az adott mennyiség pontosan m ilyen alapegységet tartalmaz, m/n jellel jelöljük a mértékét. Ezt a jelet törtnek vagy aránynak nevezzük (írják néha m : n alakban is). A következő döntő lépés csak évszázadok múlva vált tudatossá: az m/n jelet meg kellett fosztani a mérésre s a mért mennyiségekre való konkrét vonatkoztatástól, és tiszta számnak kellett tekinteni, önmagában megálló létezőnek, olyasminek, ami teljesen egyenrangú a természetes számokkal. Az m/n jelet, ha m és n egész számok, racionális számnak nevezzük. A szám elnevezés használatára (amely eredeti értelmében a természetes számokra korlátozódik) ezen új jelekkel kapcsolatban az jogosít fel, hogy összeadásuk és szorzásuk ugyanolyan szabályok szerint történik, mint a természetes számoké. Ennek a kimutatására azonban előbb definiálnunk kell, mit értünk racionális számok összeadásán, szorzásán és egyenlőségén. Mint közismert, ezek a definíciók az alábbiak: Bármely a, b, c, d egész számra fennáll a c ad + bc a c ac + = , · = , b d bd b d bd a c a = 1, = ha ad = bc. a b d Pl.:
(1)
2 4 2·5+3·4 10 + 12 22 2 4 2·4 8 + = = = , · = = , 3 5 3·5 15 15 3 5 3·5 15 3 8 6 2 = 1, = = . 3 12 9 3
Éppen ezek azok a definíciók, amelyekre szükségünk van, ha hosszúságok, területek stb. mérésére racionális számokat akarunk használni. Pontosabban szólva ezeket a szabályokat
66
szorzásra, összeadásra és egyenlőségre definíció alapján magunk állapítottuk meg, s csak az önellentmondás-mentesség és a gyakorlati alkalmazásra való használhatóság követelménye írja elő számunkra, s nem valamiféle „a priori” szükségszerűségből következnek. Az (1) alatt felsorolt definíciók alapján kimutathatjuk, hogy a természetes számok aritmetikájának alapvető
törvényei érvényben maradnak a racionális számok
körében is: p+q=q+p p + (q + r) = (p + q) + r pq = qp p(qr) = (pq)r p(q + r) = pq + pr
(az összeadás kommutatív törvénye),
(2)
(az összeadás asszociatív törvénye), (a szorzás kommutatív törvénye), (a szorzás asszociatív törvénye), (disztributív törvény).
Az összeadás kommutatív törvényének törtekre való érvényességét mutatják pl. a következő egyenlőségek ad + bc cb + da c a a c + = = = + , b d bd db d b ahol az első és az utolsó egyenlőségjel az összeadás (1) alatt közölt definíciójának felel meg, a középső egyenlőségjel a természetes számok összeadásának és szorzásának kommutativitásából következik. A többi négy törvény hasonló módon igazolható, ezt az olvasóra bízzuk. A dolgok helyes megértése végett még egyszer hangsúlyozni kívánjuk, hogy a racionális számok a mi teremtményeink, az (1) alatti szabályokat saját elhatározásunkból választottuk. Ha szeszélyünk úgy diktálná, választhatnánk valamilyen más összeadási szabályt is, pl. azt, hogy a+c a c + = , b d b+d ami szerint pl. 1 1 2 + = , 2 2 4 ami a mérés szempontjából abszurd eredmény. Ilyen jellegű szabályok, bár logikailag megengedhetők, az alkalmazás szempontjából értelmetlen játékká tennék jeleink aritmetikáját. Az értelem szabad játékát ebben az esetben annak a szükségessége vezeti, hogy
67
alkalmas eljárást teremtsünk a mért mennyiségekkel való számolásra. 2. A racionális számok elméleti szükségessége. Az általánosítás elve Van azonban a racionális számok bevezetésének „gyakorlati” szükségessége mellett egy másik, mélyebb, magából a matematikából következő, s bizonyos értelemben még kényszerítőbb oka is. A következőkben erről lesz szó. Tisztán aritmetikai módon, a fent mondottaktól teljesen függetlenül, ismertetjük a racionális számokat. Az alkalmazandó módszer tipikus példája a matematikai eljárások egyik uralkodó irányzatának. A természetes számok közönséges aritmetikájában mindig elvégezhető két alapművelet, az összeadás és a szorzás. De az „inverz műveletek”, ti. a kivonás és az osztás már nem mindig végezhetők el. Két a és b egész szám b − a különbsége az a c egész szám, amelyik eleget tesz az a + c = b követelménynek, azaz az a + x = b egyenlet megoldása. De a természetes számok tartományában a b − a jelnek csak azon megszorítás mellett van értelme, ha b > a, mivel az a + x = b egyenletnek csak ekkor lehet egy x természetes szám a megoldása. Nagyon nagy lépés volt ennek a megszorításnak a kiküszöbölése felé, amikor az a − a = 0 feltétellel bevezették a 0 jelet. Még fontosabb volt, mikor a −1, −2, −3, . . . szimbólumok bevezetésével, és a b < a esetre érvényes b − a = −(a − b) definícióval biztosították, hogy a kivonást minden megszorítás nélkül el lehessen végezni a pozitív és a negatív számok tartományában egyaránt. Ahhoz azonban, hogy az új −1, −2, −3, . . . jeleket beépíthessük egy kibővített, pozitív és negatív számokat magába foglaló aritmetikába, természetesen olyan módon kell jelekre vonatkozó műveleteket definiálni, hogy az aritmetikai műveletek eredeti szabályai változatlanul érvényben maradjanak. Pl. a (−1)(−1) = 1
(3)
szabály, amelyet a negatív egész számok szorzására vezetünk be, annak az óhajunknak a következménye, hogy az a(b + c) = ab + ac disztributív törvény ne változzon. Mert hogyha pl. azt választanánk, hogy legyen (−1)(−1) = −1, akkor a = −1, b = 1, c = −1 értékekkel −1(1 − 1) = −1 − 1 = −2 lenne, míg másrészt −1(1 − 1) = −1 · 0 = 0. Sokáig
68
tartott, amíg a matematikusok belátták, hogy a (3) „előjelszabályt” s ugyanígy más, a negatív egész számokkal és a törtekkel való műveleteket szabályozó definíciókat nem lehet „bebizonyítani”. Ezeket mi hozzuk létre, azért, hogy minden megszorítás nélkül dolgozhassunk az aritmetikai műveletekkel, de úgy, hogy az aritmetika alapvető törvényei közben mindig érvényben maradjanak. Amit lehet – s kell is – bizonyítani, az csupán annyi, hogy a bevezetett definíciók alapján az aritmetika kommutatív, asszociatív és disztributív törvényei érvényben maradnak. Maga a nagy Euler is, mikor azt akarta bizonyítani, hogy (−1)(−1) = +1 „kell” legyen, olyan nem meggyőző módon érvelt, hogy az eredmény vagy +1 vagy −1, mármost −1 nem lehet, mivel −1 = (+1)(−1). Ahogy a negatív egész számok és a zérus bevezetése megnyitja az utat a kivonás korlátlan elvégzésének a lehetősége előtt, úgy távolítja el a törtszámok bevezetése az osztás előtt álló hasonló aritmetikai akadályokat. Két a és b egész szám x = b/a hányadosa, amit az ax = b
(4)
egyenlet definiál, egész számként csak akkor létezik, ha a osztója b-nek. Ha ez nem áll, pl. ha a = 2, b = 3, akkor egyszerűen bevezetünk egy új b/a jelölést, amelyikre azt a szabályt állítjuk fel, hogy a( ab ) = b legyen, úgyhogy b/a „definíció szerint” megoldása (4) egyenletnek. Az így bevezetett jelet törtnek nevezzük. A törteknek mint új számjeleknek a felfedezése lehetővé teszi az osztás megszorítás nélküli elvégzését, kivéve a zérussal való osztásét, amit egyszer s mindenkorra kizárunk. Olyan kifejezések, mint 1/0, 3/0, 0/0 stb., számunkra teljesen értelmetlen jelek. Ugyanis, ha megengednénk a 0-val való osztást, a 0 · 1 = 0 · 2 igaz egyenletből levezethetnénk az 1 = 2 abszurd következményt. Néha azonban hasznos lehet ilyen kifejezéseket a ∞ (olv.: „végtelen”) jellel jelölni, feltéve, hogy nem próbálunk úgy dolgozni a ∞ jellel, mintha érvényesek lennének rá a számokkal való számolás közönséges szabályai. Az összes racionális szám – pozitív és negatív egészek és törtek – rendszerének tisztán aritmetikai jelentősége ezek után nyilvánvaló. Ugyanis ebben a bővített számtartományban nemcsak a formális asszociatív, kommutatív és disztributív törvények érvényesek, hanem kivétel nélkül van minden a + x = b és ax = b egyenletnek is x = b − a, illetve x = b/a alakú megoldása, az utóbbi esetben feltéve, hogy a 6= 0. Más szóval a racionális számok tartományában az ún. racionális műveletek – össze-
69
adás, kivonás, szorzás, osztás – megszorítás nélkül elvégezhetők, anélkül, hogy valaha is kivezetnének ebből a tartományból. A számok egy ilyen zárt tartományát test nek nevezik. Ebben a fejezetben később s a harmadik fejezetben fogunk még más testekkel is találkozni. Valamely tartomány új jelek bevezetésével való kibővítése úgy, hogy közben az eredeti tartományban érvényes törvények a bővítettben is érvényben maradjanak, a matematikai általánosítás legjellemzőbb vonása. A természetes számok általánosítása racionális számokká elméleti és gyakorlati igényt elégít ki egyszerre: megszünteti a kivonás és az osztás természetes számok körében fennálló korlátozásait, s lehetővé teszi a mérés eredményének kifejezését. Ennek a kétszeres szükségletnek a kielégítésében van a racionális számok igazi jelentősége. Láttuk, hogy a számfogalom kibővítését az tette lehetővé, hogy új számokat teremtettek, absztrakt jelek – mint 0, −2 és 3/4 – formájában. Ma, amikor magától értetődőnek vesszük az ilyen számokkal való számolást, nehéz elhinni, hogy egészen a XVII. század legvégéig nem tekintették a pozitív egész számokkal egyenjogú számoknak őket. Amikor mégis használniuk kellett, mindig meggondolás és kétség közepette használták ezeket a számokat. Az emberi természetben rejlő ragaszkodás a „konkrétumhoz”, amit a természetes számok képviseltek, gátolta olyan sokáig a feltartóztathatatlan haladást. De kielégítő aritmetikai rendszer csak az absztrakció világában teremthető. 3. Racionális számok geometriai értelmezése A racionális számok szemléletes geometriai értelmezését következő szerkesztéssel nyerhetjük.
8. ábra. A számegyenes Jelöljünk ki egy egyenesen, a „számegyenesen”, mint a 8. ábrán látható, egy 0-tól 1-ig terjedő szakaszt. Ezáltal a tetszőlegesen választott 0 – 1 szakaszt hosszegységként
70
tüntettük ki. Ennek a segítségével a pozitív és negatív egész számokat a számegyenes egymástól azonos távolságban levő pontjainak a halmazával lehet ábrázolni, a pozitív számokat a 0 ponttól jobbra, a negatívokat balra. n nevezőjű törtek ábrázolására osszuk mindegyik egységnyi hosszúságú szakaszt n egyenlő részre, az osztáspontok ábrázolják az n nevezőjű törteket. Minden n egész számra elvégezve ezt az osztást, ábrázoltuk a racionális számokat a számegyenes pontjaival. Az egyenes ezen pontjait racionális pontok nak nevezzük, a következőkben felváltva használjuk majd a „racionális szám” és „racionális pont” elnevezéseket. Az első fejezet 1. §-ában definiáltuk az A < B összefüggést egész számokra. Ennek a definíciónak a számegyenesen az az értelme, hogy ha A természetes szám kisebb mint B természetes szám, akkor A pont balra van B ponttól. Mivel ez a geometriai összefüggés minden racionális pont között fennáll, meg kell kísérelnünk az aritmetikai összefüggést olyan értelemben kibővíteni, hogy a megfelelő pontok közötti relatív geometriai rendezés továbbra is érvényben maradjon. Ezt a következő definícióval érhetjük el: Ha A és B bármely két racionális szám és B − A pozitív, akkor azt mondjuk, hogy A kisebb, mint B (A < B) és B nagyobb, mint A (B > A). Ebből a definícióból következik, hogy ha A < B, akkor azok a pontok (számok) vannak A és B között, amelyeknek megfelelő racionális számok nagyobbak mint A és kisebbek mint B. Bármely két egymástól különböző pontot, a közöttük levő pontokkal együtt szakasz nak vagy intervallumnak nevezünk, és [A, B]-vel jelöljük. Valamely A pont kezdőponttól való távolságát, akkor is pozitívnak tekintve, ha a kezdőponttól balra esik, A abszolút értékének nevezzük és az |A| jellel jelöljük. Szavakban, ha A = 0, |A| = A; ha A 5 0, |A| = −A. Nyilvánvaló, hogy ha A és B megegyező előjelűek, fennáll az |A + B| = |A| + |B| egyenlet, ha pedig A és B különböző előjelűek, |A + B| < |A| + |B|. A két állítást egybe sűrítve az |A + B| 5 |A| + |B| általános egyenlőtlenséget kapjuk, ez A és B előjelétől függetlenül érvényes.
71
Alapvetően fontos tényt állapít meg a következő állítás: A racionális pontok mindenütt sűrűn lepik be a számegyenest. Ezen azt értjük, hogy minden intervallumban, bármilyen kicsi is, van racionális pont. Hogy ezt belássuk, elég meggondolni, hogy elég nagy n-et választva nevezőnek a [0, 1/n] intervallum kisebb, mint a kérdéses [A, B] intervallum, tehát az m/n törtek közül legalább egy [A, B] intervallumba esik. Nincs tehát az egyenesen olyan intervallum, bármilyen kicsi is legyen az, amelyikben ne lenne racionális pont. Következésképpen bármely intervallumban végtelen sok racionális pont van, mert ha véges sok lenne, akkor két szomszédos racionális pont közé már nem eshetne további racionális pont, ami – mint láttuk – lehetetlen.
2. § Inkommenzurábilis szakaszok, irracionális számok, határérték 1. Bevezetés
9. ábra. Racionális pontok Két szakasz a és b nagyságának összehasonlításakor előfordulhat, hogy az az r szám, amelyik megmondja, hányszor van meg a szakasz b-ben, véletlenül pontosan egész szám. Ebben az esetben azáltal adjuk meg b a-egységekben kifejezett mértékét, hogy azt mondjuk: b hosszúsága r-szerese a hosszúságának. Előfordulhat azután az is, hogy ha nincs is a-nak olyan egész számú többszöröse, amelyik egyenlő lenne b-vel, de be lehet osztani a-t olyan, mondjuk n számú egyenlő hosszúságú a/n szakaszra, amelyikből m számú – ahol m megint egész szám – pontosan b-vel egyenlő: b=
m a. n
(1)
Ha az (1) alakú egyenlet érvényes két a és b szakasz között, a szakaszokat kommenzurábilisnak nevezzük, mivel mindkettőnek közös mértéke a/n szakasz, amelyik n-szer van meg a-ban és m-szer b-ben. Az összes a-val kommenzurábilis szakaszt megkapjuk,
72
ha (1) képletben m és n helyébe behelyettesítjük az egész számokat (n 6= 0). Ha, mint a 9. ábrán, a [0, 1] egységszakaszt választjuk a-nak, akkor az egységszakasszal kommenzurábilis szakaszok a számegyenes összes m/n racionális pontjának felelnek meg. Minden gyakorlati mérési célra teljesen elegendők a racionális számok. Elméleti szempontból pedig, mivel a racionális pontok mindenütt sűrűn lepik be az egyenest, azt gondolhatnánk, hogy az egyenes minden pontja racionális pont. Ha ez igaz lenne, minden szakasz kommenzurábilis lenne az egységgel. A korai görög matematika (püthagoreusok) egyik legmeglepőbb felfedezése volt, hogy a helyzet távolról sem ilyen egyszerű. Léteznek inkommenzurábilis szakaszok is, vagy, ha feltesszük, hogy minden szakasznak megfelel egy, a szakasz hosszát valamely egységben kifejező szám, irracionális számok. Ez a felfedezés a tudomány történetének egyik legfontosabb eseménye volt, egyike a legdöntőbb, tipikus és talán legfontosabb felfedezéseknek, amellyel a görög tudomány járult hozzá a szigorú tudományos szemléletmód megteremtéséhez. Bizonyos, hogy az irracionális számok felfedezése erősen hatott a görögöktől kezdve máig a matematika és filozófia fejlődésére egyaránt. Az inkommenzurábilis mennyiségek Eudoxosz által kidolgozott elmélete, ahogyan az geometriai alakban Euklidész Elemei ben található, a görög matematika egyik műremeke. Sajnos, Euklidész klasszikus művének ma használatos felhígított iskolai változataiból rendszerint kihagyják. Kellőképpen méltányolni az elméletet egyébként is csak a XIX. század vége óta tudjuk, amióta Dedekind, Cantor és Weierstrass megteremtették az irracionális számok szigorú elméletét. A következőkben modern aritmetikai köntösben ismertetjük Eudoxosz elméletét. Először is kimutatjuk, hogy a négyzet átlója és oldala inkommenzurábilis. Tételezzük fel, hogy az adott négyzet oldalát választottuk hosszegységnek, és legyen az átló hosszúsága x. Püthagorasz tételéből ekkor x2 = 12 + 12 = 2. (x-et jelölhetjük
√
2 jellel is.) Mármost, ha x kommenzurábilis lenne 1-gyel, találhatnánk
két olyan p és q egész számot, amelyek kielégítenék az x = p/q egyenletet, és x-nek ezt
73
az értékét behelyettesítve utóbbi egyenletünkbe (2)
p2 = 2q2
feltételt kapnánk. Feltételezhetjük, hogy p/q tovább már nem egyszerűsíthető, mivel a számlálóból és nevezőből már kezdetben elhagyhatunk minden közös tényezőt. Mivel a jobb oldalon 2 fordul elő tényezőként, p2 páros szám kell legyen, és így maga p is páros szám, mivel páratlan számnak a négyzete is páratlan. Tehát felírhatjuk p-t p = 2r alakba. Ezt a (2) egyenletbe helyettesítve vagyis
4r2 = 2q2
2r2 = q2 .
Mivel a bal oldalon 2 fordul elő tényezőként, q2 és így q is páros szám kell legyen. Tehát p is meg q is osztható 2-vel, ami ellentmond annak a feltevésünknek, hogy p-nek és q-nak nincs közös osztója. Tehát (2) egyenlet nem állhat fenn, x nem lehet racionális szám. Eredményünk abban a tételben foglalható össze, hogy nem létezik
√ 2-vel egyenlő
racionális szám.
10. ábra.
√
2 megszerkesztése
A megelőző paragrafusban mondottak alapján látjuk, hogy már igen egyszerű geometriai szerkesztéssel is előállítható az egységgel inkommenzurábilis szakasz. Ha ugyanis egy ilyen szakaszt körzőbe véve felmérünk a számegyenesre, az így szerkesztett pont nem eshet egybe egyetlen racionális ponttal sem: az összes racionális pontból álló rendszer, jóllehet mindenütt sűrű, nem tölti be teljesen a számegyenest. A naiv realizmus szempontjából kétségkívül különös és paradox állítás, hogy a racionális pontok, ame-
74
lyek mindenütt sűrűn lepik be, mégsem töltik be teljesen a számegyenest. Semmiféle „szemlélet” nem segíthet abban, hogy az irracionális pontokat különbözőknek „lássuk” a racionálisaktól. Nem csoda, hogy a görög matematikusokat és filozófusokat annyira megzavarta az inkommenzurábilitás felfedezése, s hogy máig izgatja a töprengésre hajlamosokat. Nagyon egyszerű lenne annyi olyan szakaszt szerkeszteni, amely az egységgel inkommenzurábilis, amennyit csak akarunk. Az ilyen szakaszok zérustól számított végpontjait irracionális pontoknak nevezzük a számegyenesen. A törtek bevezetésében a vezérelvünk hosszúságok számok általi mérése volt, tartsuk meg ezt az elvet az egységgel inkommenzurábilis szakaszokkal való munkában is. Ha azt akarjuk, hogy a számok és az egyenes pontjai kölcsönösen megfeleljenek egymásnak, be kell vezetnünk az irracionális számokat. Összefoglalva az eddigieket, azt mondhatjuk, hogy az irracionális számok az egységgel inkommenzurábilis szakaszok hosszúságát jelölik. A következőkben pontosabbá tesszük majd ezt a kissé bizonytalan és teljes mértékben geometriai definíciót, s a logikai szigorúság szempontjából kielégítőbben alapozzuk meg. Mindenekelőtt megkíséreljük, hogy problémánkat a tizedes törtek segítségével tegyük hozzáférhetővé. Feladatok: 1) Bizonyítsuk be, hogy
√ 3
2,
√
3,
√
5,
√ 3
3 nem racionálisok. (Útmutatás: Használjuk fel a 56.
oldalon közölt lemmát.) √ √ √ √ 2) Igazoljuk, hogy 2 + 3 és 2 + 4 3 nem racionális számok. (Útbaigazítás: Ha pl. az első a √ √ két szám közül egy r racionális számmal lenne egyenlő, akkor 3 = r − 2 és négyzetre emelve, √ 2 racionális lenne.) √ √ √ 3) Igazoljuk, hogy 2 + 3 + 5 irracionális. Keressünk hasonló és még általánosabb példákat.
2. Tizedes törtek. Végtelen tizedes törtek Nincs szükség az összes racionális számra ahhoz, hogy a racionális számok mindenütt sűrűn lepjék el a számegyenest. Elegendő pl. azokat a számokat tekinteni, amelyek bármelyik egységszakasz 10, 100, 1000 stb. egyenlő részre való osztásával keletkeznek. Az így kapott pontok felelnek meg a „tizedes törteknek”. Pl. a 0, 12 = 1/10 + 2/100 pont
75
az első egységintervallumban van, a második 10−1 hosszúságú rész intervallumban, a harmadik 10−2 hosszúságú „rész–rész”-intervallum kezdőpontjában (a−n jelentése 1/an .) Egy ilyen tizedes tört, ha n számjegyet tartalmaz a tizedespont után, f = z + a1 10−1 + a2 10−2 + a3 10−3 + . . . + an 10−n alakú, ahol z valamely egész szám, és az a-k a tizedeket, századokat stb. jelentő számjegyek – 0, 1, 2, . . ., 9. Az f szám a tízes számrendszerben röviden a z, a1 a2 a3 . . . an jellel jelölhető. Azonnal látjuk, hogy a tizedes törtek felírhatók p/q közönséges tört alakjában, ahol q = 10n , így pl. f = 1, 314 = 1 +
3 1 4 1314 + + = . 10 100 1000 1000
Ha p-nek és q-nak közös osztója van, akkor a tizedes tört egyszerűsíthető, és az új nevező 10n valamely osztója lesz. Megfordítva, az olyan tovább nem egyszerűsíthető törtek, amelyeknek a nevezője nem osztója 10 valamely hatványának, nem fejezhetők ki tizedes tört alakjában. Pl. 2 1 = = 0, 2 5 10 és 4 1 = = 0, 004, 250 1000 de 1/3 nem írható fel véges n számú tizedeshely segítségével tizedes törtként, bármilyen nagynak is válasszuk n-et, mivel 1 b = n 3 10 egyenlőségből 10n = 3b következne, ami lehetetlen, hiszen 3 nem osztója 10 egyetlen hatványának sem. Válasszunk a számegyenesen egy tetszőleges, nem tizedestörtnek megfelelő P pontot, √ pl. az 1/3 racionális pontot vagy a 2 irracionálisat. Ez a P pont sohasem esik egybe egyetlen olyan részintervallum kezdőpontjával sem, amelyeket az egységintervallum egymás után következő tíz-tíz egyenlő részre való osztásával kapunk. Pedig P-t az egymást követő tízes beosztások egyre kisebb intervallumaiba lehet bezárni, s ez a
76
közelítés kívánt pontosságig folytatható. A közelítő eljárás következőképpen írható le. Tegyük fel, hogy P az első egységintervallumba esik. Osszuk be ezt az intervallumot 10 egyenlő 10−1 hosszúságú részre. Mondjuk, hogy P a harmadik ilyen intervallumba esik. Ez annyit jelent, hogy P 0, 2 és 0, 3 tizedes törtek között fekszik. Osszuk fel a 0, 2-től 0, 3-ig terjedő intervallumot 10 egyenlő 10−2 hosszúságú részre, s legyen P például a negyedik ilyen intervallumban. Ezt az intervallumot újból beosztva, azt találjuk, hogy P az elsőbe esik a 10−3 hosszúságú intervallumok közül. Most már azt mondhatjuk, hogy P 0, 230 és 0, 231 között van. Ezt az eljárast korlátlanul lehet folytatni, az eredmény a számjegyek sehol sem végződő a1 , a2 , a3 , . . . , an , . . . sorozata lesz, s ez a sorozat következő tulajdonságú: bármilyen nagy n egész számot is válasszunk, a P pont mindig be van zárva abba az In intervallumba, amelyiknek a bal végpontja a 0, a1 a2 a3 . . . an−1 an tizedes tört, jobb végpontja a 0, a1 a2 a3 . . . an−1 (an + 1) tizedes tört, hosszúsága pedig In = 10−n . Ha n értékét rendre 1, 2, 3, 4, . . .-nek választjuk, látjuk, hogy a hozzájuk tartozó I1 , I2 , I3 , . . . intervallumok sorozatában mindegyik intervallum benne foglaltatik a megelőzőben, az intervallumok hosszúsága – 10−1 , 10−2 , 10−3 , . . . – pedig zérushoz tart. P pont benne van az egymásba zárt tizedes „intervallum-skatulyák” mindegyikében, azt mondjuk, hogy P a tizedes intervallumskatulyázás magva. Legyen pl. P az 1/3 racionális pont, akkor mindegyik a1 , a2 , a3 , . . . számjegy 3-mal egyenlő, és P benne van mindegyik 0, 333 . . . 33-tól 0, 333 . . . 34-ig terjedő In intervallumban; azaz 1/3 nagyobb mint 0, 333 . . . 33, de kisebb mint 0, 333 . . . 34, természetesen tetszőlegesen sok számjegyet véve. Ezt a tényt úgy fejezzük ki, hogy az n számjegyű 0, 333 . . . 33 tizedes tört n növekedtével „1/3-hoz tart”, és így írjuk: 1 = 0, 333 . . . . 3 A három pont aztjelenti, hogy a tizedes törtet „vég nélkül” folytatni kell. √ √ Az 1. pontban definiált 2 pont is végnélküli tizedes tört. Azonban 2 esetében távolról sem világos az egyes számjegyek értékét megadó törvény. Nem ismerünk ugyanis olyan explicit képletet, ami megadná az egymás után következő számjegyeket, bár annyi
77
számjegyet kiszámíthatunk, amennyit csak akarunk; 12 = 1 q akkor a 2p hosszúságú AA 0 szakaszt az ellipszis nagytengelyének nevezzük, a 2q hosszúságú BB 0 szakaszt az ellipszis kistengelyének. Az ellipszis azon P pontoknak p p a mértani helye, amelyeknek az F( p2 − q2 , 0) és az F 0 (− p2 − q2 , 0) ponttól való
92
15. ábra. A kör távolságösszege 2p. Feladatként igazoljuk ezt az állítást (1) képlet felhasználásával. Az √ 2 −q2 p F és F 0 pontokat az ellipszis fókuszainak nevezzük, az e = arányt az ellipszis p excentricitásának. Az
x2 y2 − =1 p 2 q2
(6)
alakú egyenlet hiperbolát állít elő. Ez a görbe kétágú, az ágak az x-tengelyt A(p, 0), illetve A 0 (−p, 0) pontokban metszik. A 2p hosszúságú AA 0 szakaszt a hiperbola valós tengelyének nevezik. A hiperbola annál jobban megközelíti a két qx ± py = 0 egyenest, minél távolabb megyünk a kezdőponttól, de ténylegesen sohasem éri el ezeket az egyeneseket. Ezt a két egyenest a hiperbola aszimptotái nak nevezzük. A hiperbola azoknak a P p p pontoknak a mértani helye, amelyeknek két, F( p2 + q2 , 0) és az F 0 (− p2 + q2 , 0) ponttól való távolság különbsége 2p. √ Ezeket a pontokat a hiperbola fókuszainak nevezzük; a p2 +q2 hiperbola excentricitása e = . p Az xy = 1
(7)
egyenlet is hiperbolát definiál, mégpedig olyant, amelyiknek az aszimptotái a tengelyek (18. ábra). Ennek az „egyenlő szárú” hiperbolának az egyenletéből láthatjuk, hogy a
93
16. ábra. Az ellipszis. F és F 0 a fókuszok görbe bármely P pontjára a P által meghatározott derékszögű paralelogramma területe = 1. Az xy = c (c = konstans )
(7a)
egyenletű hiperbola éppen úgy speciális esete az általános hiperbolának, mint ahogy a kör speciális esete az ellipszisnek. Az egyenlő szárú hiperbola különlegessége az, hogy aszimptotái (ebben az esetben a koordinátatengelyek) merőlegesek egymásra. Számunkra most az az alapvető gondolat fontos, hogy geometriai objektumok teljesen leírhatók számokkal és algebrai kifejezésekkel. Ugyanez áll a geometriai műveletekre is. Pl. ha két egyenes metszéspontját akarjuk meghatározni, felírjuk a két egyenes ax + by = c a0 x + b0 y = c0
(8)
egyenletét, és megoldjuk ezt a két egyenletet x, y szerint, megkapjuk a két egyenes közös pontjának a koordinátáit. Hasonlóképpen, bármely két görbe, pl. a x2 +y2 −2ax−2by = k kör és az ax + by = c egyenes metszéspontját úgy kapjuk meg, hogy megoldjuk az illető két görbének megfelelő két egyenletből álló rendszert.
94
17. ábra. A hiperbola. F és F 0 a fókuszok
4. § A végtelen matematikai analízise 1. Alapfogalmak Végtelen halmaz legegyszerűbb és egyben legfontosabb példája a pozitív egész számok 1, 2, 3, . . . sorozata. Semmi természetfölötti nincsen abban a tényben, hogy ennek a sorozatnak nincs vége: ez egyszerűen annyit jelent, hogy bármilyen nagy egész szám legyen is n, mindig megadható a következő egész szám: n + 1. Vigyázni kell azonban, hogy ha a „végtelen” jelzőről, ami egyszerűen „végnélkülit” jelent, áttérünk a „végtelenség” főnévre, nehogy azt higyjük, hogy ez a ∞ jellel jelölt fogalom úgy tekinthető, mintha közönséges szám lenne. Nem lehet a ∞ jelet a valós számrendszerhez csatolni úgy, hogy az aritmetika alapvető szabályai érvényben maradjanak. Ennek ellenére a végtelen fogalma az egész matematikát átjárja, mivel a matematikai objektumokat rendszerint nem mint egyedeket tekintjük, hanem mint végtelen sok hasonló objektumból álló osztályok vagy halmazok tagjait. Így pl. az egész számok összességéről, a valós számok összességéről, a sík háromszögeinek az összességéről stb. beszélünk. Éppen ezért pontosan
95
18. ábra. Az xy = 1 egyenlő szárú hiperbola. A P(x, y) pont által meghatározott xy négyszög területe egyenlő 1-gyel analizálnunk kell a matematikai végtelen fogalmát. A halmazelmélet, amelyet Georg Cantor és iskolája a XIX. század végén alkotott meg, meglepő sikerrel oldotta meg ezt a feladatot. A Cantor-féle halmazelmélet a matematika sok területére hatolt be, és erősen hatott az egész matematikára. Ezen túlmenően alapvető fontosságú lett a matematika alapjainak logikai és filozófiai vizsgálatában. Az elmélet kiinduló pontja a halmaz általános fogalma. Halmazon tetszőleges elemek valamely szabály által definiált együttesét értjük. A szabály pontosan megadja, hogy mely elemek tartoznak az illető együttesbe. Példaként tekinthetjük az összes pozitív egész szám halmazát, az összes szakaszos tizedes tört halmazát, az összes valós szám halmazát vagy az összes egyenes halmazát a háromdimenziós térben. Két különböző halmaz „számosságának” az összehasonlításában az „ekvivalencia” fogalma alapvető. Ha két A és B halmaz elemei úgy párosíthatók egymással, hogy A minden elemének B egy és csak egy eleme felel meg, továbbá B minden egyes elemének is A egy és csak egy eleme felel meg, akkor A és B megfelelkezését kölcsönösen egyértelmű nek nevezzük, s a két halmazt ekvivalensnek mondjuk. Véges halmazok esetében az ekvivalencia fogalma azonos azzal az állítással, hogy a két kérdéses halmaz
96
egyenlő számú elemet tartalmaz. Két véges halmazban ugyanis akkor és csak akkor van egyenlő számú elem, ha a két halmaz elemei között kölcsönösen egyértelmű megfelelkezés létesíthető. Voltaképpen semmi egyéb ez, mint a megszámlálás maga, hiszen amikor tárgyak valamely véges halmazát megszámláljuk, egyszerűen kölcsönösen egyértelmű megfelelkezést létesítünk a megszámlálandó tárgyak és az egész számok 1, 2, 3, . . ., n jelek által kifejezett halmaza között. Nem mindig szükséges két véges halmaz tárgyait megszámlálni ahhoz, hogy megállapítsak ekvivalenciájukat. Pl. minden számolás nélkül meg tudjuk állapítani, hogy az egységsugarú körök bármely véges halmaza ekvivalens középpontjaik halmazával.
Cantor ötlete az ekvivalencia fogalmának végtelen halmazokra való kiterjesztése volt. Ennek alapján ugyanis definiálhatóvá vált a végtelen „aritmetikája”. Az összes valós szám és az egyenes pontjainak a halmaza pl. ekvivalens halmazok, mivel kezdőpont és hosszegység választása után kölcsönösen egyértelmű módon rendelhetünk az egyenes minden P pontjához egy x valós számot koordinátaként, jelekben: P ↔ x. A páros egész számok halmaza az összes egész szám halmazának valódi részhalmaza, az egész számok halmaza pedig valódi részhalmaza a racionális számok halmazának. (Valamely S halmaz valódi részhalmazának azt az S 0 halmazt nevezzük, amelyik S elemeiből áll, de nem tartalmazza S minden elemét.) Nyilvánvaló, hogyha egy halmaz véges, azaz ha valamely n számnál nem tartalmaz több elemet, akkor nem lehet egyetlen valódi részhalmazával sem ekvivalens, mivel bármely valódi részhalmaza legfeljebb n − 1 elemet tartalmazhatna. De ha egy halmaznak végtelen sok eleme van, akkor – bármily paradox módon is hangzik – a halmaz ekvivalens lehet valódi részhalmazával. Pl. az 1
2
3
4
5
l
l
l
l
l
2
4
6
8
10
...
n
...
l ...
2n
...
hozzárendelés kölcsönösen egyértelmű megfelelkezést létesít a pozitív egész számok halmaza és a páros számok halmaza között, amely utóbbi a pozitív egész számok halma-
97
zának valódi részhalmaza, s így az egész számok halmaza ekvivalens egy részhalmazával. Ez ellentmond annak a közönségesen elfogadott igazságnak, hogy az „egész nagyobb, mint bármelyik része”, és mutatja, hogy milyen meglepetésekre készülhetünk a végtelen birodalmában. 2. A racionális számok megszámlálhatósága és a kontinuum nem megszámlálhatósága Cantor első felfedezéseinek egyike a végtelen analízisében annak a felismerése volt, hogy a racionális számok halmaza (amelyik részhalmazként tartalmazza az egész számok halmazát, és így maga is végtelen) ekvivalens az egész számok halmazával. Előszörre nagyon különösnek látszik, hogy a racionális számok mindenütt sűrű halmaza összemérhető az egész számok ritkán betöltött halmazával. Igaz ugyan, hogy a pozitív racionális számokat nem lehet nagyság szerint elrendezni (mint az egész számokat) azáltal, hogy a-t az első racionális számnak nevezzük, b-t a másodiknak stb., hiszen bármely két racionális szám között végtelen sok további racionális szám van, és ezért nincs „közvetlenül következő nagyobb”. Azonban, mint Cantor megfigyelte, ha eltekintünk két egymás után következő elem nagyságrelációjától, akkor a racionális számokat éppen úgy egyetlen r1 , r2 , r3 , r4 , . . . sorozatba lehet rendezni, mint az egész számokat. Ebben a sorozatban lesz egy első, egy második, egy harmadik stb. racionális szám, és minden racionális szám pontosan egyszer fordul elő. Valamely halmaz elemeinek ilyen egész számokéhoz hasonló sorozatba való elrendezését a halmaz megszámlálásának nevezzük. Ezzel a megszámlálással Cantor kimutatta, hogy a racionális számok halmaza ekvivalens az egész számok halmazával, mivel az 1
2
3
4
l
l
l
l
r1
r2
r3
r4
...
n
...
l ...
rn
...
megfelelkezés kölcsönösen egyértelmű. A következőkben ismertetjük a racionális számok egyik megszámlálási módját. Minden racionális szám a/b alakba írható, ahol a és b egész számok. Az így felírt számok olyan táblázatba rendezhetők, amelyben a/b az a-adik oszlopban és b-edik sorban áll. Pl. 3/4-et az alább közölt táblázatban a harmadik oszlop negyedik sorában
98
19. ábra. A racionális számok megszámlálása találjuk. Mármost az összes pozitív racionális szám elrendezhető a következőképpen: húzzunk a most definiált szkémában egy törött vonalat, amely a szkéma minden számán átmegy úgy, hogy 1-ből kiindulva egyet lépünk vízszintesen, és így 2-t kapjuk a sorozat második tagjaként, akkor átlósan balra az első oszlop második eleméig, ami 1/2, azután függőlegesen az első oszlop következő eleméig, ami 1/3, átlósan jobbra fel, amíg az első sorban elérjük 3-at, át 4-hez, átlósan le 1/4-hez, és így tovább, amint azt a 19. ábrán látjuk. Ezen a folytonos törött vonalon haladva az 1, 2, 1/2, 1/3, 2/2, 3, 4, 3/2, 2/3, 1/4, 1/5, 2/4, 3/3, 4/2, 5, . . . sorozatot kapjuk, ami a racionális számokat olyan sorrendben tartalmazza, ahogy azok a törött vonal mentén fordulnak elő. Hagyjuk el ebből a sorozatból mind azokat az a/b számokat, amelyekben a-nak és b-nek közös osztója van, úgyhogy minden r racionális szám pontosan egyszer forduljon elő a sorozatban legegyszerűbb alakjában. Így az 1, 2, 1/2, 1/3, 3, 4, 3/2, 2/3, 1/4, 1/5, 5, . . . sorozatot kapjuk, amelyben minden pozitív racionális szám egyszer és csak egyszer fordul elő. Látjuk tehát, hogy az összes pozitív racionális szám halmaza megszámlálható. Tekintve, hogy a racionális számok kölcsönösen egyértelmű módon felelnek meg az egyenes racionális pontjainak, egyúttal azt is bebizonyítottuk, hogy az egyenes pozitív racionális pontjainak halmaza megszámlálható. Feladatok: 1) Mutassuk ki, hogy az összes pozitív és negatív egész számok halmaza megszámlálható. Mutassuk ki, hogy a pozitív és negatív racionális számok halmaza megszámlálható.
99
2) Mutassuk ki, hogy az S + T halmaz (l. 135. o.) megszámlálható, ha S és T megszámlálható halmazok. Mutassuk ki ugyanazt három, négy vagy általában n halmazra, és végül olyan halmazra, amely megszámlálhatóan végtelen sok megszámlálható halmazból van összetéve.
Mivel a racionális számok halmaza megszámlálható, azt lehetne hinni, hogy bármely végtelen halmaz megszámlálható, s ezzel vége is lenne a végtelen analízisének. Ez azonban távolról sincsen így. Cantor ugyanis felfedezte, hogy az összes valós (racionális és irracionális) számok halmaza nem megszámlálható. Másként kifejezve, azt fedezte fel, hogy a valós számok összessége gyökeresen különböző, azt lehetne mondani, hogy felsőbb típusú végtelent képvisel, mint az egész számok vagy a racionális számok halmaza. Cantor erre vonatkozó lángeszű, indirekt bizonyítása sok matematikai bizonyítás mintaképe lett. A bizonyítás lényege a következő. Abból a próbaként bevezetett feltevésből indulunk ki, hogy a valós számokat már valamilyen sorozat szerint megszámláltuk, akkor azután definiálunk egy olyan valós számot, amelyik a feltételezett megszámlálásban nem fordul elő. Ez azonban ellentmondás, mivel feltételeztük, hogy minden valós szám előfordul a megszámlálásban, s így utóbbi feltételnek még akkor is helytelennek kell lennie, ha csupán egyetlen olyan valós szám létezik, amit a megszámlálásból kihagytunk. Az a feltétel tehát, hogy a valós számok megszámlálhatók, tarthatatlan, és így Cantor ellenkező állításának kell igaznak lenni, a valós számok halmaza nem megszámlálható. A bizonyítás kedvéért tételezzük fel, hogy az összes valós számot megszámláltuk végtelen tizedes törtek alábbi táblázatába rendezve őket: első szám
N1 , a1 a2 a3 a4 a5 . . .
második szám
N2 , b1 b2 b3 b4 b5 . . .
harmadik szám
N3 , c1 c2 c3 c4 c5 . . .
...............
...................
ahol az N-ek az egész részt jelentik, a tizedesvessző utáni kisbetűk pedig a tizedes számjegyeket. Feltételezzük, hogy ezek a tizedes törtek minden valós számot ellőállítanak. A bizonyítás lényege mármost abban áll, hogy egy ún. „diagonális eljárás”-sal konstruálunk egy olyan új számot, amiről ki tudjuk mutatni, hogy a fenti sorozat nem tartalmazza. Először is válasszunk egy olyan a számjegyet amelyik különbözik a1 -től és nem 0 vagy 9 (azért, hogy elkerüljük a 0, 999 . . . = 1, 000 . . . szerű egyenlőségekből adódható kétértelműséget), azután válasszunk egy b2 -től különböző b számjegyet, amelyik megint
100
nem egyenlő sem 0-val, sem 9-cel, hasonlóképpen egy c3 -tól különböző c számjegyet, és így tovább. (Pl. választhatnánk egyszerűen a = 1-et, feltéve, hogy a1 =1, amely esetben a = 2-t választanánk, és hasonlóan a következő számokból a b, c, d, e, . . . számjegyek számára.) Tekintsük az így definiált z = 0, abcde . . . végtelen tizedes törtet. Ez az új z szám bizonyosan különbözik a fenti számok mindegyikétől. Az elsővel azért nem lehet egyenlő, mert különbözik tőle a tizedespont utáni első számjegyben; nem lehet egyenlő a másodikkal sem, mert attól meg a második számjegyben különbözik; és ugyan így általában nem lehet egyenlő a fenti számok közül az n-edikkel sem, mivel különbözik tőle n-edik számjegyében. Tehát tizedes törtjeinek fenti sorozata nem tartalmazhatja az összes valós számot. A valós számok halmaza tehát nem megszámlálható.
20. ábra. Kölcsönösen egyértelmű megfelelkezés egy behajlított vonalszakasz és az egész egyenes pontjai között
21. ábra. Kölcsönösen egyértelmű megfelelkezés két különböző hosszúságú szakasz pontjai között
101
Az olvasó talán azt hihetné, hogy a számkontinuum nem megszámlálhatóságának az oka az egyenes végtelen kiterjedésében keresendő, és hogy egy véges vonalszakasz csak megszámlálhatóan végtelen pontot tartalmaz. Azonban nem ez a helyzet, ugyanis könnyű kimutatni, hogy az egész számkontinuum ekvivalens bármely véges szakasszal, mondjuk a 0 és 1 közötti szakasszal, a végpontokat nem beleértve. A kívánt kölcsönösen egyértelmű megfelelkezést elő lehet állítani az egységszakaszt 1/3-nál és 2/3-nál felhajtva, s egy pontból vetítve, mint az a 20. ábrán látható. Következésképpen a számegyenes véges szakasza is nem megszámlálhatóan végtelen sok pontot tartalmaz. Feladat: Mutassuk ki, hogy a számegyenes bármely [A, B] intervalluma ekvivalens bármely más [C, D] intervallumával.
Érdemes megemlékezni a számkontinuum nem megszámlálhatóságának egy másik, talán valamivel szemléletesebb bizonyításáról. A fentebb mondottak értelmében elegendő, ha a 0 és 1 közötti pontok halmazára szorítkozunk. Ez a bizonyítás szintén indirekt. Tételezzük fel, hogy a 0 és 1 közötti pontok mind elrendezhetők egy a1 , a2 , a3 , . . .
(1)
sorozatba. Rekesszük be az a1 koordinátájú pontot egy 1/10 hosszúságú intervallumba, az a2 koordinátájú pontot egy 1/102 hosszúságú intervallumba, és így tovább. Ha az összes 0 és 1 közötti pontok előfordulnának az (1) sorozatban, akkor az egymást esetleg átfedő 1/10, 1/102 , . . . hosszúságú részintervallumok végtelen sorozata teljesen betöltené az egységintervallumot. (Az a tény, hogy a részintervallumok némelyike túl nyúlik az egységintervallumon, nem befolyásolja a bizonyítást.) Ezeknek a részintervallumoknak az összegét az
# " 1 1 1 1 1 1 + 2 + 3 + ... = = 1 10 10 10 10 1 − 10 9
geometriai sor adja meg. Tehát az a feltevés, hogy (1) sorozat minden 0 és 1 közötti valós számot tartalmaz, ahhoz a lehetetlen eredményhez vezet, hogy az 1 hosszúságú intervallum lefedhető olyan részintervallumok halmazával, amelyeknek az összege 1/9-e az egységintervallum hosszúságának. Ezt az ellentmondást elfogadhatjuk bizonyítékként, bár logikai szempontból további analízist igényelne.
102
Az érvelés a modern „mértékelmélet” egy nagy fontosságú tételének a bizonyításában nyer alkalmazást. A fenti intervallumokat kisebb, ε/10n hosszúságú intervallumokkal helyettesítve, ahol ε tetszőlegesen kicsiny pozitív szám, látjuk, hogy az egyenesen fekvő pontok bármely megszámlálható halmaza bezárható olyan intervallumok halmazába, amelyeknek összhosszúsága ε/9. Mivel ε tetszőlegesen kicsiny, ε/9 tetszőlegesen kicsinnyé tehető. A mértékelmélet nyelvén kifejezve azt mondjuk, hogy bármely megszámlálható ponthalmaz mértéke zérus. Feladat: Bizonyítsuk be, hogy ugyanez érvényes a sík megszámlálható ponthalmazaira is. A bizonyításban az intervallumok hosszúságát négyzetek területével kell helyettesíteni.
3. A Cantor-féle „számosságok” Az eddigiek összefoglalásaképpen azt mondhatjuk, hogy egy véges A halmaz elemeinek a száma nem lehet egyenlő egy véges B halmaz elemeinek a számával, ha A B-nek valódi részhalmaza, azaz ha B több elemet tartalmaz, mint A. Ha ezt a fogalmat, hogy „azonos (véges) számú elemet tartalmazó halmazok”, helyettesítjük az ekvivalens halmazok általánosabb fogalmával, akkor az előbbi állítás végtelen halmazok esetében nem érvényes: az összes egész szám halmazában több elem van, mint a páros számok halmazában, és a racionális számok halmaza is több elemet tartalmaz, mint az egész számok halmaza, mégis ezek a halmazok mind ekvivalensek. Azt lehetett volna gondolni, hogy minden végtelen halmaz ekvivalens, és semmi más megkülönböztetésnek végesvégtelenen túl nincs értelme. Cantor eredményei azonban megcáfolták ezt a hitet; van olyan halmaz, a valós számok kontinuuma, amelyik egyetlen megszámlálható halmazzal sem ekvivalens. A „végtelen”-nek tehát legalább két különböző típusa van, az egész számok megszámlálhatóan végtelenje és a kontinuum nem megszámlálható végtelenje. Ha két véges vagy végtelen A és B halmaz ekvivalens, azt mondjuk, hogy a két halmaz számossága vagy kardinális száma azonos. Ha A és B véges, ez a fogalom az azonos természetes szám jól ismert fogalmára redukálódik, s így utóbbi általános érvényű megfelelőjének tekinthető. Ha egy A halmaz ekvivalens B halmaz valamely részhalmazával, azonban B nem ekvivalens A-val vagy annak valamely részhalmazával, Cantor nyomán azt fogjuk mondani, hogy B halmaz számossága nagyobb, mint A halmazé. A számosság fogalmának a használata ebben az esetben is megfelel annak, amit a nagyobb szám
103
fogalma jelent véges halmazok esetében. Az egész számok halmaza részhalmaza a valós számok halmazának, azonban, a valós számok halmaza nem ekvivalens az egész számok halmazával, vagy annak valamely részhalmazával (azaz a valós számok halmaza nem véges vagy megszámlálható). Definíciónk szerint tehát a valós számkontinuum számossága nagyobb, mint az egész számok halmazának a számossága. * Valóban, Cantor megmutatta, hogyan kell egyre nagyobb számosságú végtelen halmazok egész sorozatát konstruálni. Mivel a pozitív egész számok halmazából indulhatunk ki, nyilvánvalóan elegendő azt kimutatni, hogyha adva van bármely A halmaz, akkor lehetséges egy nagyobb számosságú B halmazt konstruálni. A tétel nagy általánossága miatt a bizonyítás szükségképpen meglehetősen elvont. B halmazként azt a halmazt definiáljuk, amelynek elemei A halmaz összes különböző részhalmazai. A „részhalmaz” elnevezés alatt most nemcsak S valódi részhalmazait fogjuk érteni, hanem magát A-t is és a 0 üres „részhalmazt” is, amelyik egyetlen elemet sem tartalmaz. (Pl. ha A az 1, 2, 3 egész számokból áll, akkor B-nek 8 különböző eleme van: [1, 2, 3]; [1, 2]; [1, 3]; [2, 3]; [1]; [2]; [3] és [0].) B halmaz mindegyik eleme maga is halmaz, amely A halmaz elemeiből áll. Tételezzük fel mármost, hogy B ekvivalens A-val vagy valamely részhalmazával, azaz hogy megadható valamilyen szabály, amely A halmaz vagy A egy részhalmazának az elemeit kölcsönösen egyértelmű módon rendeli hozzá B elemeihez, tehát A részhalmazaihoz: a ↔ Sa ,
(2)
ahol az Sa -k jelölik A azon részhalmazait, amelyekhez A a eleme van hozzárendelve. Definiálni fogjuk B egy olyan elemét (azaz A egy T részhalmazát), amelyikhez egyetlen a elemet sem lehet hozzárendelni, s így ellentmondásra jutunk. Ennek a részhalmaznak a megszerkesztése érdekében jegyezzük meg, hogy A bármely x elemére két lehetőség valamelyike teljesül: a (2) megfelelkezés által x-hez rendelt S vagy tartalmazza x elemet vagy nem tartalmazza. Definiáljuk T -t mint A azon részhalmazát, amely mindazokból az x elemekből áll, amelyekhez rendelt S nem tartalmazza x-et. Ez a részhalmaz minden S-től legalább egy, ti. a elemmel különbözik, mivel ha S tartalmazza a-t, T nem tartalmazhatja, míg ha S nem tartalmazza a-t, akkor T tartalmazza. Tehát T nem foglaltathatik benne a (2) megfelelkezésben. Nem lehetséges tehát kölcsönösen egyértelmű megfelelkezést létesíteni A vagy A valamely részhalmazának az elemei és B halmaz elemei között. De az a ↔ {a} összefüggés kölcsönösen egyértelmű megfelelkezést definiál A elemei és B azon részhalmaza
104
között, amely A összes egyelemű részhalmazából áll. Tehát a fenti definícó szerint B számossága nagyobb, mint A számossága. *Feladat: Tartalmazzon A n elemet, ahol n pozitív egész szám. Mutassuk ki, hogy a fent definiált B 2n elemet tartalmaz. Legyen A az összes pozitív egész szám halmaza, mutassuk ki, hogy B ekvivalens a 0 és 1 közötti valós számkontinuummal. (Útbaigazítás: Jelöljük az első esetben A valamely részhalmazát a 0 és 1 számjegyek valamely véges, a második esetben valamely végtelen a1 a2 a3 . . . sorozatával, ahol an = 1 vagy 0, aszerint hogy A n-edik eleme az adott részhalmazhoz tartozik-e vagy sem.) Azt lehetne gondolni, hogy könnyű a pontok olyan halmazát találni, amelynek a számossága nagyobb, mint a 0 és 1 közötti valós számok halmazának a számossága, hogy talán pl. a kétdimenziós négyzet több pontot tartalmazhat, mint az egydimenziós vonalszakasz. Elég meglepő, de ez nincsen így: egy négyzet pontjainak a halmaza ugyanakkora számosságú, mint egy vonalszakasz pontjainak a halmaza. Ennek a bizonyítására állítsuk fel az alábbi megfelelkezést. Legyen (x, y) az egységnyi területű négyzet egy pontja. x és y mint tizedes tört x = 0, a1 a2 a3 a4 . . . , y = 0, b1 b2 b3 b4 . . . alakban fejezhetők ki, ahol a kétértelműség elkerülése végett pl. 1/4 racionális számra 0, 250000 . . . értéket választjuk 0, 249999 . . . helyett. A négyzet (x, y) pontjához akkor a 0 és 1 közötti szakasz z = 0, a1 b1 a2 b2 a3 b3 a4 b4 . . . pontját rendeljük hozzá. Nyilvánvaló, hogy a négyzet különböző (x, y) és (x 0 , y 0 ) pontjainak a vonalszakasz különböző z és z 0 pontjai felelnek meg, úgyhogy a négyzet pontjainak a számossága nem haladhatja meg a szakasz pontjainak a számosságát. (Voltaképpen a négyzet összes pontjának a halmaza és az egységszakasz egy valódi részhalmaza között definiáltunk most kölcsönösen egyértelmű megfelelkezést, ugyanis pl. a 0, 2140909090 . . . pontnak a négyzet egyetlen pontja sem felel meg, mert az 1/4 számra a 0, 24999 . . . helyett a 0, 25000 . . . alakot választottuk. Azonban nem nehéz úgy módosítani a megfelelkezést, hogy az egész négyzet kölcsönösen egyértelmű leképezését kapjuk az egész szakaszra, amelyeknek így
105
azonos számosságúnak kell lennie.) Hasonló érveléssel kimutathatjuk, hogy egy kocka pontjainak a számossága sem nagyobb a szakasz pontjainak a számosságánál. Ezek az eredmények látszólag ellentmondanak a dimenzió szemléletes fogalmának, azonban emlékeztetünk rá, hogy az általunk definiált megfelelkezés nem „folytonos”; ha folytonosan haladunk a szakaszon 0-tól 1-ig, akkor a megfelelő pontok a négyzetben nem folytonos görbén feküsznek, hanem teljesen kaotikusan helyezkednek el. Egy ponthalmaz dimenziója nemcsak a halmaz számosságától függ, hanem attól is, hogyan oszlanak el a pontok a térben. Az ötödik fejezetben még visszatérünk majd erre a tárgyra.
4. Az indirekt bizonyítás A számosságok elmélete egyik része csupán a Cantor által teremtett általános halmazelméletnek. Ezt az elméletet Cantor a kor néhány legkiválóbb matematikusának szigorú kritikájával szemben dolgozta ki. A kritikusok közül sokan, mint Kronecker és Poincaré, a „halmaz” általános fogalmának a bizonytalanságát kifogásolták, és az egyes halmazok definiálására használt érvelés indirekt, nem konstruktív jellegét. A nem konstruktív érvelés elleni kifogások a lényegében indirekt nek nevezhető bizonyításokat támadják. Maga az indirekt bizonyítás a matematikai érvelés általánosan elfogadott módszere: egy A állítás igazságát úgy bizonyítjuk be, hogy feltételezzük A ellenkezőjéről – jelöljük ezt A 0 -vel –, hogy igaz. Akkor azután az ebből következő érvek láncolatával A 0 -nek ellentmondó állítást vezetünk le, így bizonyítva A 0 lehetetlenségét. Tehát a „harmadik kizárásának logikai elve alapján A 0 tarthatatlanságából következtetünk A igazságára. Ebben a könyvben gyakran találkozunk majd olyan példákkal, ahol az indirekt bizonyítás könnyen átalakítható direkt bizonyítássá, bár a bizonyítás indirekt formája sokszor előnyös a rövidség és az éppen tárgyalt feladat szükségtelen részletektől való mentesítése szempontjából. De van néhány tétel, amelyiknek a bizonyítására még nem sikerült közvetlen eljárást találni. Vannak olyan indirekt bizonyítással megalapozható tételek is, amelyekre talán még elvben sem adható direkt konstruktív bizonyítás, mert a tételek természete kizárja a közvetlen bizonyítás lehetőségét. Ilyen pl. a 100. oldalon ismertetett tétel. Többször előfordult a matematika történetében, hogy amikor a matematikusok
106
konstruktív úton próbáltak egyes problémákat megoldani, valaki más – megkerülve a konstrukció nehézségeit – a probléma indirekt, nem konstruktív bizonyítását adta. Valóban lényeges különbség van a között, hogy valamely matematikai objektum létezését úgy bizonyítjuk-e, hogy egy megfogható példát szerkesztünk a kérdéses típusú objektumra, vagy pedig azt mutatjuk ki, hogy ha az objektum nem létezne, ebből a tényből ellentmondó eredményeket tudnánk levezetni. Az első esetben ott van a kézzelfogható objektum, a másodikban csak az ellentmondás. Újabban néhány kiváló matematikus amellett foglalt állást, hogy a nem konstruktív bizonyításokat többékevésbé teljesen száműzzék a matematikából. Még ha ez a program esetleg kívánatos is lenne, jelenleg hallatlan bonyodalmakat eredményezne, és egyenesen az élő matematika egyes területeinek fejlődését, sőt létét is veszélyeztetné. Nem csoda hát, ha az ezen programot hirdető „intuicionizmus” mindenfelé erős ellenállásba ütközött, s ha maguk a legmegrögzöttebb intuicionisták sem mindig tudtak saját meggyőződéseiknek megfelelően élni. 5. A végtelen paradoxonai Az intuicionisták meg nem alkuvó álláspontját a legtöbb matematikus mindig is túlságosan szigorúnak érezte. Azonban a végtelen halmazok elméletének a szép épületét tőlük függetlenül is komoly veszély fenyegette, amikor napvilágra kerültek a halmazelmélet közvetlen logikai paradoxonai. Csakhamar észrevették, hogy a „halmaz” fogalmának minden megszorítás nélküli használata ellentmondásra vezet. Az egyik ilyen ellentmondás, amit Bertrand Russell vetett fel, következőképpen fogalmazható meg. A legtöbb halmaz nem tartalmazza elemként önmagát. Pl. az összes egész szám A halmazának az elemei csupa egész számok. Maga A, nem lévén egész szám, hanem egész számok egy halmaza, nem foglaltatik benne az egész számok halmazában elemként. Ilyen halmazt (közönséges) halmaznak nevezhetünk. Létezhetnének azonban olyan halmazok is, amelyek elemként tartalmazzák önmagukat. Ilyen pl. a következőképpen definiált S halmaz: „S eleme minden olyan halmaz, amely húsznál kevesebb szóból álló angol mondattal definiálható.” Az ilyen halmazokat „rendkívüli” halmazoknak nevezhetjük. A legtöbb halmaz kétségkívül közönséges, és a különös viselkedésű „rendkívüli” halmazokat kizárhatjuk, ha a figyelmünket az összes közönséges halmaz halmazára irányítjuk.
107
Jelöljük ezt a halmazt C-vel. C halmaz minden eleme maga is halmaz, mégpedig egy közönséges halmaz. De vajon C maga közönséges halmaz-e vagy rendkívüli? Valamelyik a kettő közül mindenképpen. Ha C közönséges, elemként tartalmazza önmagát, mivel C definíciószerűen tartalmazza az összes közönséges halmazt. De ha így áll a dolog, C rendkívüli kell legyen, hiszen a rendkívüli halmazok tartalmazzák elemként önmagukat. Ez azonban ellentmondás. Tehát C rendkívüli kell legyen. Azonban akkor C elemként tartalmaz egy rendkívüli halmazt (ti. magát C-t), ami meg C definíciójának mond ellent, hiszen C-t úgy definiáltuk, hogy csupa közönséges halmazt tartalmazzon. Mindkét esetben azt látjuk tehát, hogy C halmaz puszta létének a feltételezése is ellentmondásra vezet. 6. A matematika alapjai Ehhez hasonló paradoxonok vezették Russellt és másokat a matematika és logika alapjainak rendszeres vizsgálatára. Törekvéseik végső célja az, hogy a matematikai érveléseket olyan logikai alapokra helyezzék, amelyek ellentmondásmentesek és mégis elég szélesek ahhoz, hogy minden (vagy legalább néhány) matematikus által fontosnak tartott dolgot tartalmazzanak. Ezt az igényes célt nem érték el, s talán soha nem is érhetik el, a matematikai logika azonban egyre több kutató érdeklődését és figyelmét vonta magára. Sok igen egyszerűen megfogalmazható probléma bizonyult nagyon nehezen megoldhatónak. Hogy csak egy példát említsünk, ilyen a kontinuumsejtés, amelyik azt állítja, hogy nincsen olyan halmaz, amelyiknek a számossága nagyobb lenne az egész számok halmazának a számosságánál, de kisebb a valós számok halmazának a számosságánál. Ebből a hipotézisből sok érdekes következtetés vonható, de máig sem igazolni, sem megcáfolni nem sikerült, bár újabban Kurt Gödel kimutatta, hogy ha a halmazelmélet szokásos axiómarendszere ellentmondásmentes, akkor önellentmondásmentes az axiómák kontinuumsejtéssel kibővített rendszere is. Ehhez hasonló kérdések végül is arra a problémára vezetnek, hogy mit kell érteni valójában a matematikai egzisztencia fogalmán. Szerencsére a matematika létezése nem az efféle egzisztenciaproblémákra adott kielégítő választól függ. A „formalista” iskola, amelynek a nagy Hilbert volt az elindítója és vezetője, úgy tartja, hogy a matematikai „létezés” egyszerűen „ellentmondásmentesség”-et jelent. Újabban Gödel s mások munkái
108
nyomán is úgy látszik, hogy ez a program, legalábbis, ahogyan azt eredetileg Hilbert elképzelte, nem valósítható meg. A matematika struktúrájának Hilbert-féle formalizált elmélete ugyanis lényegében intuitív eljáráson alapul. Így vagy úgy, nyíltan vagy be nem vallottan, a legmakacsabb formalista, logikai vagy posztulácionista szempontból nézve is, a matematika éltető eleme mindig a konstruktív szemlélet marad.
5. § Komplex számok 1. A komplex számok eredete A szám fogalmát ki kellett terjeszteni, több okból is, még a valós számkontinuumon is túl, a komplex számok bevezetésével. Világosan kell látnunk, hogy az ilyen bővítések és felfedezések a matematika történeti és pszichológiai fejlődésében sohasem egyetlen ember fáradozásának az eredményei, hanem többnyire lépcsőzetes és kitérőkkel tarkított úté, s elérésükben nem lehet egyetlen matematikusnak döntő szerepet tulajdonítani. A negatív és a racionális számok használatát a formális számításokban megkívánt nagyobb szabadság tette szükségessé. Ezekkel a számokkal kapcsolatban azonban a matematikusok csak a középkor vége felé szabadultak meg a kényelmetlenség érzésétől, addig ugyanis nem tudták ezeket ugyanolyan szemléletes és konkrét „szám”-oknak tekinteni, mint a természetes számokat. Egészen a XIX. század közepéig nem ismerték fel világosan a matematikusok, hogy valamely bővített számtartományban való munka lényeges logikai és filozófiai alapjai formálisak, a bővítéseket definíciókkal kell létrehozni, amelyek ugyan önmagukban véve teljesen tetszőlegesek, de ha nem úgy vezetjük be őket, hogy az eredeti tartományban érvényes szabályok és tulajdonságok a bővítettben is érvényben maradjanak, akkor teljesen haszontalanok. Az a tény, hogy ezek a bővítések néha „valódi” objektumokhoz kapcsolódnak, és így új alkalmazások eszközeivé válnak, roppant fontos lehet, azonban legfeljebb a bővítések indítéka gyanánt szolgálhat, s nem érvényességük logikai bizonyításaként. Először a másodfokú egyenletek megoldásánál van szükségünk komplex számok használatára. Emlékeztessünk az elsőfokú egyenlet, ax = b fogalmára, ahol x az ismeretlen mennyiség, amit meg kell határozni. A megoldás egyszerűen x = b/a, és éppen az a követelmény tette szükségessé a racionális számok bevezetését, hogy minden egész
109
számú a 6= 0, b együtthatóval rendelkező első fokú egyenlet megoldható legyen. Az olyan egyenletek pedig, mint x2 = 2,
(1)
amelyeknek a racionális számtestben nem volt megoldásuk, a bővebb valós számtest megszerkesztésére vezettek, amelyben már az ilyen egyenleteknek is van megoldása. De még a valós számtest sem elég átfogó ahhoz, hogy az algebrai egyenletek teljes elméletét szolgáltassa. Már olyan egyszerű egyenletnek, mint x2 = −1
(2)
sincsen valós megoldása, mivel valós szám négyzete semmiképpen sem lehet negatív. Vagy be kell tehát érnünk azzal a megállapítással, hogy ez az egyszerű egyenlet nem oldható meg, vagy pedig a szokott módon eljárva olyan számok bevezetésével kell kibővíteni számfogalmunkat, amelyek lehetővé teszik ennek az egyenletnek a megoldását. Pontosan ezt tesszük, amikor az i2 = −1 definícióval bevezetjük az új i szimbólumot. Természetesen ennek az i-nek, a „képzetes egység”-nek semmi köze sincs a szám fogalmához, amennyiben azt a megszámlálás segítségével értelmezzük. Az i puszta jelölési mód, az i2 = −1 alapszabálynak megfelelően, s értéke teljesen attól függ, elérhető-e segítségével a számrendszer valóban hasznos bővítése. Azt akarjuk, hogy az i jellel éppen úgy tudjunk összeadni és szorozni, mint a közönséges valós számokkal, szükségünk van hát olyasféle jelek képzésére, mint 2i, 3i, −i, 2 + 5i, vagy általánosságban a + bi, ahol a és b tetszőleges valós számok. Ha ezektől a jelektől megkívánjuk, hogy eleget tegyenek az összeadás és szorzás közönséges kommutatív, asszociatív és disztributív törvényeinek, akkor pl. igaz, hogy (2 + 3i) + (1 + 4i) = (2 + 1) + (3 + 4)i = 3 + 7i, (2 + 3i)(1 + 4i) = 2 + 8i + 3i + 12i2 = (2 − 12) + (8 + 3)i = −10 + 11i Előrebocsátva ezeket a megfontolásokat, a rendszeres tárgyalást a következő definícióval kezdjük: Minden a + bi alakú jelet, ahol a és b tetszőleges valós számok, komplex számnak nevezünk. a-t a komplex szám valós, b-t képzetes részének hívjuk. Összegezés és szorzás ugyanúgy végzendők ezekkel a jelekkel, mintha csak i közönséges valós szám
110
lenne, kivéve azt az egy szabályt, hogy i2 mindig −1-gyel helyettesítendő. Pontosabban, komplex számok összegezését és szorzását az alábbi szabályokkal definiáljuk: (a + bi) + (c + di) = (a + c) + (b + d)i
(3)
(a + bi)(c + di) = (ac − bd) + (ad + bc)i Különleges esete ennek (a + bi)(a − bi) = a2 − abi + abi − b2 i2 = a2 + b2 .
(4)
Ezeknek a definícióknak az alapján könnyű igazolni, hogy a kommutatív, asszociatív és disztributív törvények érvényesek a komplex számokra. Továbbá nemcsak az összeadás és a szorzás, hanem két komplex szám kivonása és az osztás is újból komplex számot eredményez, úgyhogy az a + bi alakú komplex számok test et alkotnak (l. 69. o.): (a + bi) − (c + di) = (a − c) + (b − d)i, ac + bd a + bi (a + bi) (c − di) bc − ad = = + i. c + di (c + di) (c − di) c2 + d2 c2 + d2
(5)
(A második egyenlet jelentését veszíti, ha c + di = 0 + 0i, mivel ekkor c2 + d2 = 0. Így ismét ki kell zárnunk a zérussal, azaz a 0 + 0i komplex számmal való osztást.) Pl. (2 + 3i) − (1 + 4i) = 1 − i, 2 + 3i 2 + 3i 1 − 4i 2 − 8i + 3i + 12 14 5 = · = = − i. 1 + 4i 1 + 4i 1 − 4i 1 + 16 17 17 A komplex számtest résztestként foglalja magába a valós számtestet, mivel az a + 0i komplex számot azonosnak lehet tekinteni az a valós számmal. Másfelől a 0 + bi = bi komplex számot tiszta képzetes számnak nevezzük. kifejezést a + bi alakban. Feladatok: 1) Fejezzük ki (1+i)(2+i)(3+i) (1−i) √ 3 2) Fejezzük ki − 12 + i 23 kifejezést a + bi alakban. 3) Fejezzük ki a + bi alakban az alábbi kifejezéseket: 1+i , 1−i
1+i , 2−i
1 , i5
1 , (−2 + i)(1 − 3i)
(4 − 5i)2 . (2 − 3i)2
111
4) Számítsuk ki
√
5 + 12i értékét. (Útmutatás: Írjuk a kifejezést
√
5 + 12i = x + yi alakban,
emeljünk négyzetre, tegyük egyenlővé a valós és képzetes részeket.)
Az i jel bevezetésével kibővítettük a valós számtestet a + bi alakú szimbólumok olyan testévé, amelyben az x2 = −1 alakú speciális kvadratikus egyenletnek két megoldása van: x = i és x = −i. Ugyanis a definíció miatt i · i = (−i)(−i) = i2 = −1. Valójában még többet nyertünk: könnyen igazolhatjuk, hogy most már minden, ax2 + bx + c = 0
(a 6= 0)
(6)
alakban írható kvadratikus egyenlet megoldható. Ugyanis (6)-ból: x2 +
b c x=− , a a
(7)
b b2 b2 c x+ 2 = 2 − , a 4a 4a a 2 b b2 − 4ac , x+ = 2a 4a2 √ b ± b2 − 4ac x+ = , 2a 2a √ −b ± b2 − 4ac x= 2a
x2 +
Mármost ha b2 −4ac = 0, akkor
√
b2 − 4ac közönséges valós szám és (7) megoldása valós, p √ √ míg ha b2 − 4ac < 0, akkor 4ac − b2 > 0 és b2 − 4ac = −(4ac − b2 = 4ac − b2 · i, azaz (7) megoldásai komplex számok. Például, az x2 − 5x + 6 = 0 egyenlet megoldásai x=
112
5±
√
25 − 24 (5 ± 1) = = 2 vagy 3, 2 2
míg az x2 − 2x + 2 = 0 egyenlet megoldásai x=
2±
√ 4−8 2 ± 2i = = 1 + i és 1 − i. 2 2
2. A komplex számok geometriai szemléltetése Már a XVI. században be kellett vezetniük a matematikusoknak valamilyen jelölést a negatív számok négyzetgyöke számára ahhoz, hogy minden másod- vagy harmadfokú egyenletet megoldhassanak. De nem tudták megmagyarázni az ilyen célra bevezetett kifejezések pontos értelmét, s ezért valóságos babonás tisztelettel kezelték azokat. Még ma is emlékeztet a „képzetes” elnevezés arra, hogy ezeket a kifejezéseket valamiképpen nem valóságosnak, kitaláltnak tekintették. A komplex számok alkalmazásának jogos volta körüli kétségek csak a XIX. század elején tűntek el, amikor ezeknek a számoknak a fontossága a matematika sok ágában nyilvánvalóvá lett, és amikor a komplex számokkal végzett műveletek számára sikerült egyszerű geometriai interpretációt találni. A modern értelmezés szempontjából természetesen felesleges minden geometriai szemléltetés: az összeadás és szorzás formális definíciója alapján közvetlenül adódik a komplex számokkal végzett műveletek formális igazolása. De a geometriai értelmezés – amit körülbelül egyidőben fedezett fel Wessel (1745–1818), Argand (1768–1822) és Gauss – természetesebbé tette a komplex számokkal végzett műveleteket intuitív szempontból, s a komplex számok geometriai szemléltetése azóta is elsőrendű fontosságú maradt a matematikai és fizikai alkalmazásokban. Ez a geometriai értelmezés semmi egyéb, mint a z = x + yi komplex szám ábrázolása a síkon azzal a ponttal, amelynek a derékszögű koordinátái x és y. z valós része legyen a pont x, képzetes része y koordinátája. Ezáltal kölcsönösen egyértelmű megfelelkezést létesítünk a komplex számok és a „számsík” pontjai között, éppen úgy, amint a 2. §-ban a valós számok és egy egyenes, a számegyenes pontjai között létesítettünk kölcsönösen egyértelmű megfelelkezést. A számsík abszcisszatengelyének a pontjai a z = x + 0i valós számoknak felelnek meg, az ordinátatengely pontjai pedig a z = 0 + yi tisztán képzetes számoknak felelnek meg.
113
22. ábra. Komplex számok geometriai ábrázolása. A z pont derékszögű koordinátái x és y. A tetszőleges z = x + yi komplex számhoz képest a z = x + yi komplex számot z konjugált jának nevezzük. A z pontot a számsíkon a z pont x-tengelyre vonatkoztatott tükrözésével nyerjük. Jelölje ρ a z pont kezdőponttól számított távolságát, akkor Püthagorasz tétele szerint ρ2 = x2 + y2 = (x + yi)(x − yi) = z · z Aρ=
p x2 + y2 valós számot z modulusának nevezzük és ρ = |z|
jelölést vezetjük be a számára. Ha z a valós tengelyen van, modulusa semmi egyéb, mint a közönséges értelemben vett abszolút értéke. Azok a komplex számok, amelyeknek a
114
modulusa 1, az „egységkörön” vannak, azaz azon a körön, amelynek a középpontja a kezdőpont, sugara pedig 1. Ha |z| = 0, akkor z = 0. Ez azonnal következik a definícióból, ami szerint |z| a z kezdőponttól való távolsága. Továbbá két komplex szám szorzatának modulusa egyenlő modulusaik szorzatával: |z1 · z2 | = |z1 | · |z2 |. Ez egy általánosabb tételből következik, amelyet a 117. oldalon fogunk bebizonyítani. Feladatok: 1) Bizonyítsuk be ezt a tételt közvetlenül, két komplex szám, z1 = x1 + y1 i és z2 = x2 + y2 i szorzásának a definíciójából. 2) Két valós szám szorzata csak akkor zérus, ha a tényezők egyike zérus. Bizonyítsuk be a megfelelő tételt komplex számok esetében. (Útmutatás: Használjuk fel a most kimondott két tételt.)
23. ábra. Komplex számok összeadása a paralelogramma törvény alapján Két komplex szám, z1 = x1 + y1 i és z2 = x2 + y2 i, összeadásának a definíciójából következik, hogy z1 + z2 = (x1 + x2 ) + (y1 + y2 ) i. Tehát a z1 + z2 pontot annak a paralelogrammának a negyedik csúcsa ábrázolja a számsíkon, amelynek a többi három csúcsa 0, z1 , és z2 . Két komplex szám összegének ez az egyszerű geometriai megszerkesztése nagyon fontos sok alkalmazásban. Levezethetjük belőle azt a fontos összefüggést, hogy két komplex szám összegének a modulusa nem
115
haladhatja meg a modulusok összegét (vö. 43. oldal): |z1 + z2 | 5 |z1 | + |z2 |. Következik ez abból a tényből, hogy a háromszög egyik oldala nem lehet nagyobb a másik két oldal összegénél. Feladat: Mi a feltétele az |z1 + z2 | = |z1 | + |z2 | egyenlőség érvényességének?
Az x-tengely pozitív iránya és az Oz egyenes által bezárt szöget a komplex szám argumentumának nevezzük, és ϕ-vel jelöljük (22. ábra). z modulusa egyenlő z modulusával, |z| = |z|, de z argumentuma a z argumentumának negatív előjellel vett értékével egyenlő: ϕ = −ϕ. Természetesen z argumentuma nincs egyértelműen meghatározva, hiszen egy szöghöz 360◦ bármely egész számú többszörösét hozzá lehet adni vagy ki lehet vonni, anélkül, hogy a szög mozgó szárának a végső helyzete megváltoznék. Így ϕ, ϕ + 360◦ , ϕ + 720◦ , ϕ + 1080◦ , . . . , ϕ − 360◦ , ϕ − 720◦ , ϕ − 1080◦ , . . . mind ugyanazt a szöget jelentik a grafikus ábrázolásban. A ρ modulus és a ϕ argumentum segítségével a z komplex szám z = x + yi = ρ(cos ϕ + i sin ϕ)
(8)
alakban fejezhető ki; ugyanis a szinusz és koszinusz definíciója (l. 337. oldal) szerint x = ρ cos ϕ,
116
y = ρ sin ϕ.
Így pl. ha z = i, ρ = 1, ϕ = 90◦ , akkor i = 1(cos 90◦ + i sin 90◦ ); √ ha z = 1 + i, ρ = 2, ϕ = 45◦ , akkor √ 1 + i = 2(cos 45◦ + i sin 45◦ ); √ ha z = 1 − i, ρ = 2, ϕ = −45◦ , akkor √ 1 − i = 2[cos(−45◦ ) + i sin(−45◦ )]; √ ha z = −1 + 3i, ρ = 2, ϕ = 120◦ , akkor √ −1 + 3i = 2(cos 120◦ + i sin 120◦ ). Igazolja az olvasó ezeket az állításokat, behelyettesítve az adott értékeket a szögfüggvényekbe. A komplex szám (8)-ban megadott trigonometrikus alakja nagyon értékes a komplex számok szorzása szempontjából. Ha z = ρ(cos ϕ + i sin ϕ), és
z0 = ρ0 (cos ϕ0 + i sin ϕ0 )
akkor
zz0 = ρρ0 {(cos ϕ cos ϕ0 − sin ϕ sin ϕ0 ) + + i (cos ϕ sin ϕ0 + sin ϕ cos ϕ0 )}
Mármost a szinusz és koszinusz függvények összeadására vonatkozó tétel szerint cos ϕ cos ϕ0 − sin ϕ sin ϕ = cos (ϕ + ϕ0 ), cos ϕ sin ϕ0 + sin ϕ cos ϕ0 = sin (ϕ + ϕ0 ).
117
24. ábra. Két komplex szám szorzása; az argumentumokat összeadjuk, a modulusokat szorozzuk Tehát zz0 = ρρ0 {cos (ϕ + ϕ0 ) + i sin (ϕ + ϕ0 )} .
(9)
Ez azonban nem egyéb, mint a ρρ 0 modulusú és (ϕ + ϕ 0 ) argumentumú komplex szám trigonometrikus alakja. Más szavakkal, két komplex számot úgy szorzunk,
hogy
modulusukat összeszorozzuk és argumentumukat összeadjuk (24. ábra). Látjuk tehát, hogy a komplex számok szorzásának kell valami köze legyen a forgatáshoz. Pontosabban, nevezzük azt az irányított vonalszakaszt, amely a kezdőpontból a z pontba mutat z vektor nak, ρ = |z| a vektor hosszúsága. Legyen z 0 egy szám az egységkörön, úgyhogy ρ 0 = 1; akkor a z szorzása z 0 -vel nem egyéb, mint z vektor elforgatása ϕ 0 szöggel. Ha ρ 0 6= 1, az elforgatás után még meg kell szorozni a kapott vektor hosszúságát ρ 0 -vel. Ábrázoljuk ezeket a tényeket, tetszőleges számokat szorozva a következőkkel: z1 = i (elforgatás 90◦ -kal); z2 = −i (elforgatás 90◦ -kal az ellenkező irányba); z3 = 1+i; z4 = 1−i. A (9) képlet különösen fontos következményét kapjuk, ha z = z 0 , ekkor ugyanis z2 = ρ2 (cos 2ϕ + i sin 2ϕ).
118
Szorozva ezt újból z-vel z3 = ρ3 (cos 3ϕ + i sin 3ϕ), és így folytatva tovább zn = ρn (cos nϕ + i sin nϕ)
(10)
bármely tetszőleges n egész számra. Abban az esetben, ha z az egységkör egy pontja, azaz ρ = 1, A. de Moivre (1667–1754) francia származású matematikus által felfedezett (cos ϕ + i sin ϕ)n = cos nϕ + i sin nϕ
(11)
képletre jutunk. Ez a képlet az elemi matematika egyik legfigyelemreméltóbb és leghasznosabb összefüggése. Az alábbi példa is bizonyítja ezt. Alkalmazzuk a képletet n = 3 esetére és fejtsük ki a baloldalt (u + v)3 = u3 + 3u2 v + 3uv2 + v3 binomiális formula szerint, akkor a cos 3ϕ + i sin 3ϕ = cos3 ϕ − 3 cos ϕ sin2 ϕ + i 3 cos2 ϕ sin ϕ − sin3 ϕ
összefüggést kapjuk. Két komplex szám között fennálló egyetlen ilyen egyenlet ugyanaz, mint egy valós számok között fennálló egyenletpár. Ugyanis ha a két komplex szám egyenlő, a valós és képzetes részeknek külön-külön egyenlőknek kell lenni egymással. Tehát
cos 3ϕ = cos3 ϕ − 3 cos ϕ sin2 ϕ, sin 3ϕ = 3 cos2 ϕ sin ϕ − sin3 ϕ.
Felhasználva a cos2 ϕ + sin2 ϕ = 1
119
összefüggést, végül cos 3ϕ = cos3 ϕ − 3 cos ϕ 1 − cos2 ϕ = 4 cos3 ϕ − 3 cos ϕ, sin 3ϕ = −4 sin3 ϕ + 3 sin ϕ. sin nϕ és cos nϕ értékét sin ϕ és cos ϕ hatványaival kifejezve, könnyen nyerhetők hasonló képletek bármely n-re. Feladatok: 1) Adjuk meg a megfelelő képleteket sin 4ϕ és cos 4ϕ esetére. 2) Bizonyítsuk be, hogy egy, az egységkörön levő z = cos ϕ+i sin ϕ pontra 1/z = cos ϕ−i sin ϕ. 3) Bizonyítsuk be számolás nélkül, hogy (a + bi)/(a − bi) abszolút értéke mindig 1. 4) Legyen z1 és z2 két komplex szám, bizonyítsuk be, hogy z1 − z2 argumentuma egyenlő a z2 pontból z1 pontba mutató vektor és a valós tengely közötti szöggel. 5) Hogyan értelmezhető a (z1 − z2 )/(z1 − z3 ) komplex szám argumentuma a z1 , z2 , z3 pontok által alkotott háromszögben? 6) Bizonyítsuk be, hogy két azonos argumentumú komplex szám hányadosa valós. 7) Legyen z1 , z2 , z3 , z4 négy komplex szám. Bizonyítsuk be, hogy ha (z3 − z1 )/(z3 − z2 ) és (z4 − z1 )/(z4 − z2 ) argumentumai azonosak, akkor a négy szám egy körön vagy egy egyenesen fekszik, és megfordítva. 8) Bizonyítsuk be, hogy négy z1 , z2 , z3 , z4 pont akkor és csak akkor fekszik egy körön vagy egy egyenesen, ha z3 − z1 z3 − z2
z4 − z1 z4 − z2
valós.
3. A de Moivre-képlet és az egységgyökök Valamely a szám n-edik gyöke alatt azt a b számot értjük, amelyre bn = a. Az 1 számnak két négyzetgyöke van, 1 és −1, mivel 12 = (−1)2 = 1. Az 1 számnak csak egy valós harmadik gyöke van, 1, és négy negyedik gyöke: az 1 és −1 valós, és az i és −i képzetes számok. Ebből a tényből arra kell következtetni, hogy
lehet 1-nek még
két komplex harmadik gyöke is, s akkor összesen három harmadik gyöke lenne. A de Moivre-képlettel azonnal kimutathatjuk, hogy valóban ez a helyzet. Látni fogjuk majd, hogy a komplex számtestben 1-nek pontosan n különböző n-edik gyöke van. Ezek azon egységkörbe írt n-szög csúcsaival ábrázolhatók, amelynek
120
25. ábra. Az 1 tizenkét tizenkettedik gyöke egyik csúcsa a z = 1 pont. Ez a tény azonnal leolvasható a 25. ábráról (n = 12 esetére). A sokszög első csúcsa 1. A következő csúcsa α = cos
360◦ 360◦ + i sin , n n
(12)
mert argumentuma a teljes szögnek (360◦ ) n-ed része kell legyen. A következő csúcs α · α = α2 , mivel úgy kapjuk, hogy az α vektort elforgatjuk 360◦ /n szöggel. A következő csúcs α3 stb. és végül n lépés után visszajutunk az 1 csúcsba: αn = 1, ami a (11) képletből is következik, mivel
360◦ 360◦ cos + i sin n n
n
= cos 360◦ + i sin 360◦ = 1 + 0i.
121
Következésképpen α1 = α gyöke az xn = 1 egyenletnek. Ugyanez áll a következő, α = cos 2
720◦ n
+ i sin
720◦ n
csúcsra is. Azonnal beláthatjuk ezt α2
n
= α2n = (αn )2 = (1)2 = 1
egyenlőségekből, vagy a de Moivre-képletből: 2 n
α
720◦ 720◦ = cos n + i sin n = cos 720◦ + i sin 720◦ = 1 + 0i = 1. n n
Hasonlóan láthatjuk be, hogy mind az n 1, α, α2 , α3 , . . . , αn−1 szám n-edik gyöke 1-nek. Ha tovább megyünk a kitevőkkel, vagy ha negatív kitevőket alkalmazunk, nem kapunk új gyököket. Így pl. α−1 = 1/α = αn /α = αn−1 és αn = 1, αn+1 = (α)n α = 1 · α = α stb., úgyhogy egyszerűen ismétlődnének a fenti értékek. Gyakorlatként mutassuk ki, hogy a fentieken kívül nincs több n-edik gyök. Ha n páros, az n-szög csúcsainak egyike a −1 pontba esik, megfelelően annak az algebrai ténynek, hogy ebben az esetben −1 n-edik gyöke 1-nek. Az (13)
xn − 1 = 0
egyenlet, amelyet 1 n-edik gyökei kielégítenek, n-ed fokú, de könnyen redukálható (n − 1)-ed fokú egyenletre. Használjuk fel az xn − 1 = (x − 1) xn−1 + xn−2 + xn−3 + . . . + 1
(14)
algebrai azonosságot. Mivel két szám szorzata akkor és csak akkor 0, ha a két szám közül legalább az egyik 0, (14) bal oldala csak akkor tűnhet el, hogyha a jobb oldalon álló két tényező közül legalább az egyik nulla, azaz vagy ha x = 1, vagy ha az xn−1 + xn−2 + xn−3 + · · · + x + 1 = 0
122
(15)
egyenlet teljesül. Azt az egyenletet, amelyet az α, α2 , . . ., αn−1 gyököknek ki kell elégíteni; ciklotomikus, körosztási egyenletnek nevezzük. Pl. 1 komplex harmadik gyökei: √ α = cos 120◦ + i sin 120◦ = 21 (−1 + i 3), √ α2 = cos 240◦ + i sin 240◦ = 12 (−1 − i 3), az x2 + x + 1 = 0 egyenlet gyökei, amint azt az olvasó közvetlen behelyettesítéssel azonnal beláthatja. Hasonlóképpen 1-nek magától 1-től különböző ötödik gyökei az x4 + x3 + x2 + x + 1 = 0
(16)
egyenletet elégítik ki. Ha szabályos ötszöget akarunk szerkeszteni, ezt a negyedfokú egyenletet kell megoldanunk. Ez az egyenlet egyszerű algebrai eljárással, bevezetve a w = x + 1/x mennyiséget, másodfokú egyenletre redukálható. Elosztva (16)-ot x2 -tel és átrendezve a tagokat: x2 +
1 1 +x+ +1=0 2 x x
egyenletet kapjuk, vagy, mivel (x + 1/x)2 = x2 + 1/x2 + 2, a w2 + w − 1 = 0 egyenletet. Az 1. pont (7) képlete szerint ennek az egyenletnek a gyökei x+
1 = w1 x
vagy
1 √ x2 − ( 5 − 1)x + 1 = 0 2
x+
1 = w2 x
vagy
1 √ x2 + ( 5 + 1)x + 1 = 0, 2
és
amint azt az olvasó a már használt képlettel könnyen igazolhatja. Feladatok: 1) Írjuk fel 1 hatodik gyökeit. 2) Adjuk meg (1 + i)11 értékét. √ √ √ √ 3) Keressük meg 1 + i, 3 7 − 4i, 3 i, 5 −i egymástól különböző értékeit. 4) Számítsuk ki 2i1 i7 − i−7 értékét.
123
*4. Az algebra alaptétele A komplex számtestben nemcsak minden ax2 + bx + c = 0 és xn − 1 = 0 alakú egyenlet oldható meg, hanem a következő sokkal általánosabb tétel is igaz: Bármely n-edfokú, valós vagy komplex együtthatójú f(x) = xn + an−1 xn−1 + an−2 xn−2 + . . . + a1 x + a0 = 0
(17)
algebrai egyenletnek mindig van megoldása a komplex számtestben. Harmad- és negyedfokú egyenletekre már a XVI. században igazolták ezt Tartaglia, Cardano és mások, akik lényegében a másodfokú egyenletek megoldására használt képletekhez hasonló, csak sokkal bonyolultabb eljárásokkal már meg tudtak oldani ilyen egyenleteket. Azután csaknem két évszázadig igen intenzíven kutatták az ötöd- és magasabb fokú egyenleteket, de minden hasonló módszeren alapuló megoldási kísérlet eredménytelen maradt. Igen nagy eredmény volt, amikor a fiatal Gauss doktori értekezésében (1799) az első teljes bizonyítást közölte, hogy ilyen megoldás létezik, bár abban az időben még megválaszolatlan maradt, vajon létezik-e az ötödiknél alacsonyabb fokú egyenletek klasszikus megoldási képleteihez hasonló, pusztán a racionális műveletekkel és gyökvonással kifejezhető megoldás ebben az esetben is (l. 146. o.). Gauss tétele azt állítja, hogy bármely (17) alakú algebrai egyenletre, ahol n valamely pozitív egész szám és az a együtthatók valós vagy komplex számok, létezik legalább egy α = c + di komplex szám, amely kielégíti az f(α) = 0 egyenletet. Ezt az α számot a (17) egyenlet gyökének nevezzük. A tétel bizonyítását a 326. oldalon fogjuk adni. Fogadjuk el egyelőre igaznak, akkor bebizonyítható az algebra alaptételének nevezett (bár helyesebb lenne a komplex számrendszer alaptételének hívni) következő tétel: minden n-edfokú f(x) = xn + an−1 xn−1 + . . . + a1 x + a0
124
(18)
polinom felbontható pontosan n tényező (19)
f(x) = (x − α1 ) (x − α2 ) . . . (x − αn )
szorzatára, ahol α1 , α2 , α3 , . . ., αn komplex számok az f(x) = 0 egyenlet gyökei. A tétel illusztrálására vizsgáljuk példaképpen az f(x) = x4 − 1 polinomot, amely a következőképpen bontható tényezőkre: f(x) = (x − 1)(x − i)(x + i)(x + 1). Az α-k gyökei az f(x) = 0 egyenletnek, ez nyilvánvaló a (19) tényezős felbontásból, mivel ha x = αn , akkor f(x) egyik tényezője, tehát f(x) maga is, nullával egyenlő. Előfordul, hogy egy n-ed fokú f(x) polinom (x − α1 ), (x − α2 ), . . ., (x − αn ) gyöktényezői nem mind különböznek egymástól, mint pl. f(x) = x2 − 2x + 1 = (x − 1)(x − 1) polinom esetében, amelynek csak egy gyöke van, x = 1, de ez a gyök „kétszeresen számít”, kétszeres gyök. Egy n-ed fokú polinom azonban több mint n különböző (x − α) tényezőre nem bontható fel, a polinomnak megfelelő egyenlet pedig nem rendelkezhetik n-nél több gyökkel. A gyöktényezős felbontás tételének az igazolására ismét az xk − αk = (x − α) xk−1 + αxk−2 + α2 xk−3 + . . . + αk−2 x + αk−1
(20)
algebrai azonosságot használjuk fel, amely α = 1 esetében egyszerűen a geometriai sor képlete. Mivel feltételeztük, hogy Gauss tétele igaz, feltehetjük, hogy α = α1 gyöke (17) egyenletnek, úgyhogy f (α1 ) = αn1 + an−1 α1n−1 + an−2 α1n−2 + . . . + a1 α1 + a0 = 0
125
Vonjuk ki ezt az egyenletet f(x)-ből és rendezzük a tagokat, úgy az + . . . + a1 (x − α1 ) f(x) = f(x) − f (α1 ) = (xn − αn1 ) + an−1 xn−1 − αn−1 1
(21)
azonosságot kapjuk. Mármost mivel (20) szerint (21) minden tagjából kiemelhetünk (x − α1 )-et, mindegyik tag másik tényezője egy fokkal alacsonyabb. Újrarendezve a tagokat: f(x) = (x − α1 ) g(x), ahol g(x) a g(x) = xn−1 + bn−2 xn−2 + . . . + b1 x + b0 n − 1-ed fokú polinom. (Jelen célunk szempontjából a bk együtthatók kiszámítása teljesen felesleges.) Ezután ugyanezt az eljárást alkalmazhatjuk g(x)-re is. Gauss tétele szerint van a g(x) = 0 egyenletnek legalább egy α2 gyöke, úgyhogy g(x) = (x − α2 ) h(x), ahol h(x) egy (n − 2)-ed fokú polinom. Ugyanígy járva el összesen (n − 1)-szer egymás után (ez a kifejezés természetesen csak helyettesíti a matematikai indukcióval való bizonyítást) megkapjuk a teljes gyöktényezős felbontást: f(x) = (x − α1 ) (x − α2 ) (x − α3 ) . . . (x − αn ) .
(22)
(22)-ből nemcsak az következik, hogy az α1 , α2 , . . ., αn komplex számok gyökei a (17) egyenletnek, hanem az is, hogy ezek az egyedüli gyökei. Ugyanis ha y a (17) egyenletnek egy gyöke lenne, mely az előbbiektől különböző, akkor (22) szerint f(y) = (y − α1 ) (y − α2 ) . . . (y − αn ) = 0. Láttuk a 118. oldalon, hogy komplex számok szorzata akkor és csak akkor egyenlő nullával, ha a tényezők egyike nulla. Tehát az (y − αr ) tényezők egyike nulla kell legyen, és y egyenlő kell legyen αr -rel, ami bizonyítandó volt.
126
*6. § Algebrai és transzcendens számok 1. Definíciójuk és létezésük Algebrai számnak nevezünk minden olyan valós vagy komplex x számot, amely kielégít valamely an xn + an−1 xn−1 + . . . + a1 x + a0 = 0
(n = 1, an 6= 0)
alakú algebrai egyenletet, ahol az an együtthatók egész számok. Pl.
√
(1)
2 algebrai szám,
mivel kielégíti az x2 − 2 = 0 egyenletet. Hasonlóképpen algebrai szám egy egész együtthatójú harmad-, negyed-, ötödvagy bármely fokú egyenlet bármely gyöke is, függetlenül attól, hogy kifejezhető-e gyökvonással vagy sem. Az algebrai szám fogalma a racionális szám természetes módon adódó általánosítása, a racionális szám az algebrai szám speciális esete, ha n = 1. Nem minden valós szám algebrai szám. Belátható ez egy Cantor által adott bizonyítás segítségével, amely szerint az algebrai számok halmaza megszámlálható. Mivel a valós számok halmaza nem megszámlálható, kell tehát lenni olyan valós számnak, amely nem algebrai szám. Az algebrai számok halmazának megszámlálhatósága a következő módszerrel bizonyítható: minden (1) alakú egyenlethez rendelhető egy h = |an | + |an−1 | + . . . + |a1 | + |a0 | + n egész szám, az egyenlet „magassága”, h minden rögzített értékéhez csak véges számú (1) alakú egyenlet tartozhat. Ezen egyenletek mindegyikének legfeljebb n különböző gyöke lehet. Ezért legfeljebb véges sok olyan algebrai szám létezhet, amelynek megfelelő egyenlet a h-hoz tartozik. Ezeket az algebrai számokat mind elrendezhetjük egy olyan sorozatba, hogy legelöl állanak a h = 1-hez tartozó algebrai számok, azután a h = 2-höz tartozók és így tovább. Az algebrai számok megszámlálhatóságának eme bizonyítása igazolja nem algebrai számok létezését; az ilyen számokat transzcendens számoknak nevezzük, mivel, mint Euler mondotta, „túlhaladják (latin transcendere = átlép, meghalad) az algebrai
127
módszerek teljesítőképességét”. Ez a bizonyítás, amit Cantor a transzcendens számok létezésére adott, nem konstruktív bizonyítás. Elméletileg ugyan lehetséges lenne, Cantor diagonális eljárását valamennyi algebrai egyenlet tizedes törtekben kifejezett gyökeinek megszámlált táblázatára alkalmazva, transzcendens számot konstruálni, azonban ez az eljárás egyrészt igen nehézkes lenne, másrészt nem adna olyan számot, amelyik a tízes vagy bármely más számrendszerben ténylegesen is leírható lenne. Márpedig a transzcendens számokra vonatkozó kérdések között a legérdekesebb éppen annak a bizonyítása, hogy egyes meghatározott számok, pl. a π és az e (ezeket a számokat a 358., ill. 361. oldalon fogjuk definiálni) ténylegesen transzcendens számok. **2. Liouville tétele és transzcendens számok előállítása A transzcendens számok létezését még a Cantor-féle bizonyítás előtt megadta J. Liouville (1809–1882). Liouville bizonyítása lehetővé teszi, hogy konstruáljunk néhány példát ilyen számokra. Valamivel nehezebb, mint a Cantor-féle bizonyítás, amint általában minden konstruktív bizonyítás nehezebb, mint a megfelelő egzisztenciabizonyítás. A bizonyítást csak a matematikában járatos olvasók kedvéért hozzuk, bár voltaképpen nem igényel középiskolait meghaladó matematikai előképzettséget. Liouville kimutatta, hogy az algebrai számok között azok az irracionálisak, amelyeket csak akkor lehet nagy pontossággal racionális számokkal megközelíteni, ha a megközelítő törtek nevezői igen nagyok. Tegyük fel, hogy a z szám kielégíti az f(x) = a0 + a1 x + a2 x2 + . . . + an xn = 0
(an 6= 0)
(2)
egész együtthatójú egyenletet, de nem elégít ki egyetlen alacsonyabb fokú ilyen egyenletet √ sem. Ebben az esetben z-t n-ed fokú algebrai számnak nevezzük. Pl. z = 2 másodfokú algebrai szám, mert behelyettesíthető az x2 − 2 = 0 egyenletbe, de nem elégít ki egyetlen √ elsőfokú egyenletet sem; z = 3 2 harmadfokú, mivel az x3 − 2 = 0 egyenletet elégíti ki és, amint azt a III. fejezetben látjuk majd, nem elégít ki egyetlen alacsonyabb fokú egyenletet sem. n > 1 esetében valamely n-ed fokú algebrai szám nem lehet racionális
128
szám, hiszen bármely z = p/q racionális szám kielégíti a qx − p = 0 elsőfokú egyenletet. Mármost minden z irracionális szám tetszőleges pontossággal megközelíthető racionális számokkal; ez azt jelenti, hogy megadhatjuk racionális számok egyre nagyobb nevezőkkel rendelkező p1 p2 pr , ,..., q1 q2 qr sorozatát úgy, hogy pr →z qr érvényes legyen. Liouville tétele azt állítja: bármely z algebrai számra, amelynek a foka n > 1, egy ilyen megközelítés pontosságának kisebbnek kell lennie, mint 1/qn+1 ; azaz elegendő nagy q nevezők esetén érvényes kell legyen az p z − > 1 q qn+1
(3)
egyenlőtlenség. Mielőtt a tételt bebizonyítanánk, kimutatjuk, hogy lehetővé teszi transzcendens számok konstruálását. Tekintsük a z = a1 · 10−1! + a2 · 10−2! + a3 · 10−3! + . . . + + am · 10−m! + am+1 · 10−(m+1)! + . . . = = 0, a1 a2 000a3 00000000000000000a4 0000000 . . . számot (az n! jelölés definícióját lásd a 20. oldalon), ahol az ai -k tetszőleges számjegyek 1 és 9 között (választhatnánk pl. minden ai -t 1-nek). Egy ilyen számban 0-k gyorsan növekedő szakaszait szakítják meg nullától különböző számjegyek. Jelölje zm azt a z véges tizedes törtet, amely am · 10−m! -ig bezárólag vett tagjaiból áll. Akkor |z − zm | < 10 · 10−(m+1)!
(4)
Feltéve, hogy z algebrailag n-ed fokú. Helyettesítsük (3)-ba a p/q = zm = p/10m! értéket, így |z − zm | >
1 10(n+1)m!
129
elegendően nagy m-re. Kapcsolva ezt (4)-gyel, 1 10(n+1)m!
(m + 1)! − 1 lenne minden elegendően nagy m értékre. Azonban ez az állítás minden n-nél nagyobb m-re hamis (részletes igazolását az olvasóra bízzuk), s így ellentmondásra jutunk. Tehát z transzcendens. Hátra van még Liouville tételének a bizonyítása. Tegyük fel, hogy z n-ed fokú algebrai szám (n > 1), amely kielégíti (1) egyenletet, úgyhogy f(z) = 0.
(5)
Legyen zm = pm /qm racionális számok sorozata, amelyben zm → z. Akkor f (zm ) = f (zm ) − f(z) = a1 (zm − z) + a2 z2m − z2 + . . . + an (znm − zn ) Osszunk az egyenlet mindkét oldalán zm − z kifejezéssel, és alkalmazzuk az un − vn = un−1 + un−2 v + un−3 v2 + . . . + uvn−2 + vn−1 u−v algebrai azonosságot, akkor azt nyerjük, hogy f (zm ) = a1 +a2 (zm + z) + a3 z2m + zm z + z2 + . . . zm − z n−1 + an zn−1 m + ... + z
(6)
Mivel zm mint határértékhez z-hez tart, elegendően nagy m esetében 1-nél kevesebbel fog különbözni z-től. Azért elegendően nagy m esetén felírhatjuk a következő durva becslést: f (zm ) 2 zm − z < |a1 | + 2 |a2 | (|z| + 1) + 3 |a3 | (|z| + 1) +
(7)
+ . . . + n |an | (|z| + 1)n−1 = M, ahol M meghatározott szám, mivel z feltevésünk szerint meghatározott szám. Ha most
130
m-et olyan nagynak választjuk, hogy zm = pm /qm -ben a qm nevező nagyobb, mint M, akkor |z − zm | >
|f (zm )| |f (zm )| > . M qm
(8)
Jelöljük rövidség okából pm -et p-vel és qm -et q-val, akkor a0 qn + a1 qn−1 p + . . . + an pn . |f (zm )| = qn
(9)
Mármost a zm = p/q racionális szám nem lehet gyöke az f(x) = 0 egyenletnek, mivel ebben az esetben kiemelhetnénk f(x)-ből (x − zm ) tényezőt, és z akkor n-nél alacsonyabb fokú egyenletet is kielégítene. Tehát f(zm ) 6= 0. De a (9) jobb oldalának a számlálója egész szám, így legalább 1-nek kell lennie. Tehát (8) és (9)-ből |z − zm | >
1 1 1 · n = n+1 , q q q
(10)
s ezzel a tételt bebizonyítottuk. A legutóbbi néhány évtized alatt sokkal messzebb jutottak az algebrai számok racionális számokkal való megközelítésének a lehetőségében. Például A. Thue (1863–1922) norvég matematikus bebizonyította, hogy a (3) alatt megadott Liouville-féle egyenlőtlenségben az n + 1 kitevő felcserélhető (n/2) + 1 + ε-nal, (ahol ε tetszőlegesen kicsi pozitív szám). Később C. L. Siegel kimutatta, hogy a még élesebb állítás (élesebb nagy √ n-re) érvényes 2 n kitevővel. Legújabban K. F. Roth még azt is bebizonyította, hogy – a z algebrai szám n fokszámától függetlenül – minden 2 + ε szám elfogadható kitevő a (3) egyenlőtlenségben, míg maga a 2 már nem fogadható el. A transzcendens számok felfedezésük óta rendkívül érdekelték a matematikusokat. De a legutóbbi időkig csak igen kevés, önmagában véve fontos számról sikerült csak kimutatni, hogy transzcendens. (A III. fejezetben tárgyaljuk majd π transzcendens voltát, amiből következik a kör körzővel és vonalzóval való négyszögesítésének a lehetetlensége.) David Hilbert 1900-ban a párizsi nemzetközi matematikus kongresszuson tartott híres előadásában harminc olyan egyszerűen, egyes esetekben elemi matematikai, sőt köznyelven megfogalmazható matematikai problémát vetett fel, amelyek egyszerű megfogalmazhatóságuk ellenére megoldatlanok voltak, és az akkori matematikai technika
131
számára nem is látszottak egyhamar megoldhatónak. Ezek a „Hilbert-féle problémák” kihívásként állottak a következő korszak matematikai fejlődése előtt. Azóta majdnem mindet megoldották, s a megoldás gyakran nagy haladást jelentett a matematikai megismerés és az általános módszerek tekintetében. Az egyik legreménytelenebbnek látszó probléma annak a bizonyítása volt, hogy √
2
2
transzcendens, vagy akár csak, hogy irracionális szám. Csaknem három évtizeden át a leghalványabb remény sem mutatkozott arra, hogy valamilyen irányból meg lehetne közelíteni a problémát. Végül Siegel és tőle függetlenül az akkor ifjú szovjet matematikus, A. Gelfond, majd Siegel tanítványa, Th. Schneider új módszereket fedeztek fel számos, a matematikában fontos szerepet játszó szám transzcendens voltának bizonyítására, beleértve a Hilbert-féle 2
√
2
számot, s általánosabban. minden ab számot, ahol a olyan
algebrai szám, amely nem egyenlő 0-val vagy 1-gyel és b tetszőleges irracionális algebrai szám.
132
Kiegészítés a II. fejezethez. A halmazalgebra elemei 1. Általános elmélet Tárgyak osztályának vagy halmazának a fogalma a matematika legalapvetőbb fogalmai közé tartozik. Egy halmazt bármely U tulajdonsággal vagy sajátsággal definiálni lehet, amellyel a tekintett tárgyak mindegyikének vagy rendelkeznie kell, vagy nem. Azok a tárgyak, amelyek rendelkeznek a mondott U tulajdonsággal, képezik a tulajdonságnak megfelelő A halmazt. Így pl. ha az egész számokat tekintjük és az U tulajdonság abból áll, hogy a szám prím legyen, akkor a megfelelő A halmaz az összes 2, 3, 5, 7, . . . prímszám halmaza. A halmazok matematikai vizsgálata azon a tényen alapul, hogy a halmazok egyes műveletekkel újabb halmazokká kapcsolhatók, akárcsak a számok az összeadással és a szorzással. A halmazokkal végezhető műveletek alkotják a „halmazalgebrát”, amelynek sok rokon vonása van a közönséges számok algebrájával, de sokban különbözik is tőle. Az a tény, hogy algebrai módszereket lehet alkalmazni nem számszerű objektumok tanulmányozásában, mint amilyenek a halmazok, a modern matematikai fogalmak nagy általánosságának egyik szép példája. Az utóbbi években kiderült, hogy a halmazalgebra segítségével a matematika számos ága, pl. a mértékelmélet és a valószínűségszámítás, áttekinthetőbbé tehető. Fontos szerepe van továbbá a halmazalgebrának abban is, hogy a matematikai fogalmakat szisztematikusan vissza lehessen vezetni logikai alapjukra. A következőkben jelentse I tetszőleges természetű tárgyak valamely meghatározott halmazát. I-t „alaphalmaz”-nak vagy „gondolkozási tartomány”-nak1 nevezzük. Jelentsék A, B, C, . . . I tetszőleges részhalmazait. Ha pl. I az egész számok halmazát jelenti, A jelentheti a páros egész számok halmazát, B a páratlan egész számokét, C a prímszámokét és így tovább. Vagy jelentheti I egy rögzített sík pontjainak a halmazát, A azon pontok halmazát, amelyek valamely adott körön belül feküsznek a síkon, B azon pontok halmazát, 1
Így fordíthatjuk magyarra az „universe of discourse”-t. A gondolkozási tartomány fogalmát és elnevezését Kőnig Gyula vezette be a halmazelméletbe. (A fordító megjegyzése.)
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173307+02’00’
133
amelyek egy másik kör belsejében fekszenek ugyanezen a síkon stb. Kényelem okából I összes „részhalmazai”-hoz számítjuk magát I-t is és a 0 „üres halmazt” is, amely egyetlen elemet sem tartalmaz. Ennek a mesterkéltnek ható kibővítésnek az a célja, hogy megtarthassuk azt a szabályt, ami szerint minden U tulajdonságnak megfelel I elemeinek olyan A halmaza, melynek elemei rendelkeznek a kérdéses U tulajdonsággal. Abban az esetben, ha U valamely általánosan érvényes tulajdonság, pl. olyan, amilyent az x = x triviális egyenlet fejez ki, I megfelelő részhalmaza maga I lesz, mivel ezt az egyenletet minden objektum kielégíti, míg ha U valamely önmagának ellentmondó tulajdonság, pl. x 6= x, akkor a megfelelő részhalmaz egyetlen objektumot sem fog tartalmazni, és így a 0 jellel jelölhetjük. A halmazt B halmaz részhalmazának nevezzük, ha A-nak egyetlen olyan eleme sincs, amely ne lenne egyúttal B-nek is eleme. Ha ez az eset áll fenn, ezt a tényt vagy
A⊂B
B⊃A
jellel jelöljük. Például azon egész számok A halmaza, amelyek 10 többszörösei, részhalmaza azon egész számok B halmazának, amelyek 5 többszörösei, mivel 10 minden többszöröse egyben 5-nek is többszöröse. Az A ⊂ B állítás nem zárja ki a B ⊂ A állítás lehetőségét. Ha mind a két reláció érvényes, azt mondjuk, hogy az A és B halmaz egyenlő. Jelekben A = B. Ehhez A minden elemének egyenlőnek kell lenni B egy elemével és megfordítva, úgy hogy A és B halmazok ebben az esetben pontosan ugyanazokat az elemeket tartalmazzák. Az A ⊂ B reláció sok tekintetben hasonlít a valós számok között fennálló a 5 b relációhoz. Mindenekelőtt itt is igaz, hogy 1. A ⊂ A. 2. Ha A ⊂ B és B ⊂ A, akkor A = B. 3. Ha A ⊂ B és B ⊂ C, akkor A ⊂ C. Éppen ezért az A ⊂ B relációt „rendezési reláció”-nak is nevezik. Lényegesen különbözik a számokra érvényes a 5 b relációtól abban, hogy míg a számok esetében minden a, b számpárra fennáll az a 5 b vagy b 5 a relációk valamelyike, a halmazok esetében ez
134
nem igaz. Pl. ha A az 1, 2, 3 egész számokból álló A = {1, 2, 3} halmazt jelenti, B pedig a 2, 3, 4 egész számokból álló B = {2, 3, 4} halmazt, akkor sem A ⊂ B sem B ⊂ A nem érvényes. Éppen ezért azt mondjuk, hogy az A ⊂ B reláció parciális rendezést létesít a halmazok között, az a 5 b reláció pedig teljes rendezést a számok között. Közbevetőleg megjegyezzük, hogy az A ⊂ B reláció definíciójából következik, hogy 4. 0 ⊂ A bármely A halmazra, és 5. A ⊂ I, ahol A az I alaphalmaz tetszőleges részhalmaza. A 4. reláció talán kissé paradoxnak látszik, azonban összhangban van a ⊂ jel szigorú értelmezésével. A 0 ⊂ A állítás ugyanis csak akkor lehetne hamis, ha a 0 üres halmaz tartalmazna egy olyan elemet, amely nem eleme A-nak, és mivel az üres halmaz egyetlen elemet sem tartalmazhat, ez teljességgel lehetetlen, akármiféle halmaz is A. Most két olyan műveletet definiálunk a halmazokra, amelyek a számok közönséges összeadásának és szorzásának sok tulajdonságával rendelkeznek, bár fogalmilag meglehetősen különböznek ezektől a műveletektől. Legyen A és B két tetszőleges halmaz. A és B halmaz „egyesítésén” vagy „logikai összegén” azt a halmazt értjük, amelynek az elemei A és B halmaz közül legalább az egyikhez hozzátartoznak (beleértve az összes olyan elemet is, amely mind a kettőnek eleme). Ezt a halmazt A + B jellel jelöljük. A és B „közös részén” vagy „logikai szorzatán” azt a halmazt értjük, melynek az elemei mindkét halmazhoz hozzátartoznak. Ezt a halmazt A · B vagy egyszerűen AB jellel jelöljük. Vegyük példa kedvéért ismét az előbbi A és B halmazt: A = {1, 2, 3},
B = {2, 3, 4}
135
Akkor A + B = {1, 2, 3, 4},
AB = {2, 3}
Az A + B és AB műveletek fontos algebrai tulajdonságai közül az alábbiakban felsorolunk néhányat. Igazolja az olvasó ezeket a műveletek definíciója alapján. 6. A + B = B + A 7. AB = BA 8. A + (B + C) = (A + B) + C 9. A(BC) = (AB)C 10. A + A = A 11. AA = A 12. A(B + C) = (AB + AC) 13. A + BC = (A + B)(A + C) 14. A + 0 = A 15. AI = A 16. A + I = I 17. A0 = 0 18. Az A ⊂ B reláció ekvivalens az A + B = B és AB = B relációk valamelyikével. A fenti törvények igazolása az elemi logika körébe tartozik. Pl. 10. azt állítja, hogy azon objektumokból álló halmaz, amelyek vagy A-ban vagy A-ban vannak, pontosan az A halmaz; 12. pedig azt állítja, hogy azon objektumoknak a halmaza, amelyek A-ban és egyúttal B és C halmaz közül legalább az egyikben vannak, ugyanaz, mint azon objektumoknak a halmaza, amelyek A és B közös része és A és C közös része közül legalább az egyikhez hozzátartoznak. Ennél és más ilyen törvényeknél használt logikai érvelés szemléltethető, ha az A, B, C halmazokat síktartományokkal ábrázoljuk, csak ügyelni kell, hogy a szereplő halmazoknak egyaránt legyenek páronként közös és nem közös elemeik. Nyilván észrevette az olvasó, hogy a fenti 6., 7., 8., 9., és 12. törvények azonosak az algebra jól ismert kommutatív, asszociatív és disztributív törvényével. Következésképpen a közönséges számalgebra minden olyan szabálya, amely a kommutatív, asszociatív és disztributív törvény következménye, érvényes a halmazalgebrában is. A 10., 11., és
136
26. ábra. Két halmaz egyesített halmaza és közös része 13. törvények azonban, amelyeknek nincs megfelelője a számok körében, egyszerűbb struktúrát eredményeznek a halmazalgebra számára, mint amilyen a számok algebrája. Pl. a közönséges algebra binomiális tételét a halmazalgebrában a következő egyenlőség helyettesíti: (A + B)n = (A + B) · (A + B) · . . . · (A + B) = A + B, amely 11. következménye. A 14., 15. és 17. törvények azt mutatják, hogy 0-nak és I-nek az egyesítés és a közös rész képzés szempontjából ahhoz hasonló sajátságai vannak, mint 0-nak és 1-nek a közönséges összeadás és szorzás szempontjából. A 16. törvénynek nincs megfelelője a számok algebrájában. Hátra van a halmazalgebra még egy műveletének a definiálása. Legyen A az I alaphalmaz tetszőleges részhalmaza. A halmaz I-re vonatkoztatott komplementer vagy kiegészítő halmazának azt a halmazt nevezzük, amely azon I-beli objektumok összességéből áll, melyek nem foglaltatnak benne A-ban. Ezt a halmazt A 0 jellel jelöljük. Így pl. ha I a természetes számok halmaza és A a prímszámok halmaza, A 0 1-ből és az összetett számokból áll. Az A 0 műveletnek, amelynek nincs pontos megfelelője a számok algebrájában, a következő sajátságai vannak. 19. A + A 0 = I 20. AA 0 = 0 21. 0 0 = I 22. I 0 = 0 23. A0 0 = A 24. Az A ⊂ B reláció ekvivalens a B 0 ⊂ A 0 relációval.
137
25. (A + B) 0 = A 0 B 0 26. (AB) 0 = A 0 + B 0 . Ezeknek a törvényeknek az igazolását újból az olvasóra bízzuk. Az 1-től 26. alatt felsorolt törvények képezik a halmazalgebra alapját. Figyelemreméltó sajtságuk a „dualitás”, ami a következőképpen értendő: Ha a fenti 1–26. törvények valamelyikében a benne előforduló ⊂ és ⊃ 0 és
I
+ és
·
jeleket (amennyiben előfordulnak) mindenütt felcseréljük, az eredmény újból ezen törvények valamelyike lesz. Pl. a 6. törvényből 7., a 12-ből 13., 17.-ből 16. lesz stb. Következésképpen minden tételhez, amely az 1–26. törvények alapján bebizonyítható, tartozik egy másik „duál” tétel, amelyet a most mondott felcserélés útján nyerünk. Ugyanis, mivel bármely tétel igazolása a fenti 1–26. törvény lépésenkénti alkalmazásából áll, minden egyes lépésben a duál törvényt alkalmazva, a megfelelő duál tétel igazolását kapjuk. (A hasonló geometriai dualitást a IV. fejezetben fogjuk tárgyalni.)
2. A halmazalgebra alkalmazása a matematikai logikában A halmazalgebra törvényeinek az igazolása az A ⊂ B reláció és az A + B, AB, A 0 műveletek logikai jelentésének az analízisen alapult. Ezt a folyamatot megfordíthatjuk, és a fenti 1–26. törvényeket használhatjuk a „logika algebrájá”-nak a megalapozására. Pontosabban, a logika ama része, amely halmazokkal, vagy, ami ezzel ekvivalens, dolgok tulajdonságaival vagy attribútumaival foglalkozik, az 1–26. törvényeken alapuló formális algebrai rendszerre redukálható. A logika „gondolkozási tartománya” definiálja az I halmazt; a dolgok minden U tulajdonsága vagy attribútuma definiál egy A halmazt, azt, amely I ama objektumaiból áll, melyek rendelkeznek az illető A attribútummal. A megszokott logikai terminológia halmazalgebrai nyelvre való átírását az alábbi példák
138
szemléltetik: „Vagy A vagy B”
A+B
„A és B”
AB
„Nem A”
A0
„Sem A sem B”
(A + B) 0 ≡ A 0 B 0
„Nem A és B egyszerre”
(AB) 0 ≡ A 0 + B 0
„Minden AB”
A⊂B
„Ha A akkor B”
A⊂B
„A implikálja B-t”
A⊂B
„Némely A B”
AB 6= 0
„Egy A sem B”
AB = 0
„Némely A nem B”
AB 0 6= 0
„Nincs olyan A”
A=0
A halmazalgebra jelölési módjában pl. a „Barbara” szillogizmus, amely azt állítja, hogy: „Ha minden A B és minden B C, akkor minden A egyúttal C”, egyszerűen így írható fel: 3. Ha
A⊂B
és
B ⊂ C akkor
A ⊂ C.
Hasonlóképpen az „ellentmondás törvénye”, amelyik azt állítja, hogy „nem lehet, hogy valamely dolognak legyen is egy adott tulajdonsága, meg ne is legyen” egyszerűen 20. AA 0 = 0 alakban írható, a „harmadik kizárásának az elve” pedig, amely azt állítja, hogy „valamely dolog szükségképpen vagy rendelkezik egy bizonyos tulajdonsággal, vagy nem”, egyszerűen 19. A + A 0 = I
139
lesz. Ezek szerint a logikának az a része, amely kifejezhető a ⊂, +, ·,
0
szimbólumok
segítségével, olyan formális algebrai rendszerként kezelhető, amely az 1–26. törvényeknek tesz eleget. A logikai analízisnek ez a matematikával való ötvözése új diszciplinát eredményezett, a matematikai logikát, amely jelenleg rohamosan fejlődik. Az axiomatikus felépítés szempontjából igen figyelemre méltó az a tény, hogy az 1–26. állítások, a halmazalgebra egyéb tételeivel együtt, levezethetők az alábbi három egyenletből: 27. A+B=B+A (A + B) + C = A + (B + C) (A 0 + B 0 ) 0 + (A 0 + B 0 ) = A. Következésképpen a halmazalgebra éppen úgy felépíthető tisztán deduktív elméletként, akárcsak az euklidészi geometria, ha ezt a három állítást tekintjük axiómának. Ebben az esetben az AB műveletet és az A ⊂ B relációt definiálni kell A + B és A 0 segítségével: AB jelentse az (A 0 + B 0 ) halmazt, A ⊂ B jelentse azt, hogy A + B = B. Egészen másfajta, de a halmazalgebra minden formális törvényét kielégítő matematikai rendszer példája lehet a következő nyolc szám: 1, 2, 3, 5, 6, 10, 15, 30, ha a + b-t az a és b legkisebb közös többszöröseként definiáljuk, ab-t mint az a és b legnagyobb közös osztóját, a ⊂ b alatt pedig azt az állítást értjük, hogy „a osztója b-nek”, továbbá a 30/a számot tekintjük a 0 -nek. Az ilyen példák létezése vezetett a (27) törvényeket kielégítő általános algebrai rendszerek vizsgálatára. Az ilyen rendszereket Boole algebrák nak hívják, George Boole (1815–1864) angol matematikus és logikus tiszteletére, akinek An Investigation of the Laws of Thought 2 című könyve 1854-ben jelent meg.
3. A halmazalgebra alkalmazásáról a valószínűségszámításban A halmazalgebra jelentősége a valószínűségszámításban is igen nagy. Hogy csak a legegyszerűbb esetet említsük, tekintsünk egy kísérletet, amelynek a végeredménye véges számú lehetőség 2
A gondolkozás törvényeinek a vizsgálata.
140
valamelyike, s a lehetőségeket mind „egyformán valószínűek”-nek tételezzük fel. Állhat pl. a kísérlet abból, hogy 52 jól összekevert kártya közül kell kihúzni egyet. Ha a kísérlet összes lehetséges eredményének a halmazát I-vel jelöljük, I valamely tetszőleges részhalmazát pedig A-val, akkor annak a valószínűségét, hogy a kísérlet eredménye az A részhalmazba fog tartozni a p(A) =
A elemeinek a száma I elemeinek a száma
arány definiálja. Ha egy tetszőleges A halmaz elemeinek a számát n(A) szimbólummal jelöljük, akkor ez a definíció p(A) =
n(A) n(I)
(1)
alakba írható. Ha példánkban A a „Coeur”-kártyák részhalmazát jelenti, n(A) = 13, n(I) = 52 és p(A) =
13 1 = . 52 4
A halmazalgebra fogalmai akkor lépnek be a valószínűségek számításába, ha bizonyos halmazok valószínűségeinek az ismeretében más halmazok valószínűségeit akarjuk kiszámítani. Például p(A), p(B) és p(AB) ismeretében kiszámíthatjuk a p(A + B) valószínűséget: p(A + B) = p(A) + p(B) − p(AB).
(2)
A bizonyítás egyszerű. Ugyanis n(A + B) = n(A) + n(B) − n(AB), mivel A és B közös elemeit, azaz AB elemeit, az n(A)+n(B) összegben kétszer vesszük figyelembe, és ezért le kell vonnunk n(AB)-t ebből az összegből, ha az n(A + B) számot akarjuk megkapni. Az egyenlet mindegyik tagját osztva n(I)-vel, megkapjuk (2) egyenletet. Érdekesebb képletet kapunk, ha I három, A, B, C részhalmazát tekintjük. (2)-ből: p(A + B + C) = p[(A + B) + C] = p(A + B) + p(C) − p[(A + B)C]. A megelőző pont 12. szabálya szerint (A + B)C = AC + BC. Tehát p[(A + B)C] = p(AC + BC) = p(AC) + p(BC) − p(ABC). Az előbbi egyenletbe p[(A + B)C] eme értékét és p(A + B) (2)-ben megadott értékét behelyette-
141
sítve, megkapjuk a keresett képletet: p(A + B + C) = p(A) + p(B) + p(C) − p(AB) − p(AC) − p(BC) + p(ABC).
(3)
Tekintsük példaként a következő kísérletet. Az 1, 2, 3 számjegyeket írjuk le véletlen sorrendben. Mi lesz a valószínűsége annak, hogy a három számjegy közül legalább egy a saját helyén fordul elő? Jelölje A azon elrendezések halmazát, amelyekben az 1 számjegy áll az első helyen, B azon elrendezések halmazát, amelyekben a 2 számjegy a második helyen áll, C azon elrendezések halmazát, amelyekben a harmadik helyen a 3 számjegy áll. A p(A + B + C) valószínűséget akarjuk kiszámítani. Nyilvánvaló, hogy p(A) = p(B) = p(C) =
2 1 = ; 6 3
mert ha egy számjegy a saját helyén áll, akkor a fennmaradó számjegyek számára a három számjegy összes lehetséges 3 · 2 · 1 = 6 elrendezéséből két lehetséges elrendezés marad. Továbbá p(AB) = p(AC) = p(BC) =
1 1 = ; 6 6
és 1 p(ABC) = , 6 mivel csak egy eset van, amelyben A, B és C elrendezés egyszerre fordul elő. Következik (3)-ból, hogy p(A + B + C) = 3 ·
1 1 1 1 1 2 − 3 · + = 1 − + = = 0, 6666 . . . 3 6 6 2 6 3
Feladat: Adjuk meg a megfelelő formulát p(A + B + C + D) számára, és alkalmazzuk négy számjegy esetére. A megfelelő valószínűség 5/8 = 0, 6250. n részhalmaz egyesítését a (4)
p(A1 + A2 + . . . + An ) = X 1
p(Ai ) −
X
p(Ai Aj ) +
2
általános képlet adja meg, ahol a
142
X
p(Ai Aj Ak ) − . . . ± p(A1 A2 . . . An )
3
P
1,
P
2,
P
3,
. . .,
P n−1
jelek az A1 , A2 , . . ., An halmazok
összes lehetséges kombinációinak az összegét jelentik, egyszer, kétszer, háromszor, . . ., (n−1)-szer véve egy-egy alkalommal. Ezt a képletet matematikai indukcióval lehet ugyanúgy bizonyítani, mint ahogyan (3)-at vezettük le (2)-ből. (4)-ből könnyű kimutatni, hogy ha az n számú 1, 2, 3, . . ., n számjegyet véletlenszerű sorrendben jegyezzük fel, annak a valószínűsége, hogy legalább egy számjegy a saját helyén forduljon elő pn = 1 −
1 1 1 1 + − ... ± , 2! 3! 4! n!
(5)
ahol plusz vagy mínusz előjellel kell venni aszerint, hogy n páratlan vagy páros. Speciálisan, n = 5-re ez a valószínűség p5 = 1 −
1 1 1 1 19 + − + = = 0, 63333 . . . . 2! 3! 4! 5! 30
Látjuk majd a VIII. fejezetben, hogy ha n tart a végtelenhez, akkor az Sn =
1 1 1 1 − + − ... ± 2! 3! 4! n!
kifejezés az 1/e határértékhez tart, amelynek az értéke öt tizedes pontosságig 0, 36788. Mivel (5)-ből pn = 1 − Sn , n tart a végtelenhez esetére pn → 1 −
1 = 0, 63212 . . . . e
143
144
III. fejezet. Geometriai szerkesztések. Számtestek algebrája Bevezetés Szerkesztési problémák mindig kedvenc tárgyai voltak a geometriának. Az olvasó még diákkorából emlékezhet, hogy számos szerkesztés végezhető el csupán körzővel és vonalzóval. Így lehet pl. vonalszakaszt vagy szöget két részre osztani, lehet egy adott pontból merőlegest bocsátani egy adott egyenesre, be lehet írni hatszöget körbe stb. Mindezekben a problémákban a vonalzó szerepe csupán az egyenes élé, arra szolgál, hogy egyenes vonalakat húzzunk vele, nem pedig távolságok mérésére vagy kijelölésére. A körző és vonalzó egyedüli használatának a tradíciója az ókorig nyúlik vissza, bár maguk a görögök nem riadtak vissza más rajzeszközök használatától sem. A klasszikus szerkesztési problémák körében az egyik leghíresebb az ún. Apollónioszféle (i.e. 200 körül) érintési probléma, amelyben három tetszőleges kör van adva a síkon, és keresni kell olyan negyedik kört, amely mindhárom adott kört érinti. Speciális esetként meg van engedve, hogy az adott körök közül egy vagy több ponttá vagy egyenessé degenerálódhasson (nulla illetve „végtelen” sugarú „körré”). Pl. lehet a feladat az, hogy szerkesszünk két adott egyenest érintő és egy adott ponton átmenő kört. Az ilyen és ehhez hasonló speciális eseteket elég könnyű megoldani, de az általános probléma megoldása sokkal nehezebb. Minden körzővel és vonalzóval elvégezhető szerkesztés közül talán az n oldalú szabályos poligon szerkesztése a legfontosabb. n bizonyos értékei – pl. n = 3, 4, 5, 6 – esetében már az antik tudomány is ismerte a megoldást, amely kedvelt része az iskolában oktatott geometriának. De pl. a hétszög (n = 7) szerkesztése lehetetlennek bizonyult. Van három további klasszikus görög probléma is, amelynek hiába keresték a megoldását: tetszőleges szög harmadolása, adott kocka megkettőzése (azaz olyan kocka élének a megkeresése, melynek térfogata kétszerese az adott élű kocka térfogatának) és a kör négyszögesítése
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526103649+02’00’
145
vagy kvadratúrája (azaz szerkeszteni egy olyan négyzetet, amelynek területe egyenlő egy adott kör területével). Mindezen problémák megoldásához csak körző és vonalzó használata van megengedve. Az ilyenféle megoldatlan problémákkal való foglalkozás figyelemre méltó új fejlődésre vezetett a matematikában. Évszázadokig tartó meddő próbálkozások után felmerült annak a gyanúja, hogy ezek a problémák talán véglegesen megoldhatatlanok. Így a matematikusok kezdték vizsgálni azt a kérdést, hogy hogyan lehet bebizonyítani valamely problémáról azt, hogy megoldhatatlan? Az algebrában az ötöd- és magasabb fokú egyenletek megoldásának a kérdése vezette be ezt az új gondolkozási módot. A XVI. század folyamán rájöttek a matematikusok arra, hogyan kell a harmad- és negyedfokú egyenleteket a másodfokú egyenletek megoldására használt módszerhez hasonló, egyszerű elemi módszerekkel megoldani. Ezeknek a módszereknek közös jellemzője az, hogy az egyenlet megoldása vagy „gyöke” mindig felírható az egyenlet együtthatóiból racionális műveletek – összeadás, kivonás, szorzás, osztás – és négyzet-, köb-, vagy negyedik gyökvonás útján kapott algebrai kifejezés formájában. Azt szoktuk éppen ezért mondani, hogy az algebrai egyenletek a negyedfokú egyenletekkel bezárólag megoldhatók „gyökvonás” útján. Mi sem látszott természetesebbnek, mint hogy ezt az eljárást az ötöd- és magasabb fokú egyenletekre is kiterjesszék, a megfelelő magasabb fokú gyökvonás alkalmazásával. Azonban minden ilyen kísérlet meghiúsult. A XVIII. században még elsőrendű matematikusok is áltatták magukat azzal, hogy megtalálták a megoldást, míg végül a XIX. század elején Ruffini (1765–1822) olasz matematikus és a nagy norvég géniusz, N. H. Abel (1802–1829) arra az akkor forradalmi gondolatra jutottak, hogy bebizonyítsák, az általános n-edfokú algebrai egyenletet lehetetlen gyökvonás útján megoldani. Értsük meg világosan: nem az a kérdés, vajon van-e az n-ed fokú algebrai egyenletnek megoldása. Gauss 1799-es doktori értekezésében bebizonyította, hogy van. Így egy egyenlet gyökeinek a létezéséhez nem férhet semmi kétség, kiváltképpen mivel ezeket a gyököket alkalmas számítási módszerekkel tetszőleges pontosságig meg lehet adni. Az egyenletek numerikus megoldásának a kérdése igen fontos, és nagyon fejlett elmélet kialakulását eredményezte. Azonban Abel és Ruffini problémája egészen más valami volt: ők azt kérdezték, vajon megkapható-e a megoldás pusztán a racionális műveletek és gyökvonások segítségével? Az az óhaj, hogy ebben
146
a kérdésben tisztán lássanak, vezetett a modern algebra és a csoportelmélet nagyszerű felvirágzására, Ruffini, Abel és Galois (1811–1832) úttörő munkája nyomán. Az algebra ezen irányzatának a legegyszerűbb példáit az egyes geometriai szerkesztések lehetetlenségének a bizonyítása szolgáltatja. Ebben a fejezetben be fogjuk bizonyítani algebrai fogalmak használatával, hogy lehetetlen a szögharmadolást, a szabályos hétszög szerkesztést és a kockamegkettőzést pusztán körző és vonalzó segítségével megszerkeszteni. (A kör négyszögesítésének problémáját sokkal nehezebb elintézni, l. 174. o.) Nem annyira az egyes szerkesztések lehetetlenségének a negatív kérdéséből fogunk kiindulni, hanem abból a pozitív kérdésből, hogy hogyan lehet tökéletesen jellemezni a megszerkeszthető problémák összességét? Ha azután erre a kérdésre megfeleltünk, akkor már könnyű lesz kimutatni, hogy a fentebb említett problémák nem tartoznak ebbe a kategóriába. Tizenhét éves korában Gauss a szabályos p-szög (p-oldalú szabályos sokszög) megszerkeszthetőségének a kérdését vizsgálta abban az esetben, ha p prímszám. A szerkesztés csak p = 3 és p = 5 esetében volt ismeretes. Gauss felfedezte, hogy a szabályos p-szög akkor és csak akkor szerkeszthető meg, ha a p prímszám „Fermat-féle szám”. n
p = 22 + 1. Az első Fermat-féle számok 3, 5, 17, 257, 65537 (l. 30. o.). Az ifjú Gauss ennek a felfedezésnek annyira megörült, hogy elhatározta, nem lesz, mint akarta, filológus, hanem a matematikának és a matematika alkalmazásainak szenteli az életét. Későbbi éveiben is mindig igen büszkén emlegette volt ezt az első nagy felfedezését. Halála után bronz szobrot állítottak neki Göttingában, s a hódolatot keresve sem tudták volna jobban kifejezni, mint úgy, hogy a szobrot szabályos 17-szög alakú talapzatra állították. Ha geometriai szerkesztésekről tárgyalunk, sohasem szabad elfelejteni, hogy nem az a kérdés, vajon megrajzolható-e valamely ábra a gyakorlatban adott pontossággal, hanem az, hogy található-e pusztán körzőt és vonalzót igénybe vevő elméleti megoldás, tökéletesen pontos eszközök feltételezése mellett. Gauss szerkesztéseinek elvi kivitelezhetőségét bizonyította. Elmélete mit sem törődik a tényleges kivitelezéssel, vagy azokkal a módszerekkel amik egyszerűsíthetnék az eljárást, vagy csökkenthetnék a szükséges lépések számát. Az utóbbi kérdések elméleti szempontból sokkal kevésbé fontosak. Gyakorlati szempontból Gauss eljárása korántsem adna olyan jó eredményt, mint amilyent
147
pl. egy jó szögmérővel el lehet érni. Ennek ellenére állandóan felbukkan egész sereg makacs szögharmadoló és körnégyszögesítő, aminek éppen az az oka, hogy félreismerik a geometriai szerkesztések elméleti jellegét, és nem ismerik el a kétségtelen tudományos tényeket. Azok, akik közülük hajlandók megérteni az elemi matematikát, haszonnal forgathatják ennek a fejezetnek a lapjait. Még egyszer hangsúlyozni kívánjuk, hogy a geometriai szerkesztésről alkotott fogalmunk valamilyen módon mesterkéltnek látszik. Körző és vonalzó kétségkívül a legegyszerűbb rajzeszközök, de az ezekre való szorítkozás semmiképpen sem tartozik a geometria belső lényegéhez. A görög matematikusok már réges-régen felismerték, hogy egyes problémák – mint pl. a kocka megkettőzése – megoldhatók, ha engedélyezzük egy derékszög alakú vonalzó használatát. Ugyanígy nagyon könnyű a körzőn kívül másféle eszközöket kitalálni, olyanokat, amelyeknek a segítségével ellipszist, hiperbolát és még bonyolultabb görbéket lehet rajzolni, amely görbéknek a használata igen jelentékenyen kiterjeszti a megszerkeszthető alakzatok világát. A következőkben mégis ragaszkodni fogunk a geometriai szerkesztés standard, csak körző-vonalzó használatát megengedő fogalmához.
148
I. rész. A megoldhatatlanság bizonyítása és az algebra 1. § Alapvető geometriai szerkesztések 1. A négy alapművelet és a gyökvonás mint szerkesztések Tekintsünk a megalapozás kedvéért néhány klasszikus szerkesztést. A mélyebb megértés kulcsa a geometriai problémák algebrai nyelvre történő átírásában keresendő. Bármely geometriai szerkesztési probléma visszavezethető arra az egyszerű formára, hogy ha adva vannak valamely a, b, c vonalszakaszok, keressünk más x, y, . . . vonalszakaszokat. Mindig lehetséges ily módon megfogalmazni a problémát, még ha első pillanatra teljesen eltérőnek látszik is. A keresett vonalszakaszok lehetnek egy megszerkesztendő háromszög oldalai, körök sugarai, vagy egyes pontok derékszögű koordinátái (l. pl. 171. o.). Az egyszerűség kedvéért tételezzük fel, hogy csak egyetlen x vonalszakaszt keresünk. Akkor a geometriai szerkesztés ekvivalens lesz a következő algebrai problémával: először találni kell valamely összefüggést (egyenletet) a keresett x mennyiség és az adott a, b, c mennyiségek között, azután megoldva ezt az egyenletet, meg kell határozni az ismeretlen x mennyiséget, végül el kell döntenünk, vajon ez a megoldás megkapható-e olyan algebrai eljárásokkal, amelyek a körzővel és vonalzóval történő geometriai szerkesztések algebrai megfelelői. Az egész elmélet alapjául a valós számkontinuum bevezetése szolgál, ezen alapul ugyanis a geometriai objektumok valós számokkal való jellemzése, az analitikus geometria alapelve. Először is, vegyük észre, hogy a legegyszerűbb algebrai műveletek egynémelyike elemi geometriai szerkesztéseknek felel meg. Ha adva van két, a és b hoszszúságú vonalszakasz (a hosszúságot egy adott „egységszakasz”-szal mérve), igen könnyű a + b, a − b, ra (ahol r tetszőleges racionális szám), a/b és ab megszerkesztése. Rajzoljunk a + b megszerkesztésére (27. ábra) egyenes vonalat, és jelöljük ki rajta körzővel az OA = a és AB = b szakaszokat. Akkor OB = a + b. Hasonlóképpen, mérjünk fel a − b megszerkesztésére OA = a és AB = b szakaszokat, de ezúttal AB-t OA-val
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526103649+02’00’
149
27. ábra. a + b és a − b megszerkesztése
28. ábra. a/3 megszerkesztése ellenkező irányban. Akkor OB = a − b. 3a megszerkesztésére egyszerűen az a + a + a összeadást végezzük el, hasonlóan szerkeszthetjük meg pa-t, ahol p tetszőleges egész szám. a/3-at a következőképpen szerkeszthetjük meg (28. ábra): mérjük fel OA = a távolságot egy egyenesre és húzzunk O ponton keresztül egy másik, tetszőleges egyenest. Mérjünk fel erre az egyenesre tetszőleges OC = c szakaszt és szerkesszük meg az OD = 3c szakaszt. Kössük össze az A és D pontokat, húzzunk C ponton keresztül párhuzamosat AD-vel mely OA-t B pontban metszi. OBC és OAD háromszögek hasonlóak; tehát OB/a = OB/OA = OC/OD = 1/3 és OB = a/3. Ugyanígy szerkeszthetjük meg a/q-t, ahol q tetszőleges egész szám. Ezt a műveletet pa vonalszakaszon végezve el, megszerkeszthetjük ra-t, ahol r = p/q tetszőleges racionális szám. a/b megszerkesztésére (29. ábra) tetszőleges szög O csúcsából rajzoljunk a szög száraira OB = b és OA = a távolságokat és mérjük fel OB-re az OD = 1 egységszakaszt. Húzzunk D ponton át párhuzamost AB egyenessel, ez C pontban metszi OA egyenest. OC hosszúsága akkor a/b lesz. A 30. ábra mutatja ab megszerkesztését, ahol AD BC-vel
150
29. ábra. a/b megszerkesztése
30. ábra. ab megszerkesztése párhuzamosan húzott egyenes az A ponton át. Ezekből a megfontolásokból következik, hogy a „racionális” algebrai műveletek – ismert mennyiségek összeadása, kivonása, szorzása, osztása – elvégezhetők geometriai szerkesztésekkel. Ezeknek az egyszerű szerkesztéseknek az alkalmazásával bármely adott, a, b, c, . . . valós számokkal mért vonalszakaszból racionális úton, azaz az összeadás, kivonás, szorzás, osztás véges számú alkalmazásával, bármely a, b, c, . . .-vel kifejezhető mennyiséget megszerkeszthetünk. Az a, b, c, . . .-ből ilyen módon nyerhető mennyiségek összessége úgynevezett számtest et képez, olyan számok halmazát, amely számok közül bármely kettőt a racionális műveletek (a négy alapművelet) bármelyikével összekapcsolva, újból ebbe a halmazba tartozó számot kapunk. Emlékezzünk rá, hogy a racionális számok, a valós számok, a komplex számok mind egy-egy ilyen számtestet képeznek. Jelen esetben azt mondjuk, hogy a testet az adott a, b, c, . . . számok generálják.
151
31. ábra.
√ a megszerkesztése
Az a döntő fontosságú szerkesztés, amely túlvisz az éppen most kapott testen, a √ négyzetgyökvonás. Ha adva van egy a szakasz, akkor a is megszerkeszthető pusztán körző és vonalzó használatával. Vigyünk fel egy egyenesre OA = a és AB = 1 szakaszt (31. ábra). Rajzoljunk egy kört OB mint átmérő fölé, és szerkesszünk A pontból merőlegest OB-re. Ez a merőleges C pontban metszi a kört. OBC háromszög derékszögű háromszög és a C-nél levő szög a derékszög, a geometria azon elemi tétele szerint, hogy bármely félkörívhez tartozó kerületi szög derékszög. Tehát OCA^ = ABC^, OAC és CAB derékszögű háromszögek hasonlóak, így x = AC, x a = , x 1
x2 = a,
x=
√
a.
2. Szabályos sokszögek Tekintsünk most néhány bonyolultabb szerkesztési problémát. Kezdjük a szabályos tízszöggel. Tegyük fel, hogy van egy egységsugarú körbe írt szabályos tízszögünk (32. ábra) és jelöljük ennek az oldalát x-szel. Mivel x a kör középpontjánál 36◦ -os szöget határoz meg, a keletkező háromszög másik két szöge 72◦ – 72◦ lesz és így az A-nál levő szöget felező szaggatott vonal OAB háromszöget két egyenlő szárú háromszögre osztja, mindkét egyenlő szárú háromszögben x a szárak hosszúsága. A kör sugarát így két, x és 1 − x szakaszra osztjuk. Mivel OAB hasonló a kisebbik egyenlő szárú háromszöggel,
152
32. ábra. Szabályos tízszög 1/x = x/(1 − x). Ebből az arányból x2 + x − 1 = 0 másodfokú egyenletet kapjuk, √ amelynek a megoldása x = ( 5 − 1)/2. (Az egyenlet másik megoldását nem vesszük figyelembe, mivel negatív.) Nyilvánvaló tehát, hogy x geometriai úton megszerkeszthető. Mármost az x távolság ismeretében megszerkeszthetjük a szabályos tízszöget, tízszer egymás után húrként mérve fel x-et a körre. Szabályos ötszög pedig a szabályos tízszög minden második csúcsának az összekötésével szerkeszthető. Megszerkeszthető
√
5 a 31. ábrán megadott módszer helyett olyan derékszögű háromszög √ átfogójaként is, amelynek befogói 1 és 2. Ekkor x-et úgy kapjuk meg, hogy kivonjuk 5-ből az egységszakaszt, és a maradékot megfelezzük.
A fenti problémában szereplő OB : AB arányt aranymetszésnek nevezték, mivel a görög matematikusok olyan négyszöget tekintettek esztétikai szempontból legtetszetősebbnek, amelynek az oldalai ilyen arányúak. Egyébként az arány számértéke mintegy 1, 62. A szabályos sokszögek közül a szabályos hatszög szerkesztése a legegyszerűbb. Induljunk ki egy r sugarú körből; a körbe írt szabályos hatszög oldalhosszúsága éppen r-rel egyenlő. A hatszög maga megszerkeszthető úgy, hogy az r szakaszokat egymás után felmérjük a körre, így megkapjuk a hatszög csúcsait. A szabályos n-szögből úgy kapunk szabályos 2n-szöget, hogy az n-szög köré írt körnek az n-szög oldalai által meghatározott íveit felezzük, s az így nyert pontok lesznek az
153
33. ábra. Szabályos hatszög eredeti n-szög csúcsaival együtt a 2n-szögünk csúcsai. A kör átmérőjéből kiindulva („2gon”, „2-szög”) megszerkeszthetjük így a 4-, 8-, 16-, . . ., 2n -szöget. Hasonlóan kaphatjuk a hatszögből a 12-, 24-, 48-szöget stb., és a tízszögből a 20-, 40-szöget stb.
34. ábra. Ha sn jelöli az egységsugarú körbe írt szabályos n-szög oldalhosszúságát, akkor a 2n-szög
154
oldalának a hossza r
q 2 − 4 − s2n .
s2n =
Ezt a következőképpen igazolhatjuk: a 34. ábrán sn egyenlő DE-vel és DE = 2DC, s2n egyenlő DB-vel, továbbá AB = 2. Az ABD derékszögű háromszög területét 12 BD · AD és 12 AB · CD adja √ meg. Mivel AD = AB2 − DB2 , azt találjuk, behelyettesítve az AB = 2, BD = s2n , CD = 12 sn értékeket, és a terület két kifejezését egyenlővé téve egymással, hogy sn = s2n
q 4 − s22n
vagy
s2n = s22n (4 − s22n ).
Megoldva ezt a másodfokú egyenletet x = s22n -re, és figyelembe véve, hogy x kisebb kell legyen mint 2, azonnal megkapjuk a bizonyítandó képletet. Ebből a képletből és abból a tényből, hogy s4 (a négyzet oldala) egyenlő
√
2-vel, következik,
hogy r q q √ √ s8 = 2 − 2, s16 = 2 − 2 + 2, s r q √ s32 = 2 − 2 + 2 + 2 stb. Az általános képlet, n > 2 esetére s s2n =
r
2−
q √ 2 + 2 + . . . + 2,
n − 1 egymásba skatulyázott négyzetgyökkel. A körbe írt 2n -szög kerülete 2n s2n . Ha n tart a végtelenhez, a 2n -szög tart a körhöz. Tehát 2n s2n az egységsugarú kör kerületének a hosszúságához tart, amit 2π definiál. Így, m-et helyettesítve n − 1 helyébe, és egyszerűsítve a 2 tényezővel a következő közelítő képletet kapjuk π-re: s m
2 |
2−
r
q √ 2 + 2 + . . . + 2 → π ha m → ∞. {z }
m négyzetgyök
155
Feladat: Mivel 2m → ∞, bizonyítsuk be, hogy s |
r
2+
q √ 2 + 2 + . . . + 2 → 2 ha n → ∞. {z }
n négyzetgyök
Az eddigi eredményeknek a következő közös jellegzetessége van: a 2n -szög, az 5 · 2n szög, a 3·2n -szög oldalai mind megtalálhatók pusztán az összeadás, kivonás, szorzás, osztás és a négyzetgyökvonás műveleteinek a segítségével. *3. Az Apollóniosz-féle feladat Egy másik szerkesztési probléma, amelyik az algebrai tárgyalási mód alapján elég egyszerűen megoldható, a már említett híres Apollóniosz-féle érintési feladat. A jelen összefüggésben nem az a célunk, hogy különlegesen elegáns szerkesztést találjunk rá. Most számunkra az a lényeges, hogy a probléma elvben megoldható pusztán körző és vonalzó használatával. Itt csak röviden jelezzük a bizonyítást, fenntartva a problémát egy elegánsabb, a 201. oldalon közlendő szerkesztéses módszer számára. Legyenek az adott körök középpontjainak a koordinátái rendre (x1 , y1 ); (x2 , y2 ); (x3 , y3 ); sugarai pedig r1 , r2 , r3 . Jelöljük a keresett kör középpontját (x, y)-nal, sugarát r-rel. Azt a feltételt, hogy a keresett kör érintse a három adott kört úgy kapjuk meg, ha figyelembe vesszük, hogy egymást érintő körök középpontjainak a távolsága a sugaraik összegével vagy különbségével egyenlő aszerint, hogy a körök kívülről vagy belülről érintik egymást. Ebből a feltételből a következő egyenleteket kapjuk: (x − x1 )2 + (y − y1 )2 − (r ± r1 )2 = 0,
(1)
(x − x2 )2 + (y − y2 )2 − (r ± r2 )2 = 0,
(2)
(x − x3 )2 + (y − y3 )2 − (r ± r3 )2 = 0,
(3)
x2 + y2 − r2 − 2xx1 − 2yy1 ∓ 2rr1 + x21 + y21 − r21 = 0,
(1a)
vagy
stb. A plusz vagy a mínusz jelet ezen egyenletek mindegyikében aszerint választjuk, hogy
156
a körök kívülről vagy belülről érintik egymást (l. 35. ábra). Az (1), (2), (3) egyenletek három ismeretlenű – az ismeretlenek x, y, r – egyenletek, s amint az (1a) kifejtett alakból látszik, a négyzetes tagok mindegyik egyenletben azonosak. Tehát kivonva (2)-t (1)-ből, lineáris egyenletet kapunk x, y, r-re: ax + by + cr = d,
(4)
ahol a = 2(x2 − x1 ) stb. Hasonlóképpen, kivonva (3)-at (1)-ből egy másik lineáris egyenletet kapunk: a 0x + b 0y + c 0r = d 0.
(5)
Megoldva (4)-et és (5)-öt x-re és y-ra, s az r így kapott értékét behelyettesítve (1)-be, négyzetes egyenletet kapunk r-ben, ami a négy alapművelettel és négyzetgyökvonással megoldható (l. 112. o.). Ennek az egyenletnek általában két megoldása van, amelyek közül csak az egyik pozitív. Kifejezve ebből az egyenletből r-et, a (4) és (5) lineáris egyenletekből megkapjuk x-et és y-t. Az (x, y) középpontú és r sugarú kör érinteni fogja a három adott kört. Az egész eljárásban csak a négy alapműveletet és a négyzetgyökvonást használtuk. Következésképpen r, x és y megszerkeszthetők pusztán körzővel és vonalzóval.
35. ábra. Apollóniosz-féle körök Az Appollóniosz-féle feladatnak általában nyolc megoldása van, az (1), (2), (3) egyen-
157
letek + és − előjeleinek 2 · 2 · 2 = 8 lehetséges kombinációjának megfelelően. Ezek a lehetőségek azoknak a feltételeknek felelnek meg, hogy a keresett körök kívülről vagy belülről érintsék mind a három adott kört. Előfordulhat, hogy algebrai eljárásunk nem szolgáltat valós értéket x, y és r számára. Ilyen eset például, ha a három adott kör koncentrikus, úgy hogy a problémának nincs geometriai megoldása. Fel kell készülnünk a megoldás esetleges „elfajulásai”-ra is, pl., ha a három adott kör egy egyenesen fekvő három ponttá fajul. Ezeket a lehetőségeket nem tárgyaljuk részletesen; némi algebrai gyakorlattal rendelkező olvasó könnyen kiegészítheti analízisünket.
*2. § Megszerkeszthető számok és számtestek 1. Általános elmélet Az előzőekben megmutattuk a geometriai szerkesztések általános algebrai hátterét. Minden körzővel és vonalzóval végezhető szerkesztés olyan lépések sorozatából áll, amely lépések mindegyike az alább felsoroltak közül az egyik: 1. két pont összekötése egy egyenessel, 2. két egyenes metszéspontjának a megszerkesztése, 3. adott sugarú kör rajzolása egy pont körül, 4. egy körnek egy másik körrel vagy egy egyenessel való metszéspontjának a meghatározása. Valamely elemet (pont, egyenes, kör) akkor tekintünk ismertnek, ha vagy eleve meg van adva, vagy az előbbi lépések valamelyikében megszerkesztettük. Az elméleti vizsgálat szempontjából vonatkoztathatjuk az egész szerkesztést egy x, y koordináta-rendszerre (l. 89. o.). Az adott elemeket akkor az x, y sík pontjai vagy vonalszakaszai ábrázolják. Ha kezdetben csak egyetlen szakasz adott, ezt a szakaszt tekinthetjük az egységszakasznak, amely rögzíti az x = 1, y = 0 pontot. Gyakran lépnek fel „tetszőleges” elemek: tetszőleges egyeneseket húzhatunk, tetszőlegesen választhatunk pontokat vagy sugarakat. (Ilyen tetszőleges elemek fordulnak elő pl. egy vonalszakasz középpontjának a megszerkesztésében: a szakasz mindkét végpontjából mint középpontból egyenlő, de egyébként tetszőleges sugarú kört rajzolunk és a körök metszéspontjait összekötjük.) Ilyen esetben választhatjuk a tetszőleges elemet úgy, hogy racionális legyen, azaz választhatunk racionális x, y koordinátájú pontokat, tetszőleges ax + by + c = 0 egyenest racionális a, b, c együtthatókkal, tetszőleges köröket, melyek középpontjainak racionális koordinátái vannak és a sugaraik racionálisak. A tetszőleges
158
elemeket mindig racionálisnak fogjuk választani; ha ugyanis az elemek tetszőlegesek, ez a megszorítás nem lehet hatással a szerkesztés eredményére. Az egyszerűség kedvéért tételezzük fel, hogy csak egyetlen elem van eleve adva, az 1 hosszúságegység. Akkor az 1. § szerint körzővel és vonalzóval minden olyan számot megszerkeszthetünk, amely az összeadás, kivonás, szorzás és osztás racionális műveleteivel az egységből megkapható, azaz minden r/s racionális szamot, ahol r és s egész számok. A racionális számok rendszere „zárt” a négy alapműveletre vonatkozóan, azaz két racionális szám összege, különbsége, szorzata és hányadosa újból racionális szám, most is, mint mindig, kizárva a 0-val való osztást. A számok minden ilyen halmazát, amely ebben az értelemben zárt a négy alapműveletre vonatkozóan, számtest nek nevezzük. Feladat: Mutassuk ki, hogy minden test tartalmazza legalább az összes racionális számot. (Útmutatás: Ha a 6= 0 az F test egy száma, akkor a/a = 1 F-hez tartozik, és 1-ből bármely racionális számot megkaphatunk a négy alapművelettel.)
Így megszerkeszthetjük az egységből kiindulva az egész racionális számtestet, tehát az x, y sík összes racionális pontját (azaz azokat a pontokat, melyeknek mindkét koordinátája racionális). Új, irracionális számokat úgy kaphatunk, ha a körzőt pl. a √ 2 szám megszerkesztésére használjuk, amely számról bebizonyítottuk a II. fejezet 2. √ §-ában, hogy nem tartozik a racionális számtestbe. Ha azután megszerkesztettük 2-t, a továbbiakban az 1. § „racionális” szerkesztéseivel az összes többi √ a+b 2
(1)
alakú számot megkaphatjuk, ahol a, b racionális számok, tehát megszerkeszthetők. Hasonlóképpen megszerkeszthetjük az összes √ a+b 2 √ c+d 2
vagy
√ √ (a + b 2)(c + d 2)
alakú számot, ahol a, b, c, d racionális számok. Ezek a számok azonban mindig átírhatók (1) alakba. Ugyanis √ √ √ √ a+b 2 a+b 2 c−d 2 ac − 2bd bc − ad √ √ = √ · √ = 2 + 2 2 = p + q 2, 2 2 c − 2d c − 2d c+d 2 c+d 2 c−d 2
159
ahol p, q racionális számok. (A c2 − 2d2 nevező nem lehet 0, mivel ha c2 − 2d2 = 0, √ √ akkor 2 = c/d, ami ellentmondásban van azzal a ténnyel, hogy 2 irracionális.) Hasonlóképpen √ √ √ √ (a + b 2)(c + d 2) = (ac + 2bd) + (bc + ad) 2 = r + s 2, ahol r, s racionális számok. Tehát minden, amit
√
2 szerkesztésével nyerhetünk, az (1)
alakú számok halmazába tartozik, s a és b tetszőleges racionális értékek. Feladat: Állítsuk elő a p p + qr q pqr ; ; p + p2 ; (p − p2 ) ; q r 1 + r2 q + pr2 számokat (1) alakban, ha p = 1 +
√
2, q = 2 −
√
2, r = −3 +
√
2.
Az (1) által megadott számok ismét testet alkotnak, amint azt a megelőző tárgyalás mutatja. (Az, hogy két (1) alakú szám összege és különbsége újból (1) alakú, nyilvánvaló.) Ez a test bővebb, mint a racionális számok teste, a racionális számok teste részteste ennek a testnek, amelyik természetesen megint kisebb, mint az összes valós szám teste. Jelölje F0 a racionális számtestet, és F1 az (1) alakú számoknak ezt az új, belőle nyert testét. Bebizonyítottuk, hogy ebben az F1 „bővített számtest”-ben minden szám megszerkeszthető. Így tehát kiterjeszthetjük szerkesztéseink körét, véve F1 -ből egy √ számot, mondjuk k = 1 + 2-t, s a gyökvonást elvégezve kapjuk a √
q 1+
2=
√ k
megszerkeszthető számot, s vele, az 1. § szerint, az összes √ p+q k
(2)
alakú számból álló számtestet, ahol most p és q az F1 tetszőleges számai lehetnek, azaz √ tetszőleges a + b 2 alakú számok, ahol a és b F0 -ba tartoznak, azaz racionális számok.
160
Feladat: Állítsuk elő √ 1 + ( k)2 √ , 1+ 2
√ ( k)3 ,
√ √ 2 k + √1k √ , ( k)3 − 3
(1 +
√
√ k)( 2 + √ 1 + 2k
k)(2 −
√
√1 ) k
számokat (2) alakban. Az összes ilyen szám konstrukciójánál csak egyetlen szakaszt tételezhetünk fel adottnak. Ha két szakasz van adva, az egyiket hosszegységnek választhatjuk. Legyen ebben az egységben kifejezve a másik szakasz hossza α. Akkor megszerkeszthetjük az összes am αm + am−1 αm−1 + . . . + a1 α + a0 bn αn + bn−1 αn−1 + . . . + b1 α + b0 alakú számot, ahol a0 , . . ., am és b0 ,. . ., bn racionális számok, m és n pedig tetszőleges pozitív egész számok. Feladat: Legyen adva két, 1 és α hosszúságú szakasz. Szerkesszük meg az 1 + α + α2 ; (1 + α)/(1 − α); α3 számokat.
Tételezzük fel most általánosságban, hogy meg tudjuk szerkeszteni valamely F számtest összes számát. Megmutatjuk, hogy egyedül vonalzó használatával sohasem juthatunk ki az F számtestből. Két ponton átmenő egyenes egyenlete, mely két pontnak a1 , b1 , és a2 , b2 koordinátái F-ben vannak (b1 − b2 )x + (a2 − a1 )y + (a1 b2 − a2 b1 ) = 0 (l. 532. o.); az egyenlet együtthatói F számokból képezett racionális kifejezések, ezért, a test definíciója szerint, maguk is F számok. Továbbá ha van két, αx + βy − γ = 0 és α 0 x + β 0 y − γ 0 = 0 egyenesünk, melyeknek az együtthatói F testbe tartozó számok, a két egyenes metszéspontjának a koordinátáit megkapjuk a két egyenletből álló egyenletrendszer megoldásaként: γβ 0 − βγ 0 x= , αβ 0 − βα 0
αγ 0 − γα 0 y= . αβ 0 − βα 0
Mivel ezek is F testbe tartozó számok, nyilvánvaló, hogy a vonalzó egyedüli használata F keretei közé zárt be. Feladatok: Az x +
√
2y − 1 = 0, 2x − y +
√
2 = 0 egyenesek együtthatói (1) testben vannak.
Számítsuk ki metszéspontjaik koordinátáit, és igazoljuk, hogy ezek (1) alakúak. – Kössük össze √ √ az (1, 2) és (2, 1 − 2) pontokat egy ax + by + c = 0 egyenessel, és igazoljuk, hogy az egyenlet
161
együtthatói (1) alakúak. – Végezzük el ugyanezt a (2) számtestre vonatkozóan az q √ √ 1 + 2 x + 2 y = 1,
√ (1 +
q √ 2)x − y = 1 − 1 + 2
egyenesek és √
q √ √ 2, −1 , 1 + 2, 1 + 2
pontok esetében.
Az F számtest falait nem tudjuk áttörni a körző használata nélkül. Válasszunk ebből √ a célból F testben egy k elemet, amely olyan tulajdonságú, hogy k nem tartozik F-be. √ Akkor megszerkeszthetjük k-t tehát az összes √ a+b k
(3)
alakú számot is, ahol a és b racionális számok, vagy akár tetszőleges elemei is lehetnek √ √ F-nek. Két a + b k és c + d k szám összege és különbsége, √ √ √ (a + b k)(c + d k) = (ac + kbd) + (ad + bc) k szorzatuk és √ √ √ a+b k (a + b k)(c − d k) ac − kbd bc − ad √ √ = = + 2 k c2 − kd2 c2 − kd2 c − kd2 c+d k √ hányadosuk újból p + q k alakú lesz, ahol q és p az F testben vannak. (A c2 − kd2 √ nevező csak akkor tűnhet el, ha c is és d is zérus; ellenkező esetben ugyanis k = c/d √ lenne írható, s ez F egy száma lenne, ellentétben azzal a feltevésünkkel, hogy k nincsen √ F testben.) Tehát az a + b k alakú számok összessége egy F 0 testet alkot. Ez az F 0 magában foglalja az eredeti F testet, mert speciális esetként feltehetjük, hogy b = 0. F 0 -t F bővített testének nevezzük, F-et az F 0 résztestének. √ Legyen például F az a + b 2 alakú számok teste racionális a, b értékekkel, és legyen √ √ k = 2. Akkor az F 0 bővített test számait p + q 4 2 állítja elő, ahol p és q az F-ben √ √ vannak, p = a + b 2, q = a 0 + b 0 2. a, b, a 0 , b 0 racionális számok. F 0 testben minden
162
szám erre az alakra redukálható; pl. √ √ √ √ √ √ 4 1 2− 42 2− 42 2 2 √ √ √ √ √ √ √ √ √ = = = = − 4 4 4 2+ 2 ( 2 + 2)( 2 − 2) 2− 2 2− 2 2− 2 √ √ √ √ 2(2 + 2) (2 + 2) √ 1√ √ 4 4 − = 2 = (1 + 2) − 1 + 2 2 4−2 4−2 2 p √ √ Feladat: Legyen F a p + q 2 + 2 test, ahol p és q a + b 2 alakúak, a és b racionális √ √ 1+ √2+ 2 számok. Állítsuk elő √ számot ebben az alakban. 2−3
2+ 2
Láttuk, hogy ha megszerkeszthető számok bármely olyan F testéből indulunk ki, amely tartalmazza a k számot, akkor vonalzó használatával és a körző egyszeri alkalmazásával √ √ megszerkeszthetjük k számot, s következésképpen minden a + b k alakú számot, ahol a és b F testben vannak. Megfordítva, megmutatjuk, hogy körző egyszeri alkalmazásával csak ilyen alakú számokat kaphatunk. Ugyanis a körző szerepe a szerkesztésben az, hogy a pontokat (vagy azok koordinátáit) mint két kör, vagy mint egy kör és egy egyenes metszéspontjait definiálja. A ξ, η középpontú és r sugarú kör egyenlete (x − ξ)2 + (y − η)2 = r2 ; tehát ha ξ, η, r F testben van, a kör egyenlete x2 + y2 + 2αx + 2βy + γ = 0 alakban írható, ahol α, β, γ együtthatók F-ben vannak. Egy ax + by + c = 0 egyenes, amely bármely két olyan pontot köt össze, melynek koordinátái F-ben vannak, olyan együtthatókkal rendelkezik, amelyek szintén F-ben vannak, amint azt a 160. oldalon láttuk. Kiküszöbölve ebből a két egyenletből y-t, kapunk a kör és az egyenes metszéspontjának x koordinátájára egy Ax2 + Bx + C = 0 alakú másodfokú egyenletet, az A, B, C együtthatók az F testben vannak (explicit
163
formájuk: A = a2 + b2 , B = 2(ac + b2 α − abβ), C = c2 − 2bcβ + b2 γ). A megoldást az x=
−B ±
√
B2 − 4AC 2A
√ képlet szolgáltatja, amely p + q k alakú, p, q, k-val F-ben. Hasonló képlet érvényes a metszéspont y koordinátájára. Ugyanúgy ha két körünk van adva, x2 + y2 + 2αx + 2βy + γ = 0, x2 + y2 + 2α0 x + 2β0 y + γ0 = 0, a második egyenletet kivonva az elsőből kapunk egy elsőfokú egyenletet: 2 (α − α0 ) x + 2 (β − β0 ) y + (γ − γ0 ) = 0, és ez az egyenlet az első kör egyenletével együtt éppen úgy oldható meg, mint az előbb. A szerkesztés mindkét esetben egy vagy két új pont koordinátáit szolgáltatja, és ezek az √ új mennyiségek p + q k alakúak, p, q, k-val F-ben. Természetesen speciális esetként √ tartozhat már maga k is F-hez, pl. ha k = 4. Akkor a szerkesztés semmi lényegesen újat nem szolgáltat, és F-ben maradunk. Azonban általában nem ez az eset. √ Feladat: Tekintsük a koordináta-rendszer kezdőpontja körül 2 2 sugárral rajzolt kört és az √ √ (1/2, 0) (4 2, 2) pontokat összekötő egyenest. Keressük meg a kör és az egyenes metszéspontjainak a koordinátái által meghatározott F 0 testet. Végezzük el ugyanezt az adott kör és egy √ √ (0, 2 2) középpontú, 2/2 sugarú kör metszéspontjaira vonatkozóan.
Foglaljuk össze: Ha eleve adottak egyes mennyiségek, akkor egyedül vonalzó használatával megszerkeszthetők azon F testnek a mennyiségei, amely F testet az adott mennyiségekből a négy racionális művelet állítja elő. Akkor azután a körző használatával a megszerkeszthető mennyiségek F testét kibővíthetjük egy bővített testté úgy, hogy választunk F-ben egy tetszőleges k számot, négyzetgyököt vonunk belőle, és megszerkeszt√ jük az a + b k alakú számokból álló F 0 testet. Az a és b számok az F testbe tartoznak. F-et az F 0 résztestének nevezzük, F minden mennyisége benne foglaltatik F 0 -ben is, mivel √ √ az a + b k kifejezésben választhatunk b = 0 értéket. (Fel kell tenni, hogy k új szám,
164
amely nem foglaltatik benne F-ben, ugyanis ellenkező esetben
√
k adjunkciója semmi
újra sem vezetne, és F 0 azonos lenne F-fel.) Kimutattuk, hogy valamely geometriai szerkesztés minden lépése (egyenes húzása két adott ponton keresztül, adott középpontú és sugarú kör rajzolása, két adott egyenes vagy kör metszéspontjainak a kijelölése) vagy olyan mennyiségeket eredményez, amelyek a már ismert megszerkeszthető számok testébe tartoznak, vagy a négyzetgyökvonáson keresztül, a megszerkeszthető számok egy új, bővített testébe nyit utat. Most már pontosan körülírhatjuk a megszerkeszthető számok összességét. Egy adott F0 testből indulunk ki, amit bármilyen eleve adott mennyiségek definiálhatnak. Lehet pl. F0 a racionális számtest, ha kezdetben csak egyetlen vonalszakasz van megadva, amit √ √ egységnek választunk. Azután k0 adjunkciójával, ahol k0 F-be tartozik, de k0 nem, a megszerkeszthető számok egy F1 bővített testét szerkesztjük meg, amely az összes √ a0 + b0 k0 alakú számból áll, ahol a0 és b0 tetszőleges számok lehetnek F0 -ban. Azután √ az F1 egy újabb bővített testét, F2 -t definiáljuk az a1 + b1 k1 számok által, ahol a1 és b1 F1 tetszőleges számai, k1 pedig F1 valamely olyan száma, melynek négyzetgyöke nem tartozik F1 -be. Ismételve ezt az eljárást, végül n négyzetgyök adjunkciója után egy Fn testhez jutunk. Megszerkeszthető számok azok és csak azok, amelyek bővített testek ilyen sorozatával elérhetők; azaz amelyek egy fent leírt típusú Fn testben vannak. A szükséges testbővítések n száma nem lényeges, bizonyos értelemben a probléma bonyolultságának fokát méri. Az alábbi példában szemléltetjük az eljárást. A sr q √ √ √ 6+ 1+ 2+ 3+5 számot kívánjuk elérni. Jelölje F0 a racionális számtestet. k0 = 2 értéket véve kapjuk √ √ az F1 testet, amely tartalmazza az 1 + 2 számot. Legyen most k1 = 1 + 2 és k2 = 3. Természetesen 3 benne van az eredeti F0 testben, s annál inkább benne van az F2 testben, p √ √ úgy hogy tökéletesen megengedhető k = 3 felvétele. Legyen k = 1 + 2 + 3, és 2 3 qp √ √ végül k4 = 1 + 2 + 3 + 5. Az így szerkesztett F5 test tartalmazza a kívánt számot, √ √ √ mivel 6 is F5 -ben van, hiszen 2 és 3, s így szorzatuk is, az F3 -ban van, s azért F5 -ben is.
165
Feladatok: Igazoljuk, hogy a szabályos 2m -szög (l. 155. o.) oldala megszerkeszthető szám, a racionális szemtestből kiindulva, n = m − 1. Határozzuk meg a bővített testek sorozatát. * Végezzük el ugyanezt a √
√ 5 + 11 p √ , 1+ 7− 3 r q q q √ √ √ √ 8 ( 2 + 3)( 2 + 1 + 2 + 5 + 3 − 7) q √ √ √ 1 + 2 + 3 + 5;
számok esetében.
2. Minden megszerkeszthető szám algebrai szám Ha a kiinduló F0 test az egyetlen vonalszakasz által előállított racionális számtest, akkor az összes megszerkeszthető számok algebrai számok lesznek. (Az algebrai számok definícióját l. a 127. oldalon.) Az F1 test számai másodfokú egyenletek gyökei, F2 számai negyedfokú egyenletek gyökei, és általánosságban, Fk számai 2k fokú, racionális együtthatójú egyenletek gyökei. Hogy ezt az állítást F2 test esetére bebizonyítsuk, √ p √ √ √ √ tekintsük először az x = 2+ 3 + 2 példát. Akkor (x− 2)2 = 3+ 2, x2 +2−2 2x = √ √ 3 + 2, vagy x2 − 1 = 2(2x + 1), ez másodfokú egyenlet, melynek együtthatói az F1 testbe tartoznak. Négyzetre emelve, végül azt kapjuk, hogy x2 − 1
2
= 2(2x + 1)2 ,
s ez negyedfokú egyenlet, racionális együtthatókkal. Általánosságban, valamely F2 testben bármely szám √ x=p+q w
(4)
√ √ √ alakú, ahol p, q, w F1 testben vannak, tehát p = a + b s, q = c + d s, w = e + f s alakúak, ahol a, b, c, d, e, f, s racionális számok. (4)-ből x2 − 2px + p2 = q2 w,
166
ahol az összes együttható a
√
s által generált F1 testben van. Ezért ez az egyenlet
x2 + ux + v =
√
s(rx + t)
alakba írható, ahol r, s, t, u, v racionális számok. Mindkét oldalon négyzetre emelve negyedfokú egyenletet kapunk: x2 + ux + v
2
= s(rx + t)2 ,
racionális együtthatókkal, amint állítottuk. Feladatok: 1) Keressük meg az a) x =
p p √ √ √ √ 2 + 3; b) x = 2+ 3; c) x = 1 5 + 3 számokhoz
tartozó racionális együtthatójú egyenleteket. 2) Keressünk hasonló módszerrel nyolcadfokú egyenleteket r a) x =
q √ 2 + 2 + 2;,
b) x =
√
q √ 2 + 1 + 3;
r c) x = 1 +
q √ 5+ 3+ 2
számokhoz.
A tétel igazolása általános x számra valamely Fk testben, ahol k tetszőleges, a fentebb alkalmazott eljárással történik, amennyiben kimutatjuk, hogy x másodfokú egyenletet elégíti ki, melynek együtthatói egy Fk−1 testben foglaltatnak benne. Az eljárást ismételve azt kapjuk, hogy x egy 22 = 4-ed fokú egyenletet elégít ki, melynek együtthatói egy Fk−2 testben vannak stb. Feladat: Terjesszük ki az általános bizonyítást matematikai indukcióval annak a kimutatására, hogy x kielégít egy 2l -ed fokú egyenletet, melynek együtthatói egy Fk−1 testben vannak, ahol 0 < l 5 k. Ez az állítás l = k esetére a kívánt tételt adja.
*3. § A három görög probléma megoldhatatlansága 1. A kocka megkettőzése Most már felkészültünk a szögharmadolás, a kockamegkettőzés és a szabályos hétszögszerkesztés ősi problémáinak vizsgálatára. Tekintsük először a kockamegkettőzés problémáját. Ha az adott kocka egységnyi élhosszúságú, térfogata egy térfogategy-
167
ség; találnunk kell olyan x élhosszúságú kockát, amelynek a térfogata ennek az adott térfogatnak a kétszerese. A keresett x él tehát ki kell, hogy elégítse az egyszerű (1)
x3 − 2 = 0
harmadfokú egyenletet. Indirekt úton fogjuk bebizonyítani, hogy ez az x szám nem szerkeszthető meg pusztán körző és vonalzó használatával. Tegyük fel ugyanis, hogy ez a szerkesztés lehetséges. A megelőzőek szerint ez annyit jelent, hogy x valamely, a racionális számtestből négyzetgyökök adjunkciójával történő egymás utáni testbővítések útján kapott Fk testbe tartozik. Megmutatjuk, hogy ez a feltevés ellentmondásra vezet. √ Azt már láttuk, hogy x nem tartozhat az F0 racionális számtestbe, mivel 3 2 irracionális szám (l. az első feladatot a 75. oldalon). Tehát x csak valamelyik bővített Fk testbe tartozhat, ahol k pozitív egész szám. Feltételezhetjük, hogy k a legkisebb ama pozitív egész számok között, amelyek valamely Fk testbe tartoznak. Következésképpen √ x=p+q w alakba írható, ahol p, q és w valamely Fk−1 testbe tartoznak, de
√
w nem. Most egy
egyszerű és igen jelentős típust képviselő algebrai okfejtéssel ki fogjuk mutatni, hogy √ √ ha x = p + q w az (1) harmadfokú egyenlet valamely megoldása, akkor y = p − q w is megoldása az egyenletnek. Mivel x az Fk testbe tartozik, x3 és x3 − 2 is az Fk testbe tartozik és
√ x3 − 2 = a + b w
egyenletet kapjuk, ahol a és b Fk−1 -be tartozik. Egyszerű számolás most arra az eredményre vezet, hogy a = p3 + 3pq2 w − 2, b = 3p2 q + q3 w. Ha az √ y=p−q w megoldást vesszük, akkor a és b ezen kifejezéseiben q helyébe −q-t téve, azt kapjuk, hogy
168
√ y3 − 2 = a − b w.
(2’)
Azonban feltételeztük, hogy x gyöke az x3 − 2 = 0 egyenletnek, tehát √ a+b w=0
kell hogy legyen.
(3)
Következésképpen – s ez éppen okoskodásunk lényege – a-nak is, meg b-nek is zérusnak √ kell lenni. Ha ugyanis b nem lenne zérus, (3)-ból az következne, hogy w = −a/b. De ak√ kor w ugyanabba az Fk−1 testbe tartozna, amelyikbe a és b, ellentétben feltevésünkkel. Tehát b = 0, és (3)-ból azonnal következik, hogy szükségképpen a = 0.
√ Kimutatva, hogy a = b = 0, közvetlenül következik (2’) egyenletből, hogy y = p−q w
is megoldása az (1) harmadfokú egyenletnek, mivel y3 − 2 egyenlő zérussal. Továbbá √ y 6= x, azaz x − y 6= 0, mivel x − y = 2q w csak akkor tűnhet el, ha q = 0, és ebben az esetben x = p Fk−1 -be tartozna, feltevésünkkel ellentétben. √ Bebizonyítottuk tehát, hogy ha x = p + q w gyöke az (1) harmadfokú egyenletnek, √ akkor y = p − q w másik, x-től különböző gyöke ennek az egyenletnek. Ugyanis csak egyetlen olyan valós szám van, amelyik köbgyöke 2-nek, 2 másik két köbgyöke képzetes √ √ (l. 120. o.); y = p − q w nyilvánvalóan valós, hiszen p, q és w valós számok. Így kiinduló feltevésünk ellentmondásra vezetett, tehát helytelen; (1) megoldása nem tartozhat egyetlen Fk testbe sem, úgyhogy csupán körző és vonalzó használatával a kocka megkettőzése megoldhatatlan. 2. Egy harmadfokú egyenletekre vonatkozó tétel A fenti algebrai érvelést speciális problémára alkalmazott formában adtuk elő. A másik két görög probléma megoldására célszerű lesz általánosabb alapból kiindulni. Algebrai tekintetben mindhárom probléma harmadfokú egyenletektől függ. A harmadfokú egyenletekre vonatkozó alapvető tény, hogy z3 + az2 + bz + c = 0
(4)
169
harmadfokú egyenlet esetében, ha x1 , x2 , x3 az egyenlet három gyöke, akkor1 (5)
x1 + x2 + x3 = −a.
Tekintsünk bármely (4) alakú harmadfokú egyenletet, amelyben az a, b, c együtthatók racionális számok. Megtörténhet, hogy az egyenlet gyökeinek valamelyike racionális szám; pl. az x3 −1 = 0 egyenletnek racionális gyöke 1, míg a másik két gyök, amit az x2 +x+1 = 0 másodfokú egyenlet ad meg, szükségképpen képzetes. Könnyen bebizonyítható azonban a következő általános tétel: Ha valamely harmadfokú egyenletnek nincs racionális gyöke, akkor egyetlen gyöke sem szerkeszthető meg az F0 racionális számtestből kiindulva. A bizonyítás újból indirekt. Tételezzük fel, hogy x a (4) egyenlet valamely megszerkeszthető gyöke lenne. Akkor x, mint fentebb láttuk, bővített testek F0 , . . ., Fk sorozatában a legutolsó Fk testbe tartozna. Feltételezhetjük, hogy k a legkisebb azon egész számok közül, amelyekre (4) harmadfokú egyenlet egy gyöke az Fk bővített testek valamelyikébe tartozik. Bizonyos, hogy k nagyobb kell legyen zérusnál, mivel a bizonyítandó tétel feltételeként szerepel, hogy egyetlen x gyök sem tartozik az F0 racionális számtestbe. Tehát x
√ y=p+q w
alakban írható, ahol p, q, w a megelőző Fk−1 testbe tartozik, azonban
√
w nem. Ebből
következik, ugyanúgy, mint a fentiekben tárgyalt z3 − 2 = 0 speciális egyenlet esetében, hogy az Fk test egy másik száma, √ y=p−q w szám is gyöke a (4) egyenletnek. Mint fent, itt is látjuk, hogy q 6= 0 és így x 6= y. 1
A z3 + az2 + bz + c polinom (z − x1 )(z − x2 )(z − x3 ) szorzattá faktorizálható, ahol x1 , x2 , x3 a (4) egyenlet gyökei (l. 124. o.) Tehát z3 + az2 + bz + c = z3 − (x1 + x2 + x3 )z2 + (x1 x2 + x1 x3 + x2 x3 )z − x1 x2 x3 , és mivel az egyenlet két oldalán z azonos hatványainak az együtthatói egyenlőek kell legyenek, −a = x1 + x2 + x3 ,
170
b = x1 x2 + x1 x3 + x2 x3 ,
−c = x1 x2 x3 .
(5) szerint a (4) egyenlet harmadik gyökét u = −a − x − y adja. Mivel azonban x + y = 2p, ez annyit jelent, hogy u = −a − 2p, ahol nem szerepel többé
√
w, tehát u az Fk−1 számtestbe tartozik. Ez azonban ellent-
mond annak a feltevésünknek, hogy k az a legkisebb szám, amelyre valamely Fk a (4) egyenlet egy gyökét tartalmazza. Ez a feltevés tehát lehetetlen, a (4) egyenlet egyetlen gyöke sem tartozhat egyetlen Fk számtestbe sem. Ezzel a tételt teljes általánosságban bebizonyítottuk. Kimondhatjuk tehát, hogy ha valamely geometriai probléma algebrai megfelelőjének a megoldása racionális gyökkel nem rendelkező harmadfokú egyenlet megoldását követeli meg, akkor a kérdéses geometriai probléma egyedül körző és vonalzó használatával nem szerkeszthető meg. A kocka megkettőzésének az esetében ez az összefüggés minden további nélkül nyilvánvaló volt, most be fogjuk bizonyítani a másik két klasszikus görög problémára. 3. A szög harmadolása Be fogjuk bizonyítani, hogy a szög harmadolása csak körzővel és vonalzóval általánosságban nem oldható meg. Természetesen vannak olyan szögek, pl. 90◦ és 180◦ , amelyek harmadolhatók. Azt kell megmutatnunk, hogy a harmadolásra nem adható meg minden szög esetében érvényes eljárás. A bizonyítás szempontjából elegendő egyetlen olyan szöget találni, amelyik nem harmadolható, hiszen valamely általános érvényű módszer egyetlen kivételt sem engedhet meg. Így tehát ha ki tudjuk mutatni, hogy pl. a 60◦ -os szög nem harmadolható körző és vonalzó egyedüli használatával, ezzel bebizonyítottuk, hogy általános módszer nem létezik. A problémának több algebrai ekvivalensét adhatjuk; a legegyszerűbbet úgy, hogy a ϑ-szöget koszinusza által adottnak tekintjük: cos ϑ = g. Ekkor a probléma ekvivalens az x = cos ϑ3 mennyiség megkeresésével. Egy egyszerű trigonometriai képlet szerint (l. 119. o.) ϑ/3 és ϑ koszinusza között az alábbi egyenlet áll fenn: cos ϑ = g = 4 cos3 (ϑ/3) − 3 cos(ϑ/3).
171
Azaz a cos ϑ = g koszinuszú ϑ szög harmadolása ekvivalens a 4z3 − 3z − g = 0
(6)
harmadfokú egyenlet megoldásának a megszerkesztésével. Annak megmutatására, hogy ez a szerkesztés nem végezhető el általánosságban, legyen pl. ϑ = 60◦ , úgyhogy g = cos 60◦ = 21 . Ekkor (6) egyenlet 8z3 − 6z = 1
(7)
alakot ölt. A megelőző pontban bizonyított tétel szerint most már csak azt kell megmutatnunk, hogy ennek az egyenletnek egyetlen racionális gyöke sincs. Legyen v = 2z. Akkor a (7) egyenletből v3 − 3v = 1
(8)
egyenletet kapjuk. Ha létezne ezen egyenletet kielégítő v = r/s racionális szám, ahol r és s relatív prímszámok, felírhatnánk az r3 − 3s2 r = s3 egyenletet. Ebből következik, hogy s3 = r(r2 − 3s2 ) osztható r-rel, ami annyit jelent, hogy r-nek és s-nek van közös osztója, kivéve természetesen az r = ±1 esetet. Hasonlóképpen s2 osztója r3 = s2 (s + 3r)-nek, tehát r-nek és s-nek van közös osztója, kivéve megint az s = ±1 esetet. Azonban feltevésünk szerint r és s relatív prímek, azaz nincsen 1-nél nagyobb közös osztójuk, és így megmutattuk, hogy az egyedüli racionális számok, melyek kielégíthetik (8) egyenletet, +1 és −1. Behelyettesítve a +1 és −1 értékeket a (8) egyenletbe, v helyébe, látjuk, hogy egyikőjük sem elégíti ki az egyenletet. Tehát a (8), s következésképpen a (7) egyenletnek nincs racionális gyöke. Ezzel bebizonyítottuk a szögharmadolás körző és vonalzó használatával való megoldhatatlanságát. Tételünk, hogy ti. egy tetszés szerinti szöget körző és vonalzó egyedüli használatával általánosságban nem lehet három részre osztani, csak abban az esetben igaz, hogyha a vonalzót csupán két adott pontot összekötő egyenes meghúzására szükséges eszköznek tekintjük, semmi többnek. A megszerkeszthető számokra adott fentebbi általános jellemzésünkben a vonalzó használatát valóban erre az egyetlen műveletre korlátoztuk. Ha a vonalzó más jellegű használatát is megengedjük, akkor a szerkesztési lehetőségek nagymértékben bővülnek. Jó példa erre az állításra az alábbi szögharmadolási módszer, amely már Arkhimédész műveiben megtalálható.
172
36. ábra. Arkhimédész-féle szögharmadolás Legyen adva tetszés szerinti x-szög, amint az a 36. ábrán látható. Hosszabítsuk meg a szög alapvonalának a szárát a szög O csúcsán túl bal felé, és rajzoljunk mint O középpont körül tetszőleges r sugárral egy kört. Jelöljünk ki a vonalzónkon két pontot – legyenek ezek A és B – úgy, hogy a két pont távolsága AB = r legyen. Hozzuk a vonalzót – a B pontot állandóan a félkörön tartva – olyan helyzetbe, hogy A pont essen az x-szög alapvonalának a meghosszabbítására, s a vonalzó éle menjen át az x-szög másik szárának és az O pont körül rajzolt félkörnek a metszéspontján. Rajzoljuk meg a vonalzó eme helyzete által adott egyenest. Ez az egyenes az eredetileg adott x-szög meghosszabbított alapvonalával y-szöget zár be. Feladat: Mutassuk meg, hogy ez a szerkesztés valóban az y = x/3 értéket szolgáltatja.
4. A szabályos hétszög Tekintsük most az egységsugarú körbe írt szabályos hétszög x oldalának a megszerkesztését. A probléma legegyszerűbben komplex számok segítségével oldható meg (l. II. fejezet, 5. §). Tudjuk, hogy a hétszög csúcsait a z7 − 1 = 0
(9)
egyenlet gyökei adják meg, ha a csúcsok x, y koordinátáit z = x + yi komplex számok valós, illetve képzetes részének tekintjük. A (9) egyenlet egyik gyöke z = 1, a többi gyökei a (9)-ből (z − 1) kiemelésével kapott z7 − 1 = z6 + z5 + z4 + z3 + z2 + z + 1 = 0 z−1
(10)
173
egyenlet gyökei (l. 122. o.). Elosztva a (10)-et z3 -mal z3 +
1 1 1 + z2 + 2 + z + + 1 = 0 3 z z z
(11)
egyenletet kapjuk, s ez egyszerű algebrai átalakítással (z + 1/z)3 − 3(z + 1/z) + (z + 1/z)2 − 2 + (z + 1/z) + 1 = 0
(12)
alakra hozható. Jelöljük a z + 1/z mennyiséget y-nal, akkor (12)-ből kapjuk, hogy y3 + y2 − 2y − 1 = 0.
(13)
Tudjuk, hogy z-t, az egység hetedik gyökét z = cos ϕ + i sin ϕ
(14)
adja meg, ahol ϕ = 360◦ /7 az a szög, amit a szabályos hétszög oldala mint húr, a körben középponti szögként meghatároz. Tudjuk továbbá a 120. oldalon közölt 2. feladatból, hogy 1/z = cos ϕ − i sin ϕ, úgyhogy y = z + 1/z = 2 cos ϕ. Ha meg tudjuk szerkeszteni y-t, meg tudjuk szerkeszteni cos ϕ-t is, és megfordítva. Ha tehát be tudjuk bizonyítani, hogy y nem megszerkeszthető, azzal egyúttal azt is megmutattuk, hogy z, s ezzel a hétszög sem szerkeszthető meg. Tekintettel a 2. pontban bebizonyított tételünkre, most már csak azt kell bebizonyítani, hogy a (13) egyenletnek nincs racionális gyöke. A bizonyítás indirekt. Tételezzük fel, hogy (13) egyenletnek van racionalis gyöke és legyen ez a gyök r/s, ahol r és s relatív prímek. Akkor r3 + r2 s − 2rs2 − s3 = 0,
(15)
és ebből az egyenletből, éppen úgy mint fent, levezethető, hogy s osztója r3 -nek és r osztója s3 -nek. Mivel r és s relatív prímek, mindkettő ±1 kell legyen, tehát ha azt akarjuk, hogy y racionális legyen, csak +1 és −1 értékek közül veheti fel valamelyiket. Ezeket az értékeket helyettesítve be az egyenletbe látjuk, hogy egyikőjük sem elégíti ki azt. Tehát y, s ezzel együtt a szabályos hétszög oldala, nem megszerkeszthető.
174
5. Néhány megjegyzés a kör négyszögesítéséről A kocka megkettőzését, a szög harmadolását, a szabályos hétszög szerkesztésének a kérdését viszonylag egyszerű módszerekkel sikerült elintéznünk. Sokkal nehezebb kérdés a kör négyszögesítése, ez már a felsőbb matematikai analízis technikáját igényli. Az r sugarú kör területe πr2 , tehát az egységsugarú kör területével azonos területű négyzet szerkesz√ tése a négyzet π hosszúságú oldalának a megszerkeszthetőségére vezethető vissza. Ez a vonalszakasz akkor és csak akkor szerkeszthető meg, ha π szám megszerkeszthető. Ha tehát a megszerkeszthető számokról adott általános definíciónk segítségével meg tudjuk mutatni, hogy a π szám nem foglaltathatik benne egyetlen olyan Fk számtestben sem, amely az F0 racionális számtestből egymás utáni négyzetgyök adjunkciókon keresztül elérhető, akkor bebizonyítottuk a kör négyszögesítésének a megoldhatatlanságát. Bármely, a racionális számtestből négyzetgyökök adjunkciója által képzett test számai algebrai számok, azaz egész számú együtthatókkal rendelkező algebrai egyenleteket kielégítő számok, tehát elegendő a bizonyításhoz megmutatni, hogy a π szám nem algebrai, ún. transzcendens szám (l. 127. o.). A π transzcendens voltának bizonyításához szükséges technikát Charles Hermite (1822–1905) alkotta meg, aki az e számról bizonyította be, hogy transzcendens. Hermite eme módszerének csekély módosításával azután F. Lindemann-nak sikerült igazolnia (1882) π transzcendens voltát, s így végleg megoldódott a kör négyszögesítésének évezredes problémája. A bizonyítás ennek a könyvnek a kereteit meghaladja, de aki járatos a felsőbb analízisben, könnyen megértheti.
175
II. rész. Különféle szerkesztési módszerek 4. § Geometriai transzformációk. Az inverzió 1. Általános megjegyzések Ennek a fejezetnek a második részében rendszeresen tárgyalunk néhány, a szerkesztési problémáknál alkalmazható elvet. A szerkesztési problémák jó része világosabban áttekinthető, ha az egyes szerkesztések vizsgálata helyett a „geometriai transzformációk” elvének általános szempontja szerint tárgyaljuk azokat, sajátos transzformációk által összekapcsolt problémák egész osztályát fogva át egyszerre. A geometriai transzformációk osztályának fogalma nem csupán a geometriai szerkesztések problémáit világította át hatalmas erővel, a geometria csaknem minden részére nagy hatással volt. A IV. és V. fejezetben majd foglalkozunk ilyen általános szempontból is a geometriai transzformációkkal. Most azonban a transzformáció egy speciális esetét tárgyaljuk: a sík körre vonatkozó inverzióját, ami a közönséges, egyenes vonalra vonatkozó tükrözés általánosítása.
37. ábra. A pont egyenesre vonatkozó tükrözése A sík önmagára való transzformációja vagy leképezése alatt olyan szabályt értünk, amely a sík minden egyes P pontjához a sík egy másik P 0 pontját rendeli hozzá. A P 0
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526103649+02’00’
177
38. ábra. A pont C körre vonatkozó inverziója pontot a P pont adott transzformációban kapott képének nevezzük, a P pontot a P 0 eredetijének. Egy ilyen transzformáció egyszerű példája a sík adott L egyenesre mint tükörre vonatkozó tükrözése: az L egyenes egyik oldalán levő P pontnak olyan P 0 felel meg képként az L másik oldalán, amelyikre vonatkozóan az L egyenes a PP 0 szakasz felező merőlegese. Vannak transzformációk, amelyekben a sík egyes pontjai a helyükön maradnak, ezeket a pontokat a transzformáció fixpontjai nak nevezzük. A tükrözésben az L egyenes pontjai fixpontok. A transzformáció további példájaként megemlítjük a sík elforgatását egy rögzített O pont körül, azután a sík párhuzamos eltolását, ami minden pontot valamely d távolsággal mozdít el adott irányban (utóbbi transzformációban nincs fix pont), vagy általánosabban a sík merev mozgásait, amik elforgatásokból és párhuzamos eltolásokból tevődnek össze. A jelen esetben a minket érdeklő körre vonatkozó inverzió a transzformációk osztályának speciális esete. (Nevezik körre vonatkozó tükrözésnek is, mivel némely szempontból kép és eredetije között körtükör által létesített összefüggéssel szemléltethető.) Legyen adva egy rögzített síkban egy C kör, melynek középpontja O (amelyet az inverzió középpontjának nevezünk), sugara pedig r. Definiáljuk P képeként azt a P 0 pontot, amely az OP egyenesen fekszik, O pont ugyanazon oldalán mint P, és kielégíti az OP · OP 0 = r2
178
(1)
egyenletet. P és P 0 pontokat C körre vonatkozóan inverz pontoknak nevezzük. Ebből a definícióból következik, hogy ha P 0 a P inverz pontja, akkor P is inverz pontja P 0 -nek. Az inverzió felcseréli a C körön kívüli és belüli pontokat, mivel ha OP < r, akkor OP 0 > r és ha OP > r, akkor OP 0 < r. A sík egyedüli pontjai, amelyek az inverzióban helyükön maradnak, a C kör kerületén fekvő pontok. Az (1) szabály nem definiálja az O középpont képét. Nyilvánvaló, hogy mennél jobban közeledik egy mozgó P pont O-hoz, a pont P 0 képe a sík annál távolabbi részébe esik. Ezért néha azt szoktuk mondani, hogy az inverzióban az O pont a sík végtelen távoli pontjának felel meg. Ez a szólásmód azért hasznos, mert lehetővé teszi, hogy kivétel nélkül minden pontra kijelenthessük: az inverzió kölcsönösen egyértelmű vonatkozást létesít a sík pontjai és azok képei között, azaz a sík minden pontjának egy és csak egy képe van, s viszont a sík minden pontja egy és csak egy pontnak a képe. Az összes eddig említett transzformáció rendelkezik ezzel a tulajdonsággal. 2. Az inverzió tulajdonságai
39. ábra. Az L egyenes körre vonatkozó inverziója Az inverzió legfontosabb tulajdonsága az, hogy egyeneseket és köröket újból egyenesekbe és körökbe visz át. Pontosabban, megmutatjuk, hogy az inverzió (a) O ponton átmenő egyenest O pontban átmenő egyenesbe visz át,
179
40. ábra. A kör inverziója (b) O ponton át nem menő egyenest O ponton átmenő körbe visz át, (c) O ponton átmenő kört O ponton át nem menő egyenesbe visz át, (d) O ponton át nem menő kört O ponton át nem menő körbe visz át. Az (a) állítás nyilvánvaló, hiszen az inverzió definíciója szerint bármely, az O ponton átmenő egyenes bármely pontjának képe ugyanezen egyenes valamely másik pontja, úgyhogy bár az egyenes pontjai felcserélődnek az inverzióban, az egész egyenes önmagába megy át. (b) állítás bizonyítására húzzunk merőlegest O pontból L egyenesre (39. ábra). Legyen A az a pont, melyben ez az egyenes metszi L-et, és legyen A 0 az A pont inverze. Jelöljünk ki L-en egy tetszőleges P pontot, és legyen P 0 a P-nek megfelelő inverz pont. Mivel OA 0 · OA = OP 0 · OP = r2 , következik, hogy OA 0 OP = . 0 OP OA Tehát OP 0 A 0 és OAP hasonló háromszögek és OP 0 A 0 szög derékszög. Az elemi geometria törvényei szerint P 0 az OA 0 átmérőjű K körön van, úgyhogy L inverz képe K kör. Ezáltal (b) bizonyítást nyert. (c) állítás következik abból a tényből, hogy az inverzió kölcsönösen egyértelmű leképezés: L inverze K, K inverze L. Hátra van még (d) állítás igazolása. Legyen K bármely O ponton át nem menő kör, melynek középpontja M és sugara k. Ezen kör képének megszerkesztésére húzzunk az O ponton keresztül egyenest, amely a K kört A és B pontban metszi, és határozzuk meg, hogyan változnak ezen pontok A 0 , B 0 képei, ha az O ponton át húzott egyenes K kört az
180
összes lehetséges módon metszi. Jelöljük az OA, OB, OA 0 , OB 0 , OM távolságokat rendre a, b, a 0 , b 0 , m betűkkel és legyen t az O pontból K körhöz húzott érintő hosszúsága. Az inverzió definíciója szerint aa 0 = bb 0 = r2 , továbbá a kör egy, az elemi geometriából ismert tulajdonsága szerint ab = t2 . Osztva az első egyenlőséget a másodikkal, következik, hogy a 0 /b = b 0 /a = r2 /t2 = c2 , ahol c2 az r és t értékétől függő állandó és A, B pontok minden helyzetére azonos. Húzzunk A 0 ponton keresztül BM egyenessel párhuzamost, amely OM-et Q-ban metszi, Legyen OQ = q és A 0 Q = ρ. Akkor q/m = a 0 /b = ρ/k, vagy q = ma 0 /b = mc2 ,
ρ = ka 0 /b = kc2 .
Ez annyit jelent, hogy akárhol is vannak A és B pontok a körön, Q mindig ugyanaz a pontja lesz az OM egyenesnek, és az A 0 Q távolság értéke mindig azonos lesz. Hasonlóképpen B 0 Q = ρ, mivel a 0 /b = b 0 /a. Így K kör minden A, B pontjának a képe olyan pont, amely Q ponttól mindig azonos ρ távolságra van, azaz K képe kör. Ezáltal (d) bizonyítást nyert. 3. Inverz pontok geometriai megszerkesztése
41. ábra. A körön kívül fekvő pont körre vonatkozó inverziója A jelen fejezet 4. pontjában fogjuk felhasználni a következő tételt: Adott P pont C
181
körre vonatkozó P 0 inverze megszerkeszthető pusztán körző használatával. Tekintsük először azt az esetet, amikor az adott P pont a C körön kívül fekszik. Rajzoljunk P mint középpont körül OP sugárral körívet, amely a C kört R és S pontban metszi. Ezen két pont mint középpont körül húzzunk r sugárral köríveket, amelyek az OP egyenes O és P 0 pontjában metszik egymást. Az ORP és ORP 0 egyenlő szárú háromszögekben ORP^ = POR^ = OP 0 R^, tehát a háromszögek hasonlóak, és OP OR = , OR OP 0
azaz
OP · OP 0 = r2 .
Tehát P keresett inverze, ami megszerkesztendő volt, P 0 . Ha az adott P pont a C körön belül fekszik, ugyanez a szerkesztés és bizonyítás alkalmazható, feltéve, hogy a P körül OP sugárral rajzolt kör metszi két pontban C-t. Ha nem metszi, P 0 inverz pont megszerkesztését a következő egyszerű fogással vezethetjük vissza az előbbi esetre.
42. ábra. A vonalszakasz megkettőzése Mindenekelőtt figyeljük meg, hogy pusztán körző segítségével találhatunk két adott, A és O pontot összekötő egyenesen egy olyan C pontot, amely kielégíti az AO = OC egyenlőséget. Ennek igazolására rajzoljunk O körül r = AO sugárral kört, és jelöljük ki ezen a körön A pontból kiindulva P, Q, C pontokat úgy, hogy AP = PQ = QC = r legyen (42. ábra). A keresett pont valóban C, amint az látható abból a tényből, hogy az AOP, OPQ, OQC háromszögek egyenlő oldalúak, és így AO és OC 180◦ -os szöget
182
43. ábra. A kör belső pontjának a körre vonatkozó inverziója alkotnak és OC = OQ = AO. Az eljárás ismétlésével az AO szakaszt tetszőlegesen megsokszorozhatjuk. Mellékesen megjegyezve, mivel AQ szakasz hosszúsága, amint azt √ az olvasó könnyen igazolhatja, r 3, ezáltal megszerkesztettük az egységből vonalzó √ használata nélkül 3-at. Most a következőképpen találjuk meg a C körön belül fekvő tetszőleges P pont inverzét (43. ábra). Először keresünk az OP egyenesen egy olyan R pontot, amelynek O-tól való távolsága OP egészszámú többszöröse, és amely pont C körön kívül fekszik: OR = n · OP. Ebből a célból körzővel annyiszor egymás után mérjük felaz OP távolságot, amíg a C kör kerületén kívül jutunk. Most R pont R 0 inverzét a fentebb adott módon megszerkeszthetjük. Akkor r2 = OR 0 · OR = OR 0 · (n · OP) = (n · OR 0 ) · OP. Tehát a P pont keresett inverze az a P 0 pont, amelyre OP 0 = n · OR 0 . 4. Vonalszakasz megfelezése és a kör középpontjának meghatározása pusztán körző használatával Miután megtanultuk, hogyan kell pusztán körző használatával meghatározni egy adott pont inverzét, végrehajthatunk néhány érdekes szerkesztést. Tekintsük pl. két A és B pont közötti távolság felezőpontjának a meghatározását csupán körző használatával
183
44. ábra. Vonalszakasz felezőpontjának meghatározása
45. ábra. A kör középpontjának meghatározása (egyenest egyáltalán nem szabad rajzolni!). Íme a megoldás: Rajzoljunk B mint középpont körül AB sugárral kört, és jelöljünk ki A pontból kiindulva ezen a körön három pontot. A harmadik pont, jelöljük C-vel, az AB egyenesen fog feküdni és AB = BC. Rajzoljunk most A mint középpont körül AB sugárral kört, és legyen C 0 pont C ezen körre vonatkozó inverze. Akkor AC 0 · AC = AB2 AC 0 · 2AB = AB2 2AC 0 = AB.
184
Tehát C 0 a keresett felezőpont. Másik inverz pontokat felhasználó körzőszerkesztés, adott kör ismeretlen középpontjának a meghatározása. Választunk a kör kerületén egy tetszőleges P pontot és rajzolunk körülötte egy kört, amely az adott kört R és S pontban metszi. Ezek körül mint középpontok körül RP = SP sugárral körvíveket rajzolunk, amelyek Q pontban metszik egymást. A 41. ábrával való összehasonlításból látjuk, hogy a keresett középpont Q pont P körül rajzolt körre vonatkozó Q 0 inverze, s így Q 0 -t megszerkesztettük pusztán körző használatával.
5. § Egyéb segédeszközöket használó szerkesztések. Mascheroniféle szerkesztések pusztán körző használatával *1. A kocka megkettőzésének klasszikus szerkesztési módja Eddig csak olyan geometriai szerkesztéseket tárgyaltunk, amelyekben körzőn és vonalzón kívül egyéb segédeszközt nem használtunk. Ha egyéb segédeszközöket is megengedünk, a lehetséges szerkesztések köre természetesen kibővül. A görögök pl. a következőképpen oldották meg a kocka megkettőzésének problémáját. Tekintsünk (mint a 46. ábrán látható) egy MZN merev derékszöget és a B, VW, PQ mozgatható derékszögű keresztet. Legyen továbbá két RS és TU vonalzó eltolása megengedve a derékszög száraira merőleges két irányban. Válasszunk a kereszten két E és G rögzített pontot úgy, hogy GB = a és BE = f távolság előírt hosszúságú legyen. Helyezzük el a keresztet úgy, hogy E pont a derékszög NZ, G pont az MZ szárán legyen. A TU és RS vonalzók elcsúsztatásával az egész készüléket olyan helyzetbe hozhatjuk, amelyben a kereszt BW, BQ, BV szárai az ADEZ négyszög A, D, E csúcsain haladnak át. Ilyen elrendezés mindig lehetséges, ha f > a. Azonnal látjuk, hogy a : x = x : y = y : f, ahonnan ha a készülékben f-et egyenlővé tesszük 2a-val x3 = 2a3 . Tehát x olyan kockának az éle, melynek térfogata kétszerese az a élű kocka térfogatának, amint azt a kocka megkettőzésének feladata megköveteli.
185
46. ábra. A kocka megkettőzésére szolgáló eszköz 2. A körző geometriája Sokféle segédeszköz használatával természetesen igen sokféle szerkesztési feladatot tudunk megoldani, ebből arra lehetne következtetni, hogy az eszközök korlátozása csökkenti a lehetséges szerkesztések számát. Éppen ezért igen meglepő volt az olasz Mascheroni nak (1750–1800) az a felfedezése, hogy minden körzővel és vonalzóval végrehajtható szerkesztés elvégezhető pusztán körző használatával is. Két pontot összekötő egyenest természetesen nem lehet meghúzni vonalzó nélkül, úgyhogy ezt az alapvető szerkesztést Mascheroni elmélete valójában nem foglalja magában. Ehelyett az egyenest bármely két pontja által adottnak kell tekinteni. Két ily módon adott egyenes metszéspontját meg lehet határozni pusztán körző használatával, és ugyanígy meg lehet határozni egy
186
adott kör és egy egyenes metszéspontjait is.
47. ábra. Körív felezése körzővel Talán legegyszerűbb példája a Mascheroni-féle szerkesztéseknek egy adott AB szakasz megkettőzése. A megoldást már láttuk a 182. oldalon. A 183. oldalon azt is megmutattuk, hogyan kell meghatározni adott vonalszakasz felezőpontját. Most azt a feladatot oldjuk meg, hogyan kell megfelezni egy O középpontú kör adott AB ívét. A szerkesztés a következő: rajzoljunk A és B pontból mint középpontból AO sugárral egy-egy körívet. Messük el ezeket O pontból AB-vel egyenlő sugarú OP és OQ ívekkel. Rajzoljunk P és Q mint középpont körül PB és QA sugarakkal köríveket amelyek R pontban metszik egymást. Végül rajzoljunk körívet P vagy Q mint középpont körül OR sugárral, amíg metszi AB-t; ez a metszéspont az AB ív keresett középpontja. (47. ábra). A bizonyítást feladatként az olvasóra bízzuk. Mascheroni általános tételét lehetetlen lenne úgy igazolni, hogy minden körzővel és vonalzóval végrehajtható szerkesztést ténylegesen elvégeznénk pusztán körző alkalmazásával, mivel a körzővel és vonalzóval végrehajtható szerkesztések száma nem véges. De ugyanezt a célt elérhetjük annak a bizonyításával is, hogy a következő négy alapszerkesztés mindegyike elvégezhető pusztán körző használatával. A kérdéses négy szerkesztés:
1. Rajzoljunk adott középpont körül adott sugárral kört. 2. Keressük meg két kör metszéspontjait. 3. Keressük meg egy egyenes és egy kör metszéspontjait.
187
4. Keressük meg két egyenes metszéspontját. Minden szokásos értelemben vett geometriai szerkesztés, körző és vonalzó használatát megengedve ennek a négy elemi szerkesztésnek véges számú ismétIéséből áll. Az első kettőről azonnal nyilvánvaló, hogy elvégezhető pusztán körző használatával is. Nehezebb a 3. és 4. probléma, ezek megoldása az előző pontban ismertetett inverzió tulajdonságain alapszik.
48. ábra. Kör és középpontján át nem haladó egyenes metszéspontjai
49. ábra. Kör és középpontján áthaladó egyenes metszéspontjai Oldjuk meg a 3. problémát, azaz határozzuk meg C kör és két, A és B pontja által adott egyenes metszéspontjait. (48. ábra). A ill. B mint középpont körül rajzoljunk AO,
188
ill. BO sugárral egy-egy körívet, amelyek P pontban metszik egymást. Határozzuk meg a P pont C körre vonatkozó Q inverzét a 181. oldalon megadott szerkesztés szerint, pusztán körző használatával. Rajzoljunk Q mint középpont körül QO sugárral kört (ennek a körnek metszenie kell C-t); eme kör adott C körrel való X és X 0 metszéspontjai a keresett pontok. Bizonyításként csak azt kell megmutatni, hogy X és X 0 egyenlő távolságra vannak O és P pontoktól, mivel A és B pontokra már a szerkesztés szerint áll ugyanez. A kívánt tulajdonság következik abból a tényből, hogy Q inverze olyan pont, melynek X és X 0 pontoktól való távolsága egyenlő a C kör sugarával (l. 181. o.). Jegyezzük meg, hogy az X, X 0 , O pontokon átmenő kör AB egyenes inverze, mivel ez a kör és AB egyenes a C kört ugyanazon pontokban metszi (a kör kerületén levő pontok egybeesnek saját inverzükkel). A szerkesztés csupán abban az esetben veszíti érvényét, ha AB egyenes C középpontján halad át. Azonban akkor a metszéspontokat, a 187. oldalon megadott szerkesztés szerint, meg lehet kapni, ha B pont körül tetszőleges sugárral rajzolunk C-t B1 és B2 pontokban metsző körívet, és meghatározzuk ezen pontok által C körön kijelölt két körív középpontjait. (49. ábra).
50. ábra. Két egyenes metszéspontja Két adott pontot összekötő egyenes inverz körének a meghatározása a 4. probléma közvetlen megoldását teszi lehetővé. Legyenek AB és A 0 B 0 az adott egyenesek (50. ábra).
189
Rajzoljunk a síkban tetszőleges C kört, és határozzuk meg a fenti módszer szerint AB és A 0 B 0 inverz köreit. Ez a két kör O és Y pontban metszi egymást. A keresett metszéspont az Y pont X inverze, és a már ismert módon megszerkeszthető. Az, hogy valóban X a keresett pont, nyilvánvaló abból a tényből, hogy Y az egyetlen pont, amely AB és A 0 B 0 egy-egy pontjának egyaránt inverz megfelelője, tehát Y pont X inverzének az AB és az A 0 B 0 egyeneseken egyaránt rajta kell lenni. Ez a két szerkesztés teljessé teszi a csak körzőt használó Mascheroni-féle szerkesztések és a körzőt-vonalzót használó közönséges geometriai szerkesztések közötti ekvivalencia bizonyítását. Nem törekedtünk itt egyes speciális problémák elegáns megoldására, mivel inkább az volt a célunk, hogy a Mascheroni-féle szerkesztések általános használhatóságát szemléltessük. Adjuk meg mégis most példaként a szabályos ötszög szerkesztését! Pontosabban: meghatározunk a kör kerületén öt olyan pontot, amelyek a körbe írt szabályos ötszög csúcsai.
51. ábra. Szabályos ötszög szerkesztése Legyen A az adott K kör tetszőleges pontja. A körbe írható szabályos hatszög oldala egyenlő a K kör sugarával. Találhatunk tehát K körön B, C, D pontokat úgy, hogy _
_
_
AB=BC=CD= 60◦ legyen (51. ábra). A és D mint középpont körül rajzoljunk AC sugárral köríveket, amelyek X pontban metszik egymást. Akkor ha O a K kör középpontja, _
az A körül OX sugárral rajzolt körív K-t BC ív F felezőpontjában metszi (l. 187. o.).
190
Rajzoljunk most F körül K kör sugarával két körívet, amelyek K-t G és H pontban metszik. Legyen Y a G és H ponttól egyaránt OX távolságra levő pont, O pont ellenkező oldalán mint X. A keresett szabályos ötszög oldala AY-nal lesz egyenlő. A bizonyítást feladatként az olvasóra bízzuk. Vegyük észre, hogy ebben a szerkesztésben csupán három különböző körsugarat használtunk. 1928-ban Hjelmslev dán matematikus egy koppenhágai antikváriumban talált egy 1672-ben megjelent, Euclides Danicus című könyvet. A könyv szerzője egy G. Mohr nevű egyébként ismeretlen ember volt. A címből arra lehetett volna következtetni, hogy ez a könyv egyszerű változata vagy kommentárja Euklidész Elemei nek. Azonban amikor Hjelmslev megvizsgálta a könyvet, nagy meglepetéssel vette észre, hogy lényegében Mascheroni problémáját és teljes megoldását tartalmazza, sok évvel Mascheroni előtt. Feladatok: Az alábbiakban adjuk a Mohr-féle szerkesztések leírását. Igazoljuk érvényességüket. Mutassuk ki, miért oldják meg a Mascheroni-féle problémát? 1) Emeljünk p hosszsúságú AB vonalszakaszra merőleges BC szakaszt. (Útmutatás: hosszabbítsuk meg AB-t D pontig úgy, hogy AB = BD legyen. A és D mint középpont körül rajzoljuk két tetszőleges kört, és határozzuk meg C-t.) 2) Legyen adva a síkon két p és q hosszúságú szakasz úgy, hogy p > q legyen. Szerkesszük p meg 1) segítségével az x = p2 − q2 hosszúságú szakaszt. √ 3) Szerkesszük meg adott a hosszúságú szakaszból az a 2 szakaszt. (Útmutatás: Használjuk √ √ fel az (a 2)2 = (a 3)2 − a2 egyenlőséget.) p 4) Szerkesszük meg adott p és q szakaszokból az x = p2 + q2 szakaszt. (Útmutatás: Használjuk fel az x2 = 2p2 − (p2 − q2 ) összefüggést.) Keressünk más hasonló szerkesztéseket. 5) Legyen adva a sík tetszőleges helyén két p és q hosszúságú szakasz. Határozzuk meg az előbbiek alapján a p + q és p − q hosszúságú szakaszokat. 6) Ellenőrizzük és igazoljuk egy adott a hosszúságú AB szakasz M felezőpontjának a meghatározására szolgáló alábbi szerkesztést. Hosszabbítsuk meg AB-t és jelöljük ki rajta C és D pontokat úgy, hogy CA = AB = BD legyen. Szerkesszünk EC = ED = 2a hosszúsággal ECD egyenlő szárú háromszöget, és az EC és ED átmérők fölé rajzolt körök metszéspontjaként határozzuk meg M-t. 7) Keressük meg valamely A pont BC egyenesre való merőleges vetületét. 8) Legyenek a, p, q adott szakaszok. Keressünk egy x szakaszt úgy, hogy x : a = p : q legyen. 9) Legyenek a és b adott szakaszok, keressük meg az x = ab szakaszt.
Mascheroni munkája ösztönözte Jacob Steiner t (1796–1863), hogy megkísérelje a
191
körző helyett a vonalzót tüntetni ki egyetlen megengedett segédeszközként. Mivel a vonalzó nem vezet túl egy adott számtesten, természetesen nem lehet elegendő a klasszikus értelemben vett geometriai szerkesztések összességének az elvégzésére. Annál figyelemreméltóbb, hogy Steiner képes volt a körző használatát egyetlen, egyszeri alkalmazásra korlátozni. Bebizonyította, hogy a síkon mindazok a szerkesztések, amelyek elvégezhetők körző és vonalzó használatával, elvégezhetők vonalzó egyedüli alkalmazásával is, feltéve, hogy egyetlen rögzített kör és középpontja2 adott. Ezeket a szerkesztéseket, minthogy projektív módszereket igényelnek, később tárgyaljuk (l. 244. o.). 3. Rajzolás mechanikus eszközökkel. Mechanikus görbék. Cikloisok A megszerkeszthető síkidomok számát igen nagymértékben megnövelhetjük a körtől és az egyenestől különböző görbék rajzolására szolgáló mechanizmusok segítségével. Pl., ha van az xy = k hiperbolák és az y = ax2 + bx + c parabolák rajzolására szolgáló eszközünk, akkor bármely olyan probléma, amely az ax3 + bx2 + cx = k
(1)
harmadfokú egyenletre vezet, megoldható szerkesztés útján, pusztán ennek a két műszernek a segítségével. Ugyanis ez az egyenlet megoldható xy = k,
y = ax2 + bx + c
(2)
egyenletek egyidejű megoldásával, ha y-t kiküszöböljük. Azaz (1) gyökei a (2)-ben megadott parabola és hiperbola metszéspontjainak az x koordinátái. Így (1) megoldásai 2
A kör és középpontjának megadása nem nélkülözhető. Pl., ha adva van a kör, de nincs megadva a középpontja, az utóbbit lehetetlen pusztán vonalzóval meghatározni. Ennek az állításnak a bizonyítására fel kell használnunk egy később (270. o.) bizonyítandó tényt: Létezik a sík egy önmagára való leképezése, amely az alábbi tulajdonságokkal rendelkezik: a) Az adott kör nem változik a transzformációban. b) Minden egyenes egyenesbe megy át. c) A kör középpontja valamely más pontba megy át. Egy ilyen transzformáció puszta léte mutatja az egyedül vonalzóval törénő szerkesztés lehetetlenségét az adott kör középpontjának a megadása nélkül. Ugyanis bármilyen legyen is a szerkesztés, tartalmaznia kell egyenesek húzását és ezek egymással, valamint az adott körrel való metszéspontjainak a meghatározását. Mármost, ha az egész ábrát, amely az adott körből és a szerkesztés pontjaiból és vonalaiból áll, annak a transzformációnak vetjük alá, amelynek a létezését éppen most tételeztük fel, a kapott alakzat ki fogja elégítení a szerkesztés minden követelményét, de eredményként olyan pontot szolgáltat, amely különbözik az adott kör középpontjától. Tehát ilyen szerkesztés nem lehetséges.
192
52. ábra. Harmadfokú egyenlet grafikus megoldása megszerkeszthetők, ha rendelkezünk olyan eszközökkel, amelyekkel meg lehet rajzolni a (2) alatti parabolát és hiperbolát. A matematikusok már az ókor óta tudják, hogy egyszerű mechanikus eszközökkel sok érdekes görbe definiálható és rajzolható meg. Ezek közül a „mechanikus görbék” közül a ciklois a legfigyelemreméltóbb. Ptolemaiosz (kb. i. sz. 200) igen szellemes módon használta a cikloisokat a bolygók égi mozgásának leírására. A legegyszerűbb ciklois az a görbe, amelyet az egyenes mentén csúszás nélkül legördülő
193
53. ábra. Ciklois
54. ábra. Általános ciklois kör egy rögzített pontja ír le. Az 53. ábrán láthatjuk a gördülő kör P pontjának négy helyzetét. Egészben véve, a ciklois egyenesen nyugvó ívek sorának látszik. Ha a P pont vagy a körön belül (mintegy a kerék küllőjén), vagy a kör egy sugarának a meghosszabbításán (pl. a vonatkerék karimáján) van, ennek az egyszerű cikloisnak a változatait kapjuk. Az 54. ábra két ilyen görbét ábrázol. A ciklois további változatát kapjuk, ha a gördülő kör nem egyenesen, hanem egy másik körön gördül le. Ha az r sugarú c gördülő kör belülről érint legördülés közben egy nála nagyobb R sugarú C kört, a c kör egy rögzített pontja által definiált mértani helyet hipocikloisnak nevezzük. Ha a c kör belülről érintve éppen egyszer gördült le a C körön, a P pont csak akkor tért vissza eredeti helyére, ha C sugara egész számú többszöröse c sugarának. Az 55. ábra az R = 3r esetet ábrázolja. Általánosabban, ha C sugara m/n-szerese c sugarának, a hipociklois n teljes legördülés után zárul és m ívből áll. Érdekes speciális eset áll elő, ha R = 2r. Ekkor a legördülő kör bármely P pontja a nagyobbik kör átmérőjét írja le (56. ábra). Feladatként az olvasóra bízzuk ennek az igazolását. További ciklois-féleség keletkezik, ha a mozgó kör kívülről érinti a rögzített kört,
194
55. ábra. Három ágú hipociklois amelyen legördül. Az ilyen görbét epicikloisnak nevezzük. *4. Csuklós szerkezetek. Peaucellier-féle és Hart-féle inverzorok Szakítsuk meg egyelőre a cikloisok tárgyalását (majd megjelennek még, amikor nem is várjuk), s tekintsük a görbék előállításának más módjait. Görbék rajzolására legegyszerűbb mechanikai eszköz a csuklós szerkezet. A csuklós szerkezet csuklók segítségével mozgathatóan összekötött merev rudakból áll, s az elrendezés elegendő mozgási szabadságot biztosít ahhoz, hogy egyetlen pontja valamilyen görbét írjon le. Az iránytű pl. voltaképpen semmi egyéb, mint egyszerű csuklós szerkezet: egyetlen, egy pontban rögzített merev rúd. Csuklós szerkezeteket régóta használnak gépek szerkesztésében. A csuklós szerkezetek egyik történelmileg híres példáját, az ún. „Watt-féle paralelogrammát” James Watt fedezte fel, hogy gőzgépe dugattyúját úgy kapcsolhassa a lendítőkerék egy pontjához, hogy utóbbi forgása a dugattyút egyenes vonalban mozgassa. Watt megoldása azonban csak megközelítőleg volt pontos, s azután is, számos kitűnő matematikus fáradozása ellenére, sokáig nem sikerült olyan csuklós szerkezetet előállítani, amely egy pontot pontosan egyenes vonal mentében mozgatna. Később, amikor úgy a múlt század közepe táján az egyes problémák megoldhatatlanságának bizonyítása szélesebb körökben kezdett érdeklődést kelteni, felmerült az a sejtés, hogy ilyen csuklós szerkezet előállítása
195
56. ábra. Kétszeres sugarú körön belülről legördülő kör egy pontjának egyenes vonalú mozgása
57. ábra. Egyenes vonalú mozgás átalakítása körmozgássá talán lehetetlen is. Nagy volt a meglepetés, amikor 1864-ben egy francia tengerésztiszt, Peaucellier, egyszerű csuklós szerkezettel megoldotta a kérdést. Most már csak megfelelő kenőanyagokat kellett alkalmazni, s a probléma a gőzgépek szempontjából ezzel megoldódott. A Peaucellier-féle csuklós szerkezet célja a körmozgás egyenes vonalú mozgássá való átalakítása. A megoldás a 4. §-ban tárgyalt inverzió elméletén alapul. Mint az 58. ábrán látható, a csuklós szerkezet hét merev rúdból áll, kettőnek közülük t a hosszúsága, négynek s, a hetedik pedig tetszőleges hosszúságú. O és R két rögzített pont úgy elhelyezve, hogy OR = PR legyen. A mondott feltételektől eltekintve, az egész készülék szabadon mozog. Be fogjuk bizonyítani, hogy ha P pont R körül PR sugárral
196
58. ábra. Forgó mozgás Peacuellier-féle átalakítása valódi egyenes vonalú mozgássá körívet ír le, akkor a Q pont egyenes vonalszakaszt ír le. Jelöljük az S-ből OQ-ra bocsátott merőleges talppontját T -vel. Látjuk, hogy OP · OQ = (OT − PT )(OT + PT ) = OT 2 − PT 2 = = (OT 2 + ST 2 ) − (PT 2 + ST 2 ) = = t2 − s2 A t2 − s2 mennyiség állandó, jelöljük r2 -tel. Mivel OP · OQ = r2 , P és Q inverz pontok az r sugarú és O középpontú körre vonatkoztatva. Ha P pont előírt körpályáját írja le (amely áthalad az O ponton), akkor Q körnek megfelelő inverz görbén mozog. Az utóbbi inverz alakzat azonban egyenes kell legyen, mivel láttuk, hogy a O ponton, az inverzió alapkörének a középpontján áthaladó kör inverze egyenes. Így tehát Q pályája egyenes vonal, amit vonalzó használata nélkül húztunk. Másféle, ugyanezt a problémát megoldó csuklós szerkezet a Hart-féle inverzor. Ez öt, az 59. ábrán látható módon összekötött merev rúdból áll. Itt AB = CD, BC = AD. O pont az AB rúd rögzített pontja, P az AD-é, Q a CB-é, úgy elrendezve, hogy AO/OB = AP/PD = CQ/QB = m/n legyen. O és S a sík rögzített pontjai, melyek kielégítik az OS = PS egyenlőséget, egyebekben pedig a csuklós szerkezet szabadon mozog.
197
59. ábra. Hart-féle inverzor Nyilvánvaló, hogy AC mindig párhuzamos BD-vel. Tehát O, P, Q pontok kollineárisak, és OP párhuzamos AC-vel. Bocsássuk A és C pontból AE és CF merőlegeseket BD-re. Felírhatjuk, hogy AC · BD = EF · BD = (ED + EB)(ED − EB) = ED2 − EB2 . Azonban ED2 + AE2 = AD2 , és EB2 + AE2 = AB2 . Tehát ED2 − EB2 = AD2 − AB2 . Továbbá OP/BD = AO/AB = m/(m + n)
és
OQ/AC = OB/AB = n/(m + n).
Így OP · OQ = [mn/(m + n)2 ]BD · AC = [mn/(m + n)2 ](AD2 − AB2 ). Ez a mennyiség a csuklós szerkezet minden lehetséges helyzetében azonos Tehát P és Q inverz pontok valamely O pont körül leírt körre vonatkozó inverzióban. Ha az inverzor mozog, P az O ponton áthaladó kört ír le S körül, P pont Q inverze pedig egyenest. Szerkeszthetők más csuklós szerkezetek is (legalábbis elvben), amelyek ellipsziseket,
198
hiperbolákat, s általában bármely f(x, y) = 0 tetszőleges fokú algebrai egyenlet által adott görbét írnak le.
6. § Az inverzió néhány sajátsága és alkalmazása 1. Szögállandóság. Körseregek Jóllehet az inverzió alaposan megváltoztatja a geometriai alakzatok külsejét, mégis, s ez annál figyelemre méltóbb, az inverz alakzat továbbra is megtartja az eredeti alakzat nagyon sok tulajdonságát. Ezeket a tulajdonságokat, amelyek az adott transzformáció alatt nem változnak, „invariánsak”-nak nevezzük az illető transzformációra vonatkozóan. Láttuk már, hogy az inverzió köröket és egyeneseket újból körökbe és egyenesekbe visz át. Ehhez most további fontos tulajdonságként csatoljuk a következőt: Két egyenes vagy két görbe közötti szög inverzióban nem változik. Ez annyit jelent, hogy az inverzió bármely két egymást metsző görbét olyan két görbére visz át, amelyek egymást ugyanekkora szög alatt metszik. Két görbe által bezárt szögön természetesen az érintőik által bezárt szöget értjük.
60. ábra. Inverzióban a szögek változatlanok maradnak
199
A bizonyítás a 60. ábra alapján érthető, amely OL egyenest P pontban metsző C görbe speciális esetét ábrázolja. C görbe C 0 inverze P 0 pontban metszi OL egyenest. P 0 a P inverze, s mivel OL önmaga inverze, P 0 szükségképpen OL egyenesen fekszik. Bebizonyítjuk, hogy az OL és a C görbe P pontban húzott érintője által bezárt x0 szög ugyanakkora, mint az inverzió által hozzárendelt y0 szög. Válasszunk ebből a célból C görbén P pont közelében egy A pontot, és húzzuk meg az AP szelőt. A pont A 0 inverzének egyaránt rajta kell lenni OA egyenesen és C 0 görbén, tehát metszéspontjuk kell legyen. Húzzuk meg A 0 P 0 szelőt. Az inverzió definíciója szerint r2 = OP · OP 0 = OA · OA 0 vagy OP OA 0 = , OA OP 0 azaz OAP és OA 0 P 0 háromszögek hasonlóak. Tehát x szög egyenlő OA 0 P 0 szöggel, amelyet y-nal jelölünk. Mozogjon most A pont C görbe mentén P pont felé. Ekkor AP szelő C görbét P pontban érintő egyeneshez, x szög pedig x0 szöghöz tart. Ugyanakkor A 0 tart P 0 -höz és A 0 P 0 egyenes C 0 görbe P 0 -beli érintőjéhez y szög pedig tart y0 szöghöz. Mivel A minden helyzetében egyenlőek x és y, szükségképpen egyenlőek határértékeik is: x0 = y0 . Eddigi bizonyításunk nem teljes, mivel csupán azt a speciális esetet tekintettük, amikor a görbe egy O ponton áthaladó egyenest metsz. Azonban ezek után egymást P pontban z szög alatt metsző két C, C∗ görbe általános esete könnyen elintézhető. Nyilvánvaló ugyanis, hogy OPP 0 egyenes a z szöget két olyan szögre osztja, amelyek mindegyike invariáns az inverzió alatt. Megjegyzendő, hogy bár az inverzió megtartja a szögek nagyságát, az irányított szögek forgásirányát megváltoztatja. Azaz, ha egy P-n átmenő félegyenes x0 szöget az óramutató járásával ellentétes irányban súrolja, képe y0 szöget az óramutató járásával megegyező irányban fogja súrolni. A szög inverzió alatti invarianciájának egyik következménye, hogy két ortogonális (azaz egymást derékszög alatt metsző) egyenes vagy kör inverz képe újból ortogonális,
200
továbbá, hogy két egymást érintő, azaz nulla szög alatt metsző kör inverz képe is egymást érintő körök.
61. ábra. Ortogonális körök két rendszere közötti inverzió Tekintsük az inverzió O pólusán és a sík valamely más A rögzített pontján áthaladó körök seregét. A 4. § második pontjából tudjuk, hogy körsereg inverz képe az A pont A 0 inverzén áthaladó egyenesekből álló egyenessereg. Az eredeti sereg köreire merőleges körökből álló körsereg az A 0 ponton atmenő egyenesekre merőleges körökből álló körseregbe megy át, amint az a 61. ábrán látható. (Az ortogonális köröket szaggatott vonallal tüntetjük fel.) Az egy pontban összefutó egyenesek egyszerű alakzata látszólag igen különböző a tárgyalt körseregtől, mégis azt lájuk, hogy közeli rokonok, mi több, az inverzió elmélete szempontjából teljesen ekvivalensek. Másik speciális példája az inverzió hatásának egymást az inverzió pólusában érintő körökből álló körsereg esetében figyelhető meg. Transzformáció után ezek a körök párhuzamos egyenesek rendszerébe mennek át, mivel az inverzió ezeket a köröket olyan egyenesekbe viszi át, melyek között nincs két egymást metsző, hiszen az eredeti körök egyedül O pontban találkoztak.
201
62. ábra. Egymást érintő körök transzformációja párhuzamos egyenesekbe 2. Alkalmazás az Apollóniosz-féle feladatok megoldására Szép példa az inverzióelmélet hasznosságára az Apollóniosz-féle feladatok alábbi egyszerű geometriai megoldása. Ha tetszőleges három körre kell megoldani a feladatot, először is azt kell figyelembe vennünk, hogy a három adott kör bármely pólusra vonatkozó inverzió segítségével transzformálható három más körbe, és a feladat az ezen körökre vonatkozó megfelelő feladatba (adjuk meg, miért?). Ha tehát a feladatot bármely körhármas esetében meg tudjuk oldani, akkor megoldottuk bármely más olyan körhármasra is, amelyet az előbbiből inverzió útján kapunk. Ezt a tényt használjuk, amikor az ekvivalens körhármasok közül kiválasztjuk azt, amelyre a feladat megoldása csaknem triviálisan egyszerű. Induljunk ki három, A, B, C középpontú körből, és tételezzük fel, hogy a keresett O középpontú és ρ sugarú U kör kívülről érinti a három adott kört. Ha mindhárom adott kör sugarát növeljük ugyanazzal a d mennyiséggel, akkor az új feladatot nyilvánvalóan az O középpontú és ρ − d sugarú kör fogja megoldani. Előkészítésképpen ennek a ténynek a segítségével a három adott kört három másik körrel helyettesítjük úgy, hogy kettő közülük érintse egymást K pontban (63. ábra). Azután invertáljuk az egész alakzatot valamely K középpontú körre vonatkozóan. B és C pontok köré írt körök b és c párhuzamos egyenesekbe mennek át, a harmadik kör pedig valamely más a
202
63. ábra. Az Apollóniosz-féle szerkesztés előkészítése
64. ábra. Az Apollóniosz-féle feladat megoldása körbe (64. ábra). Tudjuk, hogy a, b, c megszerkeszthetők pusztán körző és vonalzó használatával. Az ismeretlen U kör egy olyan u körbe transzformálódik, amely érinti b, c egyeneseket és a kört. Nyilvánvaló, hogy u kör r sugara b és c egyenesek közötti távolság felével kell egyenlő legyen. A keresett kör O 0 középpontja b és c egyenesek középpárhuzamosának és A 0 (a kör középpontja) körül r + s sugárral (s az a kör sugara) rajzolt körnek két metszéspontja közül az egyik. Végül, megszerkesztve u kör inverzét megkapjuk a keresett U Appollóniosz-féle kör középpontját. (Ennek a körnek O középpontja az inverzió alapkörére vonatkoztatva inverze annak a pontnak, amely pont u körre vonatkoztatva K pont inverz pontja.)
203
*3. Töbszörös tükrözesek
65. ábra. Ismételt tükrözések merőleges falakon Jól ismert az a különös tükrözési jelenség, amely több tükör használata esetén keletkezik. Ha egy négyszögletes szoba falait ideális, semmi fényt el nem nyelő tükrökkel borítanánk, egyetlen fénylő pontnak végtelen sok képe állana elő. Mindegyik tükrözés által nyert kongruens szobának megfelelne ugyanis egy-egy kép (65. ábra). A tükrök kevésbé szabályos elrendezése esetén – pl., ha három tükrünk van – a képek sokkal bonyolultabb sorozatát kapjuk. A nyert konfiguráció csak akkor írható le könnyen, ha a tükrözésekben előálló háromszögek átfedés nélkül borítják a síkot. Ez csak derékszögű egyenlőszárú háromszögek esetében lehetséges, továbbá egyenlő oldalú háromszögek és az ezeket felező derékszögű háromszögek esetében; l. a 66. ábrát. Sokkal érdekesebb helyzet keletkezik, ha egy körpárra vonatkozó többszörös inverzió esetét tekintjük. Két koncentrikus körtükör közé állva végtelen sok további, ezekkel koncentrikus kört látnánk. Ezeknek a köröknek egyik sorozata a végtelenbe tart, a másik a középpontra húzódik össze. Két egymáson kívül fekvő kör esete valamivel bonyolultabb. Itt a körök és tükörképeik kölcsönösen egymásba tükröződnek, mindegyik következő tükrözésnél kisebbé válva, a két kiinduló körben fekvő egy-egy pontra húzódva össze. (Ezek a pontok mindkét körre vonatkozóan kölcsönösen inverzei egymásnak.) Ez az eset a 67. ábrán látható. Három kör alkalmazása a 68. ábrán látható szép mintát eredményezi.
204
66. ábra. Háromszögű tükrök szabályos konstellációi
67. ábra. Ismételt tükrözések két körből álló rendszeren
205
68. ábra. Tükrözés három körből álló rendszeren
206
IV. fejezet. Projektív geometria. Axiomatika. Nem-euklidészi geometriák 1. § Bevezetés 1. Geometriai tulajdonságok osztályozása. Transzformációk invariánsai A geometria a síkbeli és térbeli alakzatok tulajdonságaival foglalkozik. Ezek a tulajdonságok olyan sokfélék és olyan változatosak, hogy néhány osztályozási elvre van szükség ahhoz, hogy ebben a gazdag tudásanyagban valami rendet teremthessünk. Alapíthatnánk pl. az osztályozási elvet a tételek levezetésében alkalmazott módszerekre. Ebből a szempontból különbséget szokás tenni „szintetikus” és „analitikus” eljárások között. A szintetikus eljárás Euklidész klasszikus axiomatikus módszere, a felépítés itt tisztán geometriai alapokon, az algebrától és a számkontinuum fogalmától függetlenül történik, a tételeket axiómáknak vagy posztulátumoknak nevezett kiinduló állításokból, logikai érveléssel vezetik le. Az analitikus módszer a számkoordináták bevezetésén alapul, és az algebra technikáját használja. Ez a módszer alapvető változást hozott a matematikába: a geometria, analízis és algebra egyetlen organikus rendszerbe való egyesítését eredményezte. Ebben a fejezetben nem annyira a módszer, mint inkább a tartalom szerinti osztályozás lesz fontos. Ez az osztályozás, maguknak a tételeknek a jellegzetességén alapul, nem pedig a levezetésükre használt módszereken. Az elemi síkgeometriában megkülönböztetjük azokat a tételeket, amelyek alakzatok egybevágóságával foglalkoznak, a hosszúság és szög fogalmát használva, azoktól a tételektől, amelyek alakzatok hasonlóságát tárgyalják, pusztán a szög fogalmát alkalmazva. Ez a megkülönböztetés nem nagyon fontos, mivel a hosszúság és szög annyira összetartozó fogalmak, hogy szétválasztásuk meglehetősen mesterkélt. (Éppen ez az összetartozás hozza létre a trigonometria tárgykörének legnagyobb részét.) Mondhatjuk e helyett, hogy az elemi geometria tételei olyan mennyiségek re
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526104008+02’00’
207
vonatkoznak, mint hosszúság, szögmérték, terület. Ebből a szempontból tekintve, két alakzat akkor ekvivalens, ha egybevágó, kongruens, azaz ha az egyik alakzat előállítható a másikból valamely merev mozgás útján, amely csupán a helyzetet változtatja meg, a nagysági viszonyokat nem. De vajon a nagyság fogalma és a kongruencia, valamint hasonlóság ezzel rokon fogalmai lényegesek-e a geometria felépítése szempontjából, vagy pedig vannak a geometriai alakzatoknak alapvetőbb tulajdonságaik, amelyeket a merev mozgásoknál erélyesebb változást okozó transzformáció sem tüntet el? Azonnal látjuk, hogy valóban ez a helyzet.
69. ábra. Kör összenyomása ellipszissé Tegyük fel, hogy négyszögletes puha fatömbbe kört rajzolunk, és meghúzzuk két egymásra merőleges átmérőjét, amint azt a 69. ábrán látjuk. Ha ezt a fatömböt erős satu pofái közé szorítjuk, és eredeti szélességének felére préseljük össze, a körből ellipszis lesz, és a két átmérő által bezárt szög az ellipszis esetében már nem lesz derékszög. A körnek az a tulajdonsága, hogy pontjai egyenlő távolságra vannak a középponttól, ellipszis esetében többé nem igaz. Azt gondolhatnánk tehát, hogy az összenyomás által az eredeti alakzat minden geometriai tulajdonságát elvesztette. Azonban ez távolról sincs így, mert pl. az az állítás, hogy a középpont mindegyik átmérőt felezi, egyaránt igaz a kör és az ellipszis esetében. Íme ez a tulajdonság az eredeti alakzat nagysági viszonyainak meglehetősen durva megváltoztatása után is megmaradt. Ez a megfigyelés a geometriai alakzatokról szóló tételeknek olyan osztályozási lehetőségét veti fel, hogy vajon ezek igazak maradnak-e egyenletes összenyomás után vagy sem. Általánosságban, ha adva van
208
valamely alakzat transzformációinak egy meghatározott osztálya (pl. az összes merev mozgások osztálya, a zsugorítások osztálya, körre vonatkozó inverziók osztálya stb.), kérdezhetjük, hogy az alakzatok mely tulajdonságai maradnak változatlanok az ezen osztályba tartozó transzformációk alkalmazása után. Ezekkel a tulajdonságokkal foglalkozó tételek összessége lesz a transzformációk adott osztályához tartozó geometria. Felix Klein (1849–1925) javasolta 1872-ben egy híressé vált előadásában, hogy a geometriát a tekinthető transzformációk osztályai szerint osszák különböző ágakra (ún. „Erlangeni program”). Azóta ez az elv igen nagy hatással volt a geometriai gondolkozásra. Az V. fejezetben megismerkedünk majd azzal a meglepő ténnyel, hogy geometriai alakzatokhoz annyira hozzá tartozik némely tulajdonságuk, hogy még akkor is megmarad, ha az alakzatot igen önkényes módon deformáljuk, torzítjuk. Így pl. gumidarabra rajzolt alakzatok bárhogyan nyújtva vagy zsugorítva is, megőriznek valamit eredeti jellegzetességükből. Ebben a fejezetben azonban azokkal a tulajdonságokkal foglalkozunk, amelyek a transzformációk egy speciális osztályával szemben invariánsak. Ez az osztály a szigorúan megkötött merev mozgások osztálya és a teljesen tetszőleges torzítások legáltalánosabb osztálya között foglal helyet. Ez az osztály a „projektív transzformációk” osztálya. 2. Projektív transzformációk Az említett geometriai tulajdonságok vizsgálatára már régen rákényszerítette a matematikusokat a perspektíva problémája, amelyet a művészek tanulmányoztak először, pl. Leonardo da Vinci és Albert Dürer. A kép, amelyet a festő fest, a valóság vászonra való vetületének tekinthető. A vetítés centruma a festő szemében van. Ez az eljárás szükségképpen torzítja a hosszúságokat és szögeket, mégpedig a különféle ábrázolt tárgyak relatív helyzetétől függően. Rendszerint mégis meg lehet ismerni az eredeti tárgy geometriai struktúráját a vászonra festett képéről. Hogyan lehetséges ez? Nyilván úgy, hogy lenni kell a „projekcióval szemben invariáns” geometriai tulajdonságoknak, olyan tulajdonságoknak, amelyek változatlanul megjelennek a képen, és lehetségessé teszik a felismerést. A projektív geometria tárgya éppen az, hogy ezeket a tulajdonságokat megkeresse és analizálja. Nyilvánvaló, hogy a geometria eme ágába tartozó tételek nem vonatkozhatnak hosszú-
209
ságokra, szögekre vagy kongruenciákra. Egyes projektív jellegű tételek már a XVII. század óta ismeretesek, sőt mint pl. „Menelaosz tétele” már az ókorban is ismeretesek voltak. A projektív geometria rendszeres tanulmányozása azonban csak a XVIII. század végén kezdődött, a matematika fejlődésének ama új fázisával, amelyet a párizsi École Polytechnique indított el, kiváltképpen, ami a geometriát illeti. Ez az iskola a francia forradalom szülötte volt, s az volt a feladata, hogy élvonalbeli tisztviselőket és katonatiszteket képezzen a köztársaság számára. Hallgatója volt az a tiszt is, aki 1813-ban, orosz hadifogságban írta híres Traité des propriétés projectives des figures című értekezését. Ez a tiszt a projektív geometria történetében olyan híressé vált J. V. Poncelet (1788–1867) volt. A XIX. században azután Steiner, von Staudt, Chasles és mások munkája nyomán a projektív geometria a matematikai kutatás egyik főiránya lett. Népszerűségét részben nagy esztétikai varázsának, részben pedig annak a ténynek köszönhette, hogy a geometria minden területét átvilágítja, s szoros kapcsolatban áll a nem-euklideszi geometriával és az algebrával...
2. § Alapfogalmak 1. A projektív transzformációk csoportja Definiáljuk először is a projektív transzformációk osztályát vagy „csoportját”.1 Tegyük fel, hogy van a térben két síkunk: π és π 0 , amelyek nem szükségképpen párhuzamosak. Akkor egy adott O centrumból, amelyik nincs rajta sem π sem π 0 síkon, π síkot centrálisan projiciálhatjuk π 0 síkra, definíciószerűen hozzárendelve π minden P pontjához π 0 egy P 0 pontját úgy, hogy P és P 0 ugyanazon az O ponton átmenő egyenesen legyenek. Paralel projekciót is végezhetünk, ebben az esetben a projiciáló egyenesek párhuzamosak. Ugyanígy definiálhatjuk egy π sík l egyenesének a π sík valamely O pontjából való vagy pedig párhuzamos vetületét a π 0 sík valamely másik l 0 egyenesére. Egyik alakzat leképezését a másikra centrális vagy paralel projekció segítségével, vagy 1
Ha a „csoport” kifejezést transzformációk egy osztályára alkalmazzuk, ebből az következik, hogy az osztály két transzformációjának egymás utáni elvégzése újból ugyanebbe az osztályba tartozó transzformációt eredményez, és az osztály egy transzformációjának az „inverze” újból ugyanebbe az osztályba tartozik. Matematikai műveletek csoporttulajdonságai igen fontos szerepet játszottak, s játszanak ma is, a matematika számos területén, bár ami talán éppen a geometriát illeti, itt kissé eltúlozták a csoportfogalom jelentőségét.
210
70. ábra. Vetítés egy pontból pedig ilyen projekciók véges számú alkalmazásával, projektív transzformációnak nevezzük.2 A sík vagy az egyenes projektív geometriája azokból a geometriai tételekből áll, amelyek nem változnak meg, ha a geometriai alakzatokat, amelyekre vonatkoznak, tetszőleges projektív transzformációnak vetjük alá. Ezzel szemben metrikus geometriának az olyan geometriai tételek összességét nevezzük, amelyek az alakzatoknak csupán merev mozgással szemben invariáns nagyságviszonyaival foglalkoznak. Vannak első pillanatra felismerhető projektív tulajdonságok. Természetes pl., hogy pont vetülete pont. Továbbá az is, hogy egyenes vetülete egyenes a centrális projekcióban; mivel ha a π síkon levő l egyenest π 0 síkra vetítjük, az O ponton és l egyenesen
2
Két alakzatot, melyet egyetlen projekció köt össze, perspektív nek szokás nevezni. Így valamely F alakzatot projektív transzformáció kapcsol egy F 0 alakzathoz, ha F és F 0 között perspektivitás áll fenn, vagy ha található az alakzatok olyan F, F1 , F2 , . . . Fn , F 0 sorozata, amelyben mindegyik alakzat perspektivitásban van az őt követővel.
211
71. ábra. Párhuzamos vetítés áthaladó sík π 0 síkot l 0 egyenesben metszi.3 Ha A pont l egyeneshez illeszkedik,4 akkor a vetítés után a megfelelő A 0 pont és l 0 egyenes ismét illeszkednek egymáshoz. Tehát pont és egyenes illeszkedése invariáns a projektív csoport transzformációival szemben. Ennek a ténynek sok egyszerű és fontos következménye van. Ha három vagy háromnál több pont kollineáris, azaz egyazon egyeneshez illeszkedik, akkor képeik is kollineárisak. Hasonlóképpen, ha π síkban három vagy több egyenes konkurrens, azaz ugyanahhoz a ponthoz illeszkedő, akkor képeik is konkurrens egyenesek. Éppen ezért ezeket az egyszerű tulajdonságokat – illeszkedés, kollinearitás, konkurrencia – projektív tulajdonságok nak (azaz vetítéssel szemben invariáns tulajdonságoknak) nevezzük. Hosszúságok és szögek mértékeit, valamint ezek arányait a vetítés általában megváltoztatja, ezek nem projektív tulajdonságok. Egyenlő szárú vagy egyenlő oldalú háromszögek vetülete lehet olyan 3
4
Kivéve, ha az OP egyenes (vagy, ha az O ponton és l egyenesen áthaladó sík) párhuzamos π síkkal. Az ekkor előálló kivételeket a 4. §-ban küszöböljük ki. Egy egyenesről és egy pontról akkor mondjuk, hogy illeszkednek egymáshoz, ha az egyenes áthalad a ponton, vagy a pont rajta fekszik az egyenesen. A semleges „illeszkednek” nyitva hagyja azt a kérdést, hogy az egyenest vagy a pontot kell fontosabbnak tekinteni.
212
háromszög, melynek minden oldala különböző hosszúságú. Így tehát bár a „háromszög” projektív geometriai fogalom, az „egyenlő oldalú háromszög” nem az, s csupán a metrikus geometriában van értelme. 2. Desargues tétele
72. ábra. Síkbeli Desargues-féle alakzat A projektív geometria egyik legkorábbi felfedezése Desargues (1593–1662) híres háromszögtétele volt: Ha valamely síkban úgy helyezkedik el két háromszög: ABC és A 0 B 0 C 0 , hogy a megfelelő csúcsokat összekötő egyenesek egy O ponton haladnak át, akkor a megfelelő oldalak meghosszabbításai három kollineáris pontban metszik egymást. A tételt a 72. ábra szemlélteti, az olvasó könnyűszerrel rajzolhat hasonló ábrákat, a tétel állítását mintegy kísérletileg kipróbálva. Az ábra, amely csupa egyenesekből áll, nagyon egyszerű, de a tétel bizonyítása egyáltalában nem könnyű. Nyilvánvaló, hogy a tétel a projektív geometriába tartozik, ugyanis ha az egész ábrát úgy, ahogy van, valamely más síkra vetítjük, a tételben állított összes tulajdonság változatlan marad. Még visszatérünk majd erre a tételre a 232. oldalon. Jelenleg csak arra az érdekes tényre szeretnénk felhívni a figyelmet, hogy Desargues tétele akkor is igaz, ha a két háromszög két különböző (nem párhuzamos) síkban van, s hogy itt, a háromdimenziós geometriában Desargues tétele nagyon egyszerűen igazolható. Legyenek AA 0 , BB 0 , CC 0 egymást, a
213
feltevés szerint O pontban metsző egyenesek. Akkor AB ugyanabban a síkban van, mint A 0 B 0 , úgyhogy a két egyenes metszi egymást valamely Q pontban; hasonlóképpen metszik egymást AC és A 0 C 0 valamely R, BC és B 0 C 0 valamely P pontban. Mivel P, Q, R az ABC és A 0 B 0 C 0 háromszögek oldalainak meghosszabbításain vannak, hozzá kell tartozniuk mindkét háromszög síkjához, következésképpen a két sík metszésvonalán vannak. Tehát P, Q, R kollineárisok, amint azt a tétel állítja.
73. ábra. Térbeli Desargues-féle alakzat Ez az egyszerű bizonyítás azt juttatja eszünkbe, hogy vajon nem lehetne-e két dimenzió esetében mintegy határátmenettel bizonyítani a tételt, az egész ábrát úgy összelapítva, hogy a két sík a határon egybeessék és az O pont meg minden egyéb is ebbe az egy síkba essék. Az ilyen határátmenet útjában azonban specialis nehézség áll: ha a két sík egybeesik, akkor PQR metszésvonaluk nincsen többé egyértelműen meghatározva. Mégis, a 72. ábra úgy tekinthető, mint a térbeli 73. ábra perspektív képe, s ezt a tényt
214
lehet felhasználni sík esetében tételünk bizonyítására. A síkbeli és térbeli Desargues-tétel között valóban alapvető a különbség. Három dimenzióban geometriai érvelésünk pusztán pontok, egyenesek és síkok illeszkedésének és metszésének fogalmán alapul. Bizonyítható, hogy két dimenzióban a bizonyítás, feltéve, hogy annak teljesen a síkban kell történni, szükségképpen igényli az alakzatok hasonlóságának a fogalmát, ami pedig a metrikus geometriába tartozó hosszúság fogalmán alapul, s így többé nem projektív fogalom. Desargues tételének megfordítása azt állítja, hogy ha két ABC A 0 B 0 C 0 háromszög megfelelő oldalainak meghosszabítása kollineáris három pontban metszi egymást, akkor a megfelelő csúcsokat összekötő egyenesek egy ponton haladnak át. Feladatként bizonyítsuk be ezt a tételt arra az esetre, ha a két háromszög két nem párhuzamos síkban fekszik.
3. § Kettősviszony 1. A kettősviszony definíciója és invariáns voltának bizonyítása
74. ábra Ahogyan a metrikus geometriának az egyenes szakasz hosszúsága a kulcsa, éppen úgy a projektív geometriában is van egy alapvető fogalom, amelynek segítségével alakzatok minden kimondottan projektív tulajdonságát le lehet írni. Legyen három pont, A, B és C, egy egyenesen. A vetítés általában nemcsak az AB és BC távolságokat, hanem
215
az AB/BC viszonyt is megváltoztatja. Valóban, valamely l egyenes bármely három A, B, C pontjához mindig hozzárendelhető két egymást követő vetítéssel egy másik l 0 egyenes bármely három pontja. Hogy ezt belássuk, forgassuk l 0 egyenest C 0 pont körüli egyenessel párhuzamos l 00 helyzetbe (l. 74. ábra). Vetítsük most l egyenest l 00 -re C és C 0 pontokat összekötő egyenessel párhuzamos irányú projekcióval, definiálva így három, A 00 , B 00 és C 00 (= C 0 ) pontot. Az A 0 , A 00 és B 0 , B 00 pontokat összekötő két egyenes metszi egymást egy O pontban, ezt választjuk a második projekció centrumának. Ez a két egymás utáni vetítés a kívánt eredményt adja.5 Amint éppen most láttuk, a vetítéssel szemben semmiféle mennyiség, amely egy egyenes háromnál nem több pontjához kapcsolódik, nem lehet invariáns. Azonban – s éppen ez a projektív geometria alapvető felismerése – ha négy A, B, C, D pontot veszünk fel egy egyenesen, és ezt a négy pontot egy másik egyenes négy A 0 , B 0 , C 0 , D 0 pontjába vetítjük, akkor van olyan mennyiség, amely megőrzi értékét a projekcióban; ezt a mennyiséget nevezzük a négy pont kettősviszonyának. A kettősviszony az egyenes négy pontjából álló halmaz olyan matematikai tulajdonsága, amit nem semmisít meg a vetítés, s amely az egyenes bármely képén felismerhető. A kettősviszony nem hosszúság és nem két hosszúság aránya, a kettősviszony két hosszúságarány viszonya: ha CA/CB és DA/DB arányokat tekintjük, akkor viszonyuk, CA x= CB
DA , DB
definíciószerűen a négy, adott sorrendben vett A, B, C, D pont kettősviszonya. Bebizonyítjuk, hogy a projekció nem változtatja meg négy pont kettősviszonyát, azaz ha két egyenes A, B, C, D és A 0 , B 0 , C 0 , D 0 pontjait projekció kapcsolja össze mint egymásnak megfelelő pontokat, akkor CA CB
DA C 0A 0 = 0 0 BD CB
D 0A 0 D 0B 0
A bizonyítás elemi eszközökkel történik. Emlékeztetünk rá, hogy a háromszög területe egyenlő 12 (alap · magasság), és hogy ugyanez megadható bármely két oldal és a közbezárt
5
Mi történik, ha az A 0 , A 00 és B 0 , B 00 pontokat összekötő egyenesek párhuzamosak?
216
75. ábra. Pontból való vetítés (centrális projekció) nem változtatja meg a kettősviszonyt szög szinuszának a félszorzataként is. Akkor, amint az a 75. ábrán látható, 1 1 OCA terület = h · CA = OA · OC sin COA^, 2 2 1 1 OCB terület = h · CB = OB · OC sin COB^, 2 2 1 1 ODA terület = h · DA = OA · OD sin DOA^, 2 2 1 1 ODB terület = h · DB = OB · OD sin DOB^. 2 2 Következésképpen CA CB ·
DA CA DB OA · OC · sin COA^ = · = · DB CB DA OB · OC · sin COB^
OB · OD · sin DOB^ sin COA^ sin DOB^ = · . OA · OD · sin DOA^ sin COB^ sin DOA^
Tehát az A, B, C, D pontok kettősviszonya egyedül az O pontot A, B, C, D pontokkal összekötő egyenesek által bezárt szögek szinuszától függ. Ezek a szögek azonban A, B, C, D pontok O pontból történő vetítésével kapható bármely A 0 , B 0 , C’, D 0 pontra azonosak, tehát a projekció nem változtatja meg a négy pont kettősviszonyát. Hasonló háromszögek elemi tulajdonságaiból következik, hogy párhuzamos projekció sem változtatja meg négy pont kettősviszonyát. A bizonyítást feladatképpen az olvasóra bízzuk.
217
76. ábra. Párhuzamos vetítés nem változtatja meg a kettősviszonyt
77. ábra. Kettősviszony előjele Ezidáig az l egyenesen levő négy pont: A, B, C, D kettősviszonyán pozitív hosszúságokból összetett arányt értettünk. Célszerű ezt a definíciót a következőképpen módosítani. Válasszuk l-en egyik irányt pozitívnak és egyezzünk meg, hogy az ebben az irányban mért távolságokat pozitívnak, az ellenkező irányban mért hosszúságokat negatívnak tekintjük. Akkor az adott sorrendben vett A, B, C, D pontok kettősviszonyát mint az CA (A B C D) = CB
DA DB
(1)
mennyiséget definiáljuk, ahol CA, CB, DA, DB számokat saját előjelükkel kell venni. Mivel az l-en választott irány megváltoztatása a viszony minden egyes tagjának az
218
78. ábra. Kettősviszony kifejezése koordinátákkal előjelét ellenkezőre változtatja, (A B C D) értéke nem függ az l-en választott iránytól. Könnyen belátható, hogy (A B C D) aszerint lesz negatív vagy pozitív előjelű, hogy C, D pontpár elválasztja-e egymástól A, B pontpár két pontját vagy sem. Mivel az elválasztás vagy el nem választás tényét a projekció nem változtatja meg, (A B C D) előjeles kettősviszony is invariáns a vetítéssel szemben. Válasszunk l egyenesen egy rögzített O pontot kezdőpontnak, és tekintsük l minden pontjának x koordinátájaként O ponttól számított távolságát úgy, hogy A, B, C, D pont koordinátái sorra x1 , x2 , x3 , x4 , akkor CA (A B C D) = CB
x3 − x1 DA = DB x3 − x2
x4 − x1 x3 − x1 x4 − x2 = · . x4 − x2 x3 − x2 x4 − x1
Ha (A B C D) = −1, úgyhogy CA/CB = −DA/DB, akkor a C és D pontok belülről és kívülről egyaránt azonos arányban osztják az AB szakaszt. Ebben az esetben azt mondjuk, hogy C és D harmonikusan osztják az AB szakaszt; a C és D pontokat A, B pontpárra vonatkozóan egymás harmonikus konjugáltjai nak nevezzük. Ha (A B C D) = 1, akkor C és D (vagy A és B) pontok egybeesnek. Nem szabad elfelejteni, hogy az A, B, C, D pontok sorrendje lényeges része az (A B C D) kettősviszony definíciójának. Ha pl. (A B C D) = λ, akkor (B A C D) kettősviszony értéke 1/λ, míg (A C B D) = 1 − λ, amiről az olvasó könnyen meggyőződhetik. Négy pont összesen 4 · 3 · 2 · 1 = 24 különböző módon rendezhető el, a 24 különböző elrendezés mindegyikének megfelel egy kettősviszony. A permutációk egynémelyike ugyanazt az értéket adja a kettősviszonyra, mint az eredeti A, B, C, D sorrend; pl. (A B C D) = (B A D C). Feladatként az olvasóra bízzuk annak a bebizonyítását, hogy a négy pont 24 különböző permutációjának a kettősviszony hat különböző értéke felel
219
meg, mégpedig λ, 1 − λ, 1/λ,
1 λ λ−1 , , . λ 1−λ λ−1
Ez a hat mennyiség általában különböző, de kettő közülük egybeeshet, mint pl. a harmonikus osztás esetében, amikor λ = −1. Definiálhatjuk négy koplanáris (azaz négy, egy síkban fekvő) egy ponton áthaladó egyenes kettősviszonyát is, mint a négy egyenesnek valamely ötödik, ugyanezen síkban fekvő egyenessel való metszéspontjainak a kettősviszonyát. Az ötödik egyenes helyzete közömbös, mivel a kettősviszony az egyenes négy pontjának projektív invariánsa. Jelölje a négy egyenest 1, 2, 3, 4. Akkor a most adott definíció sin(1, 3) (1 2 3 4) = sin(2, 3)
sin(1, 4) sin(2, 4)
alakba írható, aszerint véve pozitív vagy negatív előjelet, amint az egyik egyenespár nem választja el vagy elválasztja a másik egyenespár két egyenesét. (A képletben pl. az (1, 3) jel az 1 és 3 egyenesek közötti szöget jelenti.) Végül definiálhatjuk négy koaxiális sík (a tér négy, egymást egy l egyenesben metsző síkja, l egyenest a négy sík tengelyének nevezzük) kettősviszonyát. Ha egy egyenes ezt a négy síkot négy pontban döfi, a négy pont kettősviszonya mindig azonos lesz, bármilyen is legyen az egyenes helyzete. (Feladatként bizonyítsuk be ezt a tényt.) Ezt az értéket rendelhetjük hozzá a négy síkhoz kettősviszonyként. Ugyanígy definiálhatnánk négy koaxiális sík kettősviszonyát annak a négy egyenesnek a kettősviszonyával is, amely négy egyenesben egy ötödik sík metszi az adott négy síkot (l. 79. ábra). Négy sík kettősviszonyának a fogalma természetesen vezet arra a kérdésre, hogy vajon a háromdimenziós teret önmagába átvivő projektív transzformáció definiálható-e. A centrális projekció definíciója nem általánosítható minden további nélkül két dimenzióról három dimenzióra. Bebizonyítható azonban, hogy minden olyan folytonos transzformáció, amely a síkot önmagába viszi át és kölcsönösen egyértelmű módon rendel pontokhoz pontokat, egyenesekhez egyeneseket, projektív transzformáció. Ennek a tételnek mintájára a következő definíciót vezethetjük be a tér esetében: a tér projektív transzformációja olyan folytonos, kölcsönösen egyértelmű transzformáció, amely megtartja az egyeneseket.
220
79. ábra. Koaxiális síkok kettősviszonya Kimutatható, hogy ezek a transzformációk kettősviszonytartók. A fenti állítások néhány megjegyzéssel egészítendők ki. Legyen A, B, C három különböző pont egy egyenesen, koordinátáik legyenek rendre x1 , x2 , x3 . Keressünk negyedik D pontot úgy, hogy a kettősviszony (A B C D) = λ legyen, ahol λ értéke előírt. (Azt a speciális esetet, ha λ = −1, amikor a probléma a negyedik harmonikus pont megszerkesztésének felel meg, a következő pontban tárgyaljuk részletesebben.) Általában egy és csak egy D pont oldja meg a problémát; ugyanis, ha x-szel jelöljük a keresett D pont koordinátáját, az x3 − x1 x − x2 · =λ x3 − x2 x − x1
(2)
egyenletnek pontosan egy x megoldása van. Ha x1 , x2 , x3 adottak, és rövidség kedvéért a (2) egyenletbe (x3 − x1 )/(x3 − x2 ) = k értéket helyettesítjük be, az egyenletet megoldva, azt találjuk, hogy x = (kx2 − λx1 )/(k − λ). Például, ha a három pont: A, B, C egyenlő távolságra van egymástól és koordinátáik x1 = 0, x2 = d, x3 = 2d; akkor k = (2d − 0)/(2d − d) = 2 és x = 2d/(2 − λ).
221
80. ábra. Projtektív vonatkozás két egyenes pontjai között Ha ugyanazt az l egyenest két különböző O 0 és O 00 centrumból vetítjük két különböző l 0 és l 00 egyenesre, kapunk egy P ↔ P 0 vonatkozást l és l 0 pontjai között, és egy P ↔ P 00 vonatkozást l és l 00 pontjai között. Ezáltal kaptunk egy P 0 ↔ P 00 vonatkozást l 0 és l 00 pontjai között, és l 0 minden A 0 , B 0 , C 0 , D 0 pontnégyesének ugyanaz a kettősviszonya, mint l 00 megfelelő A 00 , B 00 , C 00 , D 00 pontnégyesének. Minden olyan kölcsönösen egyértelmű vonatkozást két egyenes pontjai között, amelynek megvan ez a tulajdonsága, projektív vonatkozásnak vagy projektivitásnak nevezünk, függetlenül attól, hogyan definiáltuk a vonatkozást. Feladatok: 1) Legyen adva két egyenes és valamely projektív vonatkozás a két egyenes pontjai között. Bizonyítsuk be, hogy az egyik egyenes párhuzamos eltolással olyan helyzetbe hozható, amelyben az adott vonatkozást egyszerű vetítéssel állíthatjuk elő. (Útmutatás: Ejtsük össze a két egyenes egy-egy megfelelő pontját.) 2) Mutassuk ki a megelőző eredmények alapján, hogy ha két egyenes: l és l 0 pontjai különféle közbeeső egyenesekre való véges számú vetítés bármely sorozatán át vannak egymáshoz rendelve, különféle vetítési centrumok felhasználásával, akkor ugyanezt az eredményt mindössze két
222
vetítéssel is el lehet érni.
2. A teljes négyoldal
81. ábra. Teljes négyoldal A kettősviszony invarianciájának érdekes alkalmazásaként levezetjük a projektív geometria egyik egyszerű és érdekes tételét. A tétel az ún. teljes négyoldalra vonatkozik. Ez az alakzat négy tetszőleges egyenesből áll, amelyek közül semelyik három sem haladhat át egy ponton, és a négy egyenes hat metszéspontjából. A 81. ábrán AE, BE, BI, AF a négy egyenes. Az AB, EG és IF szakaszok által meghatározott egyeneseket a négyoldal átlói nak nevezzük. Tekintsük bármelyik átlót, mondjuk AB-t, és jelöljük meg rajta azokat a C és D pontokat, amelyekben ez az átló metszi a másik két átlót. Akkor kimondhatjuk a következő tételt: (A B C D) = −1; szavakban, a teljes négyoldal egyik átlójának a másik két átlóval való metszéspontjai harmonikusan választják el egymástól a négyoldal illető átlón elhelyezkedő két szögpontját. A bizonyítás egyszerű. Látjuk, hogy E pontból vetítve x =(A B C D) = (I F H D) G pontból vetítve(I F H D) = (B A C D). Azonban tudjuk, hogy (B A C D) = 1/(A B C D); úgyhogy x = 1/x, x2 = 1, x = ±1.
223
Mivel C, D pontpár elválasztja A, B pontpárt, x kettősviszony negatív és így −1, ami bizonyítandó volt. A teljes négyoldal eme figyelemre méltó tulajdonsága lehetővé teszi, hogy bármely C pont két adott A, B pontra vonatkozó harmonikus konjugáltját pusztán vonalzó használatával megkeressük. Nem kell egyebeket tenni, mint felvenni egy E pontot az A, B, C pontokat tartalmazó egyenesen kívül, meghúzni EA, EB, EC egyeneseket, felvenni EC egyenesen egy G pontot, meghúzni az AG és BG egyeneseket, amelyek F és I pontokban metszik az EB és EA egyeneseket, azután meg kell húzni IF egyenest, amely az A, B, C pontokat tartalmazó egyenest a keresett negyedik harmonikus pontban: D-ben metszi.
82. ábra. Hogyan kell egyenest húzni akadály mögött Feladat: Legyen adva a síkban egy AB szakasz és R tartomány, amint az a 82. ábrán látható. Húzzuk meg AB egyenes folytatását az R tartomány jobb oldalán. Hogyan lehet ezt a feladatot megoldani pusztán vonalzó használatával úgy, hogy a vonalzó a szerkesztés alatt egyszer se menjen át R tartományon? (Útmutatás: Válasszunk AB szakaszon két tetszőleges C, C 0 pontot, azután határozzuk meg ezek D, D 0 harmonikus konjugáltjait az A, B pontokat szögpontokként tartalmazó négy teljes négyoldal segítségével).
4. § Párhuzamosság és végtelen 1. Végtelen távoli pontok mint „ideális pontok” A megelőző fejezet alaposabb vizsgálata felfedi, hogy érvelésünk egynémelyike érvényességét veszíti, ha két egyenes, amelyeket a szerkesztés folyamán metszéspontjukig kellene meghosszabbítani, valójában párhuzamos egymással. Pl. a negyedik harmonikus pont: D a fenti szerkesztésben nem létezik, ha IF egyenes párhuzamos AB-vel. A geometriai érvelést lépten-nyomon akadályozza az a tény, hogy párhuzamos egyenesek nem metszik
224
egymást, mert egyenesek metszését tartalmazó minden megfontolásban kivételt kell tenni a párhuzamosokkal, amelyekre külön kell megfogalmazni a tételt. Hasonlóképpen meg kell különböztetni az O centrumból történő centrális projekciót a párhuzamos vetítéstől, amely külön elbánást igényel. Ha minden ebből adódó kivételes esetet valóban külön kellene tárgyalnunk, a projektív geometria nagyon bonyolulttá válna. Meg kell azért próbálnunk egy másik lehetőséget, ti. keresnünk kell alapfogalmaink olyan kibővítését, amely lehetővé teszi a mondott kivételek kiküszöbölését. A geometriai szemlélet mutatja az utat: ha egy egyenest, amely egy másik egyenest metsz, lassan forgatunk a két egyenes párhuzamos helyzete felé, metszéspontjuk a végtelenbe távolodik. Laikus módon azt mondhatnánk, hogy a két egyenes „végtelen távoli” pontban metszi egymást. A lényeges dolog azonban most már az, hogy ennek a bizonytalan állításnak pontos értelmet adjunk, úgy hogy a végtelen távoli pontokkal, vagy amint gyakran nevezik, ideális pontokkal éppen úgy dolgozhassunk, mintha csak a sík vagy a tér közönséges pontjai lennének. Más szóval, azt akarjuk, hogy a pontok, egyenesek, síkok stb. viselkedésére vonatkozó szabályok akkor is érvényben maradjanak, ha ezek a geometriai elemek ideálisak. Ezt a célt vagy szemléletes, vagy formális módszerrel érhetjük el, éppen úgy, mint a számrendszer kibővítésében, ahol egyfelől a mérés szemléletes fogalmából indultunk ki, másfelől az aritmetikai műveletek formális szabályaiból. Mindenekelőtt legyünk tisztában azzal, hogy a szintetikus geometriában még a „közönséges” pont és egyenes alapvető fogalma sem definiálható matematikailag. E fogalmak úgynevezett definíciói, amelyek gyakran találhatók elemi geometriai tankönyvekben, nem egyebek magyarázat célját szolgáló leírásnál. A közönséges geometriai elemek esetében szemléletünk kellőképpen megnyugtat ezek „létezés”-éről. De amire valóban szükségünk van a geometriában, ha a geometriát matematikai rendszerként tekintjük, az pusztán egyes szabályok érvényessége, olyan szabályoké, amelyeknek a segítségével dolgozni tudunk ezekkel a definiálatlan elemekkel, amikor pl. pontokat kötünk össze, vagy megkeressük az egyenesek metszéspontját stb. Logikailag tekintve a „pont” nem „magánvaló”, a pontot teljesen leírja azoknak az állításoknak az összessége, amely más tárgyakhoz kapcsolja. A „végtelen távoli pont” matematikai létezése azonnal biztosítva van, mihelyt világosan és ellentmondásmentesen leszögeztük ennek az új dolognak ma-
225
tematikai tulajdonságait, azaz a „közönséges” pontokhoz való viszonyát és a végtelen távoli pontok egymással való összefüggését. A geometria közönséges axiómái (azaz az euklidészi geometriáé) irón- és krétajelek fizikai világából, a kifeszített kötelek, fénysugarak, merev rudak stb. világából elvonatkoztatott absztrakciók. Azok a tulajdonságok, amelyekkel a mondott axiómák ruházzák fel a matematika pontjait és egyeneseit, erősen egyszerűsített és idealizált leírásai fizikai megfelelőik viselkedésének. Bármely két tényleges irónnal kijelölt ponton át nem egyetlen, hanem nagyon sok egyenes rajzolható irónnal. Amint a pontok átmérője kisebbedik, ezek az egyenesek megközelítően azonosnak látszanak. Erre a tényre gondolunk, amikor geometriai axiómaként mondjuk ki, hogy „bármely két ponton keresztül egy és csak egy egyenes húzható”. Nem fizikai pontokra és egyenesekre hivatkozunk, hanem a geometria absztrakt és fogalmi pontjaira és egyeneseire. Geometriai pontok és egyenesek tulajdonságai lényegesen egyszerűbbek mint bármely fizikai tárgyé, és éppen ez az egyszerűség volt a geometria deduktív tudományként való fejlődésének legfontosabb feltétele. Amint megjegyeztük, pontok és egyenesek közönséges geometriáját igen nagy mértékben nehezítette az a tény, hogy párhuzamos egyenespárok nem metszik egymást egy pontban. Azért további egyszerűsítést kell végrehajtanunk a geometria struktúráján, kibővítve a geometriai pont fogalmát úgy, hogy ez a kivétel eltávolítható legyen, éppen úgy, mint ahogy kibővítettük a szám fogalmát azért, hogy eltávolítsuk a kivonás és osztás megszorításait. Itt is az az elv fog vezetni, hogy a kibővített tartományban is megmaradjanak az eredeti tartományban érvényes törvények. Megegyezünk abban, hogy minden egyenes közönséges pontjaihoz hozzárendelünk egyetlenegy „ideális” pontot. Ezt a pontot úgy tekintjük, mint amely minden, az adott egyenessel párhuzamos egyeneshez hozzátartozik, és nem tartozik hozzá egyetlen másféle egyeneshez sem. Ennek a megegyezésnek következtében most már a sík minden egyenes párja metszi egymást egyetlen pontban; ha a két egyenes nem párhuzamos, a sík egy közönséges pontjában, míg ha a két egyenes párhuzamos, a hozzájuk tartozó közös ideális pontban metszik egymást. Pusztán szemléletesség kedvéért nevezik az egyenes ideális pontját az egyenes végtelen távoli pontjának. Az egyenesen végtelenbe távolodó pont szemléletes előállítása miatt azt gondolhatnánk, hogy minden egyeneshez két ideális pontot kellene hozzárendelni, egyet-egyet az egyenes két irányának
226
megfelelően. Azt akarjuk azonban, hogy megmaradjon az a törvény, hogy két ponton át egy és csak egy egyenes húzható, ezért rendeltünk minden egyeneshez csupán egy ideális pontot. Ha egy egyenesnek minden vele párhuzamos egyenessel két közös pontja lenne a végtelenben, akkor ezen a két „ponton” keresztül végtelen sok párhuzamos egyenes haladna át.
Ugyanígy megegyezünk abban, hogy a sík közönséges egyeneseihez csatolunk egyetlen „ideális” egyenest (nevezik ezt néha a sík végtelen távoli egyenesének is), amely egyenes tartalmazza ennek a síknak összes ideális pontját, és ezeken a pontokon kívül semmiféle más pontot nem tartalmaz. Pontosan ez a konvenció kényszerül ránk, ha meg akarjuk őrizni régi törvényünket, amely szerint minden két ponton át húzható egy egyenes, és emellett azt az újabban nyert törvényt, hogy két egyenes mindig metszi egymást egy pontban. Válasszunk bármely két ideális pontot, hogy ezt az állítást beláthassuk. Az egyetlen egyenes, amelynek át kell haladnia ezen a két ponton, nem lehet közönséges egyenes, mivel megegyezésünk szerint közönséges egyenes csak egy ideális pontot tartalmazhat. Továbbá ez az egyenes nem tartalmazhat egyetlen közönséges pontot sem, mivel egy közönséges pont és egy ideális pont egy közönséges egyenest határoz meg. Végül ennek az egyenesnek tartalmaznia kell minden ideális pontot, mivel azt akarjuk, hogy minden közönséges egyenessel legyen egy közös pontja. Tehát ennek az egyenesnek pontosan olyan tulajdonságúnak kell lennie, mint amilyen tulajdonságokkal a sík ideális egyenesét felruháztuk. Konvenciónk értelmében végtelen távoli pontot párhuzamos egyenesek bármely serege meghatározhat vagy ábrázolhat, éppen úgy, mint ahogy irracionális számot valamely intervallumskatulyázás magvaként lehetett meghatározni. Az az állítás, hogy két párhuzamos egyenes a végtelenben levő pontban metszi egymást, semmiféle misztikus jelentést nem rejt magában, pusztán kényelmes kifejezési módja annak a ténynek, hogy az egyenesek párhuzamosak. Egyetlenegy célja, hogy a párhuzamosságról azon a nyelven beszélünk, amit a szemlélet eredetileg a párhuzamosságot kizáró esetek tárgyalására tartott fenn, az, hogy a kivételes esetek felsorolását feleslegessé tegyük. A „közönséges” esetek tárgyalására használt nyelvi kifejezések és más szimbólumok azonos volta miatt, ezeket az eseteket most már automatikusan tartalmazza valamennyi tétel. Összefoglalva: végtelen távoli pontokra vonatkozó konvenciónkat úgy választottuk meg, hogy a közönséges pontok és egyenesek között fennálló illeszkedési relációk megőrizzék
227
érvényességüket a pontok e bővített tartományában is, s két egyenes metszéspontjának meghatározására szolgáló művelet, amely eddig csak akkor volt elvégezhető, ha az egyenesek nem voltak párhuzamosak, most megszorítás nélkül elvégezhető legyen. Azok a megfontolások, amelyek az illeszkedési relációk tulajdonságaiban a fenti formális egyszerűsítésekre vezettek, kissé elvontnak látszhatnak. De, amint azt az olvasó a következő lapokon látni fogja, az eredmény bőségesen igazolja majd szükségességüket. 2. Ideális elemek és projekció
83. ábra. Vetítés végtelen távoli térelemekre A végtelen távoli pontok és a végtelen távoli egyenes bevezetése a síkon lehetővé teszi, hogy egyik síknak a másikra való projekcióját a fentieknél kielégítőbb módon tárgyaljuk. Tekintsük egy π sík O pontból való vetítését egy másik π 0 síkra (83. ábra). Ez a projekció megfelelkezést létesít π és π 0 pontjai és egyenesei között. π minden A pontjának megfelel π 0 egyetlen A 0 pontja, a következő kivétellel: ha az O-n keresztül haladó vetítősugár párhuzamos π 0 síkkal, akkor π síkot olyan A pontban metszi, amelynek a π 0 síkon egyetlen közönséges pont sem felel meg. A π sík ezen kivételes pontjai olyan l egyenesen vannak, amelynek π 0 síkon nem felel meg közönséges egyenes. Azonban ez a kivétel
228
kiküszöbölhető, ha megegyezünk abban, hogy A pontnak π 0 sík OA egyenes irányába eső végtelen távoli pontja felel meg, és l-nek π 0 sík végtelen távoli egyenese a megfelelője. Ugyanígy π sík egy végtelen távoli pontját rendeljük π 0 sík m 0 egyenesének minden B 0 pontjához, amelyen keresztül az O pontból kiinduló π síkkal párhuzamos vetítő sugarak haladnak. Magának m 0 -nek a π sík végtelen távoli egyenese fog megfelelni. Így a sík végtelen távoli pontjainak és egyenesének bevezetésével egy sík másikra való vetítése kivétel nélkül kölcsönösen egyértelmű vonatkozást létesít a két sík pontjai és egyenesei között. (Ezzel megszabadulunk a 210. oldal lábjegyzetében említett kivételektől.) Továbbá, amint az könnyen belátható, megegyezésünkből következik, hogy valamely pont akkor és csak akkor fekszik egy adott egyenesen, ha a pont vetülete az egyenes vetületén van. Tehát mindazok a kollineáris pontokra, konkurrens egyenesekre stb. vonatkozó tételek, amelyek csak pontokat, egyeneseket és az illeszkedési relációt tartalmazzák, ennek a bővített értelemben vett projekciónak az invariánsai. Így lehetővé válik, hogy a π sík végtelen távoli pontjai helyett egyszerűen π 0 sík közönséges pontjaival dolgozzunk, amelyeket projekció rendel hozzá π pontjaihoz. *A π sík végtelen távoli pontjainak fenti interpretációja egy síkon kívüli O pontból történő másik π 0 síkra való vetítés segítségével felhasználható arra, hogy a bővített sík konkrét euklidészi „modelljét” adjuk. Ebből a célból csupán el kell tekinteni a π 0 síktól, s figyelmünket a π síkra és az O ponton áthaladó egyenesekre kell fordítanunk. π minden egyes közönséges pontjának megfelel az O ponton áthaladó és π síkkal nem párhuzamos egyenes; π minden végtelen távoli pontjának megfelel egy O ponton áthaladó és π síkkal párhuzamos egyenes. Tehát π összes, közönséges és ideális pontjainak megfelel az O ponton áthaladó egyenesek összessége, és ez a vonatkozás kivétel nélkül kölcsönösen egyértelmű. π egy egyenesén fekvő pontoknak egy O ponton áthaladó sík egyenesei felelnek meg. π egy pontja és egy egyenese akkor és csak akkor illeszkedik egymáshoz, ha az O ponton áthaladó megfelelő egyenes és sík illeszkedik. Tehát pontok és egyenesek illeszkedésének a geometriája a bővített síkon teljesen ekvivalens a tér egy rögzített pontján áthaladó közönséges egyenesek és síkok illeszkedésének a geometriájával. *Három dimenzió esetében hasonló a helyzet, bár a projekciót többé nem használhatjuk a dolgok szemléletessé tételére. Párhuzamos egyenesek minden seregéhez hozzárendelünk most is egyetlen végtelen távoli pontot. Minden síkon van egyetlen végtelen távoli
229
egyenesünk. Új elemet is be kell vezetnünk, a végtelen távoli síkot, amely a tér összes végtelen távoli pontjából áll és tartalmazza az összes végtelen távoli egyenest. Minden közönséges sík végtelen távoli egyenesében metszi a végtelen távoli síkot. 3. Kettősviszony végtelen távoli elemekkel
84. ábra. Kettősviszony, melynek egyik pontja végtelen távoli pont Még egy megjegyzés szükséges a végtelen távoli elemeket tartalmazó kettősviszonyokra vonatkozóan. Jelöljük l egyenes végtelen távoli pontját ∞ szimbólummal. Ha A, B, C három közönséges pont l egyenesen, akkor az (A B C ∞) szimbólumnak a következő módon tulajdoníthatunk értelmet: válasszunk l egyenesen egy P pontot; legyen (A B C ∞) az a határérték, amelyhez (A B C P) tart, ha P pont l mentén a végtelenbe távolodik. Azonban CA (A B C P) = CB
PA , PB
és amint P végtelenbe távolodik PA/PB 1-hez tart. Ezért bevezetjük a (A B C ∞) =
CA CB
definíciót. Speciális esetben, ha (A B C ∞) = −1, akkor C az AB szakasz középpontja: egy szakasz felezőpontja és a szakasz irányába eső végtelen távoli pont harmonikusan osztják a szakaszt. Feladatok: Mi lesz négy l1 , l2 , l3 , l4 egyenes kettősviszonya, ha az egyenesek párhuzamosak? Mi lesz a kettősviszony, ha l4 a végtelen távoli egyenes?
230
5. § Alkalmazások 1. Előzetes megjegyzések A végtelen távoli elemek bevezetése után nincs szükség többé azoknak a kivételes eseteknek explicit felsorolására, amelyek akkor lépnek fel szerkesztésekben vagy tételekben, ha két vagy több egyenes párhuzamos. Csupán azt kell megjegyezni, hogy ha egy pont végtelen távoli pont, akkor minden ezen a ponton áthaladó egyenes párhuzamos. Nincs szükség többé arra, hogy különbséget tegyünk centrális és párhuzamos projekció között, mivel az utóbbi egyszerűen végtelen távoli pontból való projekciónak fogható fel. PQR egyenes, vagy az O pont a 72. ábrán lehet a végtelenben is (a 85. ábra mutatja az utóbbi esetet); feladatként az olvasóra bízzuk, hogy a Desargues-tétel megfelelő állítását „finitisztikus” nyelven megfogalmazza.
85. ábra. Desargues-féle alakzat, amelynek vetítési centruma a végtelenben van A projektív tételeknek nemcsak megfogalmazása, gyakran bizonyítása is egyszerűsíthető végtelen távoli elemek használatával. Az általános elv a következő. Valamely F geometriai alakzat „projektív osztályán” azoknak az alakzatoknak az osztályát értjük, amelyekbe F valamely projektív transzformációval átvihető. F projektív tulajdonságai azonosak projektív osztálya bármelyik tagjának tulajdonságaival, mivel a projektív tulajdonságok definíciószerűen invariánsak a projektív transzformációkkal szemben. Így bármelyik projektív tétel (olyan tétel, amely csupa projektív tulajdonságot tartalmaz),
231
amely igaz F esetében, igaz lesz F projektív osztályának bármely tagja esetében, és megfordítva. Tehát ahhoz, hogy egy ilyen tételt bebizonyítsunk F-re, elegendő bebizonyítani azt F projektív osztályának bármely tagjára. Gyakran találhatunk ugyanis F projektív osztályában olyan speciális tagot, amelyre a tétel egyszerűbben bizonyítható, mint magára F-re. Pl. egy π sík bármely két A, B pontját végtelenbe lehet vetíteni oly módon, hogy egy O centrumból valamely, az O, A, B pontokat tartalmazó síkkal párhuzamos π 0 síkra vetítünk; az A és B pontokon áthaladó egyenesek két – párhuzamos egyenesekből álló – egyenes seregbe mennek át. Jelen paragrafusban bizonyítandó projektív tételekben ilyen előkészítő transzformációt végzünk.
86. ábra Hasznosnak találjuk majd a párhuzamos egyenesekre vonatkozó alábbi elemi tényt. Messünk két, egymást O pontban metsző egyenest két egyenessel: l1 - és l2 -vel. A metszéspontokat jelöljük A, B, C, D betűkkel, amint az a 86. ábrán látható. Ha l1 és l2 párhuzamosak, akkor OA OB = ; OC OD és fordítva, ha
OA OC
=
OB , OD
akkor l1 és l2 párhuzamosak. A bizonyítást, amely hasonló
háromszögek elemi tulajdonságaiból következik, az olvasóra bízzuk. 2. A síkbeli Desargues-tétel bizonyítása A következőkben bebizonyítjuk, hogy két, a 72. ábrán látható módon elhelyezett ABC és A 0 B 0 C 0 egy síkban fekvő háromszög esetében, ha a megfelelő csúcsokon átmenő egyenesek
232
87. ábra. Desargues tételének bizonyítása egy pontban metszik egymást, akkor a megfelelő oldalak P, Q, R metszéspontjai egy egyenesre esnek. Változtassuk a bizonyítás céljából az ábrát projekcióval olyanra, hogy a Q és R végtelen távoli pont legyen. A projekció után AB párhuzamos lesz A 0 B 0 -vel, AC párhuzamos lesz A 0 C 0 -vel és az alakzat a 87. ábrán látható formát ölti. Amint azt ezen paragrafus 1. pontjában megtárgyaltuk, ahhoz, hogy Desargues tételét általánosságban bebizonyítsuk, elegendő a bizonyítást erre a speciális típusú alakzatra elvégezni. Ebből a célból csak azt kell megmutatnunk, hogy BC és B 0 C 0 metszéspontja is végtelen távoli pont, azaz BC párhuzamos B 0 C 0 -vel; akkor P, Q, R valóban kollineárisak (mivel a végtelen távoli egyenesen vannak). Mármost ha AB k A 0 B 0 , akkor
u r = , v s
AC k A 0 C 0 , akkor
r x = . y s
és ha
Tehát
u v
= yx ; ebből következik, hogy BC k B 0 C 0 , ami bizonyítandó volt.
Vegyük tekintetbe, hogy Desargues tételének ez a bizonyítása a szakasz hosszúságának metrikus geometriai fogalmát használja. Így projektív tételt metrikus geometriai eszközökkel bizonyítottunk. Továbbá, ha a projektív transzformációkat magában a síkban definiáljuk („intrinzik” módon), olyan sík transzformációkként, amelyek kettősviszonytartók (l. 220. o.), akkor ez a bizonyítás teljesen a síkban marad. Feladat: bizonyítsuk be hasonló módon Desargues tételének megfordítottját: ha ABC és A 0 B 0 C 0 olyan tulajdonságúak, hogy P, Q, R kollineárisak, akkor AA 0 , BB 0 , CC 0 egyenesek
233
konkurrensek.
3. Pascal tétele6
88. ábra. Pascal-féle alakzat Pascal tétele a következő: Ha egy hatszög szögpontjai váltakozva helyezkednek el egymást metsző egyenespárok egy-egy egyenesén, akkor a hatszög átellenes oldalainak három metszéspontja, P, Q, R, kollineáris (88. ábra). (A hatszög metszheti sajátmagát. Az „átellenes” oldalak felismerhetők a 89. ábrán adott szkematikus diagramon.) Előzetes projekciót végezve feltehetjük, hogy P és Q végtelen távoli pontok. Akkor még csak azt kell kimutatnunk, hogy R is végtelen távoli pont. A 90. ábra mutatja a
6
A 259. oldalon tárgyalunk majd egy hasonló típusú általánosabb tételt. Az itt következő speciális esetet felfedezője, alexandriai Papposz (i. sz. III. század) után Papposz-tételnek is szokták nevezni.
234
89. ábra
90. ábra. Pascal tételének bizonyítása helyzetet, ahol 23 k 56 és 12 k 45. Ki kell mutatnunk, hogy 16 k 34. Felírhatjuk, hogy a b+y = , a+x b+y+s
b a+x = . b+y a+x+r
Tehát a a+x+r = , b b+y+s azaz 16 k 34, ami bizonyítandó volt.
235
91. ábra. Brianchon-féle alakzat 4. Brianchon tétele Ez a tétel a következő: Ha egy hatszög oldalai váltakozva haladnak át két rögzített pont, P és Q egyikén és másikán, akkor a hatszög átellenes szögpontpárjait összekötő átlók konkurrensek, egy közös pontban metszik egymást (l. 91. ábra). Valamely projekcióval végtelenbe transzformálhatjuk P pontot és azt a pontot, amelyben az átlók közül kettő, mondjuk 14 és 36, metszi egymást. A helyzet a 92. ábrán látható. Mivel 14 k 36, felírhatjuk, hogy a/b = u/v. Azonban x/y = a/b és u/v = r/s. Tehát x/y = r/s és 36 k 25, úgy hogy minden három átló párhuzamos, tehát konkurrens. Ezzel a tétel általánosságban is bizonyítást nyert. 5. A dualitás elvéről Talán észrevette az olvasó a meglepő hasonlóságot Pascal (1632–1662) és Brianchon (1785–1864) tétele között. Kiváltképpen szembeötlő ez a hasonlóság, ha a két tételt egymás mellé írjuk: Pascal tétele Ha egy hatszög szögpontjai váltakozva feküsznek két egyenesen, akkor az átel-
236
Brianchon tétele lenes oldalak metszéspontjai kollineárisak.
92. ábra. Brianchon tételének bizonyítása Ha egy hatszög oldalai váltakozva haladnak át két ponton, akkor az átellenes
szögpontokat összekötő egyenesek konkurrensek.
Nemcsak a Pascal- és a Brianchon-tétel, a projektív geometria minden tétele párosan lép fel, egymáshoz hasonló és, hogy úgy mondjuk, azonos struktúrájú párokban. Ezt a vonatkozást nevezzük dualitásnak. A síkgeometriában a pontot és az egyenest egymás duáljai nak, duálisan megfelelő elemeknek nevezzük. Egyenes húzása ponton keresztül és pont kijelölése egyenesen egymásnak duálisan megfelelő műveletek. Két ábra akkor duális megfelelője egymásnak, ha az egyik minden egyes elemét és műveletét a duálisan megfelelő elemmel és művelettel cseréljük fel. Két tétel akkor duálisan megfelelő, ha az egyikben előforduló elemek és műveletek helyett azok duáljait véve, a másik tételt kapjuk. Pl. Pascal és Brianchon tétele egymásnak duálisan megfelelő tételek, a Desargues-tétel duálja pedig pontosan a tétel megfordítottja. A dualitás jelensége az elemi (metrikus) geometriától teljesen eltérő jelleget ad a projektív geometriának, a metrikus geometriában semmiféle dualitás nem létezik. (Pl. teljesen értelmetlen lenne egy 37◦ -os szög vagy egy 2 hosszegységnyi szakasz duáljáról beszélni.) Sok projektív geometria tankönyvben a dualitás elvét, amely azt állítja, hogy a projektív geometriában minden igaz tétel duálja is igaz, azáltal szokták szemléltetni, hogy a duáltételeket és duál bizonyításaikat
237
párhuzamos oszlopokba egymás mellé írják. A dualitás alapjául szolgáló okot a következő paragrafusban tárgyaljuk (l. 267. o. is).
6. § Analitikus előállítási mód 1. Bevezető megjegyzések A projektív geometria fejlődésének korai szakában igyekeztek mindent szintetikus, „tiszta geometriai” úton felépíteni, elkerülve a számok és algebrai módszerek használatát. Ez a program nagy nehézségekbe ütközött, mivel mindig maradtak olyan helyek, ahol valamiféle algebrai megfogalmazás elkerülhetetlennek látszott. Csak a XIX. század vége felé sikerült tisztán szintetikus projektív geometriát felépíteni, s akkor is igen nagyfokú bonyolultság árán. Ebben a tekintetben sokkal sikeresebbek voltak az analitikus geometria módszerei. A modern matematika általános törekvése az, hogy mindent a számfogalomra alapítson. A geometriában Fermat és Descartes munkásságával indult el ez az irány, és jelentős sikereket ért el. Geometriai meggondolásokban alkalmazott egyszerű eszközből az analitikus geometria önálló tudománnyá fejlődött, amelyben nem geometriai műveletek és eredmények szemléletes előállítása többé a végső és kizárólagos cél, a geometriai szemléltetés szerepe inkább csak az analitikus eredmény elérésének és megértésének az elősegítése. A geometria jelentésében bekövetkezett eme változás hosszú történelmi fejlődés eredménye. A klasszikus geometria területe ezáltal igen nagy mértékben bővült, ugyanakkor pedig az új szemlélet a geometria és az analízis – pontosabban a „lineáris algebra” – csaknem tökéletesen organikus egységét hozta létre. Az analitikus geometriában valamely geometriai objektum „koordinátái” az illető objektumot egyértelműen jellemző tetszőleges számok. Így pl. pontot definiálhatunk a síkban x, y derékszögű koordinátái, vagy ρ, ϑ polárkoordinátái megadásával, egy háromszöget pedig három csúcsának koordinátái, azaz összesen hat koordináta definiál. Tudjuk, hogy valamely x, y síkban fekvő egyenes azon P(x, y) pontok geometriai helye (a jelölést illetően l. 92. o.), amely pontok koordinátái valamely ax + by + c = 0
(1)
lineáris egyenletet elégítenek ki. Éppen ezért a három a, b, c számot az (1) egyenes
238
„koordinátái”-nak nevezhetjük. Pl. a = 0, b = 1, c = 0 az y = 0 egyenest definiálja, amely nem egyéb, mint az x-tengely; a = 1, b = −1, c = 0 az x = y egyenest definiálja, amely egyenes felezi a pozitív x-tengely és a pozitív y-tengely közötti szöget. Ugyanígy, a másodfokú egyenletek „kúpszeleteket” definiálnak: x2 + y2 = r2
r sugarú kör egyenlete, ha középpontja a koordinátarendszer kezdőpontja.
(x − a)2 + (y − b)2 = r2
r sugarú kör egyenlete, ha középpontja az (a, b) pont stb.
x2 y2 + =1 a2 b2
ellipszis egyenlete.
Az analitikus geometria eredeti felfogásában tisztán „geometriai” fogalmakból – pont, egyenes stb. – indulunk ki, és ezeket fordítjuk le a számok nyelvére. A modern felfogás ennek a fordítottja. Az összes x, y számpárok halmazából indulunk ki és minden egyes ilyen számpárt pontnak nevezünk, mivel ha óhajtjuk, a számpárt értelmezhetjük vagy szemléltethetjük a geometriai pont jól ismert fogalmának segítségével. Hasonlóképpen mondhatjuk, hogy x és y között fennálló valamely lineáris egyenlet egyenest definiál. Ez a hangsúlyeltolódás a geometria szemléletes felfogásától analitikus értelmezése felé lehetővé teszi, hogy egyszerű és mégis szigorú módon tárgyaljuk a projektív geometriában a végtelen távoli pontokat, s egyébként is nélkülözhetetlen az egész tárgykör mélyebb megértése szempontjából. Azok számára, akiknek van némi matematikai előismeretük, a következőkben röviden beszámolunk az analitikus tárgyalási módról. *2. Homogén koordináták. A dualitás algebrai alapja A közönséges analitikus geometriában egy pont derékszögű koordinátái a síkban a pont két egymásra merőleges tengelytől számított előjeles távolságai. Ez a rendszer már nem érvényes a projektív geometria bővített síkjának végtelen távoli pontjaiban. Ezért ha analitikus módszereket akarunk alkalmazni a projektív geometriában, olyan koordinátarendszert kell találni, amelyik egyaránt ábrázolni tudja az ideális és a közönséges pontokat. Ilyen koordináta-rendszer akkor írható le a legegyszerűbben, ha feltételezzük, hogy az adott π X, Y sík háromdimenziós térbe van beágyazva, s a háromdinenziós
239
térben bevezettük az x, y, z derékszögű koordinátákat (egy pont három, az x-, y- és z-tengelyek által meghatározott koordináta síktól számított távolságait). π síkot az x, y koordináta síkkal párhuzamosan vesszük fel egységnyi távolságban, és így π bármely P pontjának háromdimenziós térben vett koordinátái (X, Y, 1). Vegyük a koordinátarendszer O kezdőpontját a projekció centrumának, akkor minden P pont meghatároz egy és csak egy O ponton áthaladó egyenest és megfordítva. (L. 228. o. Az O ponton áthaladó és a síkkal párhuzamos egyenesek felelnek meg π végtelen távoli pontjainak.)
93. ábra. Homogén koordináták Most értelmezzük π pontjaira „homogén koordinátá”-kat. π sík egy tetszőleges P pontjának homogén koordinátáit, abban az esetben, ha P közönséges pont, úgy találjuk meg, hogy az O és P pontokon áthaladó egyenesen választunk egy tetszőleges, az O ponttól különböző Q pontot (l. 93. ábra), és ennek a Q pontnak közönséges háromdimenziós x, y, z koordinátáit nevezzük P pont homogén koordinátáinak. Magának P pontnak (X, Y, 1) koordinátái is homogén koordinátái P pontnak. Továbbá bármely más (tX, tY, t) számhármas is homogén koordinátákat ad meg P-re, feltéve, hogy t 6= 0, mivel az OP egyenes minden O-tól különböző pontjának a koordinátái ilyen alakúak. (Kizártuk a (0, 0, 0) pontot, mivel ez a pont rajta van minden O ponton áthaladó egyenesen, és így
240
nem különbözteti meg azokat egymástól.) Ha a fenti módon értelmezünk koordinátákat a síkon, egy pont helyzetének a meghatározásához három számra van szükségünk kettő helyett, s a módszer hátránya, hogy a koordináták nem határozzák meg a pontot egyértelműen, csupán valamely t faktor erejéig. Nagy előny azonban, hogy π végtelen távoli pontjai ebben a koordináta reprezentációban benne foglaltatnak. π sík valamely végtelen távoli P pontját egy, az O ponton keresztül haladó és π síkkal párhuzamos egyenes határozza meg. Bármely ezen egyenesen fekvő Q pont koordinátái (x, y, 0) alakúak lesznek. Tehát π egy végtelen távoli pontjának homogén koordinátái (x, y, 0) alakúak. Egyszerűen megkapjuk π valamely egyenesének homogén koordinátákban kifejezett egyenletét, ha figyelembe vesszük, hogy ennek az egyenesnek pontjait O ponttal összekötő egyenesek mind egy O ponton áthaladó síkban feküsznek. Az analitikus geometria szerint egy ilyen sík egyenlete ax + by + cz = 0 alakú. Ez tehát a π sík valamely egyenesének homogén koordinátákban előállított egyenlete. Most már, hogy megadtuk π pontjainak geometriai modelljét az O ponton áthaladó egyenesekben, félretehetjük a modellt, és a bővített síkot a következő, tisztán analitikus módon definiálhatjuk: Pontnak nevezünk minden olyan valós számokból álló (x, y, z) rendezett számhármast, amelyben nem mind a három szám egyszerre nulla. Két számharmas, (x1 , y1 , z1 ) és (x2 , y2 , z2 ) akkor definiálja ugyanazt a pontot valamely t 6= 0 esetében, ha x2 = tx1 , y2 = ty1 , z2 = tz1 . Azaz bármely pont koordinátái megszorozhatók bármely nem-nulla tényezővel, anélkül, hogy a pont megváltoznék. (Éppen ezért nevezzük a most bevezetett koordinátákat homogén koordinátáknak.) Valamely (x, y, z) pont közönséges pont, ha z 6= 0; ha z = 0,
241
akkor végtelen távoli pont. A π sík valamely egyenese azokból az (x, y, z) pontokból áll, amelyek kielégítik az ax + by + cz = 0
(1’)
alakú egyenletet, ahol a, b, c három tetszőleges állandó, s egyszerre nem tűnhet el mind a három. A π sík végtelen távoli pontjai a z=0
(2)
lineáris egyenletet elégítik ki. Ez az egyenlet egyenest definiál, amelyet π végtelen távoli egyenesének nevezünk. Mivel az (1’) alakú egyenlet egyenest definiál, az (a, b, c) számhármast (1’) egyenes homogén koordinátái nak nevezzük. Következésképpen bármely t 6= 0 értékre (ta, tb, tc) is homogén koordinátái (1’) egyenesnek, mivel a (ta)x + (tb)y + (tc)z = 0
(3)
egyenletet ugyanaz az (x, y, z) koordinátahármas elégíti ki, mint az (1’) egyenletet. Észre kell vennünk ezekben a definíciókban a tökéletes szimmetriát pont és egyenes között: mindkettőt három (u, v, w) homogén koordináta határozza meg. Annak a feltétele, hogy (x, y, z) pont az (a, b, c) egyenesen fekszik ax + by + cz = 0, és ugyanez a feltétele annak is, hogy az a pont, melynek koordinátái (a, b, c), azon az egyenesen feküdjön, melynek koordinátái (x, y, z). Pl. a 2·3+1·4−5·2=0 aritmetikai azonosság egyaránt értelmezhető úgy, hogy a (3, 4, 2) pont fekszik a (2, 1, −5) egyenesen, vagy úgy, hogy a (2, 1, −5) pont fekszik a (3, 4, 2) egyenesen. Ez a szimmetria az alapja a projektív geometriában a pont és egyenes között fennálló dualitásnak, mert pontokat egyenesekhez viszonyító minden vonatkozásból egyeneseket pontokhoz viszonyító vonatkozás lesz, ha a koordinátákat megfelelőképpen átértelmezzük. Az új
242
értelmezésben azok a koordináták, amelyek a régebbi értelmezésben pontokat jelentettek, egyeneseket, amelyek egyeneseket jelentettek, most pontokat jelentenek. Az algebrai műveletek és eredmények továbbra is azonosak maradnak, de értelmezésük az eredeti tétel duális megfelelőjét adja. Meg kell jegyezni, hogy ez a dualitás a két X, Y koordináta közönséges síkjában nem áll fenn, mivel az egyenes egyenlete közönséges koordinátákban aX + bY + c = 0, és amint látható, ez az egyenlet nem szimmetrikus X, Y és a, b, c értékekben. A dualitás elve csak akkor érvényes, ha bevezetjük a végtelen távoli pontokat és a végtelen távoli egyenest. Valamely π síkban fekvő P közönséges pont x, y, z homogén koordinátairól úgy kell áttérni közönséges derékszögű koordinátákra, hogy egyszerűen X = x/z, Y = y/z értékeket írunk. Akkor X, Y a P pont π síkban felvett két merőleges tengelytől való távolságát jelentik. A két tengely, amint az a 93. ábrán látható, az x- és y-tengelyekkel párhuzamos. Tudjuk, hogy egy aX + bY + c = 0 alakú egyenlet a π síkon egy egyenest állít elő. Behelyettesítve ebbe az egyenlet be X = x/z, Y = y/z értékeket, és végigszorozva z-vel, azt találjuk, hogy ennek az egyenletnek homogén koordinátákban kifejezett egyenlete, amint azt a hyperref[p208-hom]208. oldalon láttuk, ax + by + c = 0. Így pl. a 2x−3y+z = 0 egyenes egyenlete közönséges X, Y derékszögű koordinátákban 2X−3Y+1 = 0. Természetesen az utóbbi egyenlet az egyenes végtelen távoli pontjára, melynek egyik homogén koordinátahármasa (3, 2, 0), már nem érvényes. Még valamit meg kell jegyeznünk. Sikerült a pont és az egyenes tisztán analitikus definícióját adnunk, de nem mondottuk még meg, hogy a projektív transzformáció éppen ennyire fontos fogalmának mi az analitikus megfelelője. Bebizonyítható, hogy az egyik sík másik síkra való projektív transzformációja, amint azt a 210. oldalon definiáltuk, megadható analitikusan lineáris
243
egyenletek olyan x 0 = a1 x + b1 y + c1 z,
(4)
y 0 = a2 x + b2 y + c2 z, z 0 = a3 x + b3 y + c3 z rendszerével, amely összekapcsolja a π 0 sík pontjainak x 0 , y 0 , z 0 homogén koordinátáit π sík pontjainak x, y, z homogén koordinátáival. Jelenlegi felfogásunk szerint mármost a projektív transzformációt úgy definiálhatjuk, mint olyan transzformációt, amelyet a (4) alakú lineáris egyenletek tetszőleges rendszere ad meg. A projektív geometria tételei ebben a felfogásban (x, y, z) számhármasok (4) alakú transzformációk alatti viselkedéséről szóló tételek. Pl. egy egyenes két pontjának kettősviszonyáról bebizonyítani a projektív transzformációkkal szembeni invarianciáját, ebben a felfogásban a lineáris transzformációk algebrájába tartozó egyszerű feladat. Az analitikus eljárás további részleteivel nem foglalkozhatunk. Ehelyett visszatérünk a projektív geometria szemléletesebb tájaira.
7. § Vonalzó használatával megszerkeszthető feladatok Megegyezünk, hogy az alábbi feladatokban csak vonalzót engedünk meg szerkesztési segédeszközként. Az 1–18. feladatok J. Steiner egyik dolgozatából származnak, amelyben bebizonyította, hogy a körző nélkülözhető a geometriai szerkesztésekben, ha adva van egy rögzített kör és középpontja (l. III. fejezet, 191. o.). Oldjuk meg az adott sorrendben a feladatokat. Egy P ponton átmenő négy egyenest, a, b, c, d-t akkor nevezünk harmonikus négyesnek, ha (a b c d) kettősviszonyuk értéke −1. a és b egyenest c és d egyenesre vonatkozóan egymás konjugáltjai nak nevezzük, és megfordítva. 1) Bizonyítsuk be, hogyha a, b, c, d egyenes harmonikus négyesében a sugár felezi a c és d közötti szöget, akkor b merőleges a-ra. 2) Szerkesszük meg egy ponton áthaladó három adott egyeneshez a negyedik harmonikus egyenest. (Útmutatás: Használjuk a teljes négyoldal tételét.) 3) Szerkesszük meg egy egyenesen adott három ponthoz a negyedik harmonikus pontot. 4) Legyen egy derékszög és egy adott tetszőleges szög csúcsa és egyik szára közös, kétszerezzük meg az adott tetszőleges szöget. 5) Legyen adva egy szög és a b szögfelező. Szerkesszünk az adott szög P csúcsában merőlegest
244
b-re. 6) Bizonyítsuk be, hogy ha a P ponton áthaladó l1 , l2 , l3 , . . ., ln egyenesek a egyenest A1 , A2 , . . ., An pontokban, b egyenest B1 , B2 , . . ., Bn pontokban metszik, akkor az Ai /Bk és Ak /Bi egyenes párok (i 6= k; i, k = 1, 2, . . . , n) metszéspontjai egy egyenesen feküsznek. 7) Bizonyítsuk be, hogy ha ABC háromszög BC oldalával párhuzamos egyenes AB oldalt B 0 , AC oldalt C 0 pontban metszi, akkor A pontot B 0 C és C 0 B egyenes D metszéspontjával összekötő egyenes felezi BC-t. 7a) Fogalmazzuk meg és bizonyítsuk be a 7. feladat megfordítottját. 8) Legyen adva egy l egyenesen három pont: P, Q, R úgy, hogy Q legyen a PR szakasz felezőpontja. Szerkesszünk egy adott S ponton keresztül párhuzamost l egyenessel. 9) Legyen adva két párhuzamos: l1 és l2 . Felezzük meg az l1 egyenesen fekvő adott AB szakaszt. 10) Húzzunk adott P ponton át adott l1 és l2 párhuzamosakkal párhuzamost. (Útmutatás: Vezessük vissza a 9. feladatot a 8. használatával a 7.-re.) 11) Steiner következőképpen oldja meg adott AB szakasz megkettőzését, ha adva van az AB-vel párhuzamos l egyenes: Húzzunk valamely C ponton keresztül, amely C pont sem az l sem az AB egyenesen nincs rajta, CA egyenest, amely l egyenest A1 pontban metszi, és CB egyenest amely l egyenest B1 pontban metszi. Azután (lásd 10. feladat) húzzunk C ponton keresztül l-lel párhuzamos egyenest, amely BA1 egyenest D pontban metszi. Ha DB1 az AB egyenest E pontban metszi, akkor AE = 2 · AB. Bizonyítsuk be ezt az állítást. 12) Osszunk egy AB szakaszt n egyenlő részre, ha adva van egy AB-vel párhuzamos l egyenes. (Útmutatás: Szerkesszük meg előbb a 11. feladat felhasználásával l egy tetszőleges szakaszának n-szeresét.) 13) Legyen adva ABCD paralelogramma, húzzunk valamely P ponton keresztül adott l egyenessel párhuzamost. (Útmutatás: Alkalmazzuk a 10. feladatot a paralelogramma centrumára, és használjuk fel a 8.-at.) 14) Legyen adva egy paralelogramma, szorozzunk egy adott szakaszt n-nel. (Útmutatás: Használjuk fel a 13.-at és a 11.-et.) 15) Legyen adva egy paralelogramma, osszunk egy adott szakaszt n egyenlő részre. 16) Legyen adva egy rögzített kör és középpontja, húzzunk adott ponton át adott egyenessel párhuzamost. (Útmutatás: Használjuk fel a 13.-at.) 17) Legyen adva egy rögzített kör és középpontja, szorozzunk és osszunk egy adott szakaszt n-nel. (Útmutatás: Használjuk fel a 13.-at.)
245
18) Legyen adva egy rögzített kör és középpontja, húzzunk adott ponton keresztül adott egyenesre merőlegest. (Útmutatás: Használjuk az adott rögzített körbe írható négyszöget, és az adott egyenessel párhuzamos két oldala segítségével vezessük vissza ezt az előbbi feladatra.) 19) A fenti 1-18. feladatok eredményének a felhasználásával milyen alapvető szerkesztési feladatokat lehet megoldani egyetlen, két párhuzamos éllel rendelkező vonalzó használatával? 20) Messe két egyenes, l1 és l2 , egymást a rajzlap síkján kívül fekvő P pontban. Szerkesszük meg egy adott Q pontot P ponttal összekötő egyenest. (Útmutatás: Egészítsük ki az adott elemeket a síkbeli Desargues-tétel ábrájával úgy, hogy P és Q a Desargues-tételben szereplő két háromszög megfelelő oldalainak a metszéspontja legyen.) 21) Szerkesszünk egyenest, mely két, egymástól a használt vonalzó élénél nagyobb távolságban fekvő pontot köt össze. (Útmutatás: Alkalmazzuk a 20. feladatot.) 22) Határozzon meg két egyenes, l1 és l2 a rajzpapír síkján kívül, egy P pontot metszéspontjaként, ugyanígy m1 és m2 egyenes egy Q pontot. Szerkesszük meg PQ egyenes adott rajzpapíron fekvő részét. (Útmutatás: PQ egy pontját megkapjuk, ha az adott elemeket a Desargues-tétel ábrájává egészítjük ki úgy, hogy az egyik háromszög két oldala l1 , illetve m1 egyenesen legyen, a másik háromszög megfelelő két oldala pedig l2 és m2 egyenesen.) 23) Oldjuk meg a 20. feladatot Pascal tételének segítségével (l. 234. o.). (Útmutatás: Egészítsük ki az adott elemeket a Pascal-tétel ábrájává l1 , l2 egyeneseket a hatszög átellenes oldalpárjának tekintve, Q-t pedig másik két átellenes oldal metszéspontjának.) *24) Legyen adva két, teljes egészében a rajzlapon kívül fekvő egyenes két, egymást a rajzlap síkján kívül metsző egyenesekből álló egyenespár által. Határozzuk meg metszéspontjukat rajta áthaladó két egyenes segítségével.
8. § Kúpszeletek és másodrendű felületek 1. Kúpszeletek elemi metrikus geometriája Eddig csupa ponttal, egyenessel, síkkal és az ezekből képezhető alakzatokkal foglalkoztunk. Ha a projektív geometria semmi egyebet nem tartalmazna, mint ilyen „lineáris” alakzatok tanulmányozását, akkor viszonylag kevés jelentősége lenne. Alapvető fontosságú tény, hogy a projektív geometria nem korlátozódik lineáris alakzatok tanulmányozására, hanem magában foglalja a kúpszeletek elméletének egész területét, és annak több dimenzióra való általánosítását is. Az antik matematika egyik nagy teljesítménye volt, hogy Apollóniosz kidolgozta a kúpszeletek – ellipszis, hiperbola, parabola – metrikus
246
94. ábra. Kúpszeletek elméletét. Aligha lehet eléggé értékelni a kúpszeletek jelentőségét a tiszta és alkalmazott matematikában (pl. a bolygópályák és az elektron pályája a hidrogénatomban kúpszelet). Nem csoda, ha a kúpszeletek klasszikus görög elmélete még ma is nélkülözhetetlen része a matematikai oktatásnak. A görög geometria azonban semmi esetre sem tekinthető végérvényesnek. A görögök után kétezer évvel fedezték fel a kúpszeletek fontos projektív tulajdonságait. Ezeknek a középiskolai oktatásba való bevezetését azonban – egyszerűségük és szépségük ellenére – máig meggátolta a maradiság.
247
Emlékeztessünk először a kúpszeletek metrikus definíciójára. Többféle ilyen definíció lehetséges, ekvivalenciájuk kimutatása az elemi geometria körébe tartozik. A szokásos definíciók a fókuszok ra hivatkoznak. Az ellipszis e szerint a definíció szerint azon P pontok geometriai helye a síkban, amelyeknek két rögzített F1 , F2 ponttól, az ún. fókuszoktól való r1 , r2 távolságainak az összege állandó érték. (Ha a két fókusz egybeesik, az alakzat kör.) A hiperbola definíciója a sík azon P pontjainak mértani helye, amely pontokra az r1 −r2 különbség abszolút értéke egyenlő egy rögzített állandóval. A parabola úgy van definiálva, mint azon P pontok mértani helye, mely pontok F rögzített ponttól való távolsága egyenlő egy adott l egyenestől való távolságukkal. Az analitikus geometriában mindezek a görbék az x, y koordináták másodfokú egyenleteivel fejezhetők ki. Megfordítva, nem nehéz kimutatni, hogy bármely ax2 + by2 + cxy + dx + ey + f = 0 másodfokú egyenlet által analitikusan definiált görbe vagy a három kúpszelet egyike, vagy egy egyenes, vagy egy egyenespár, vagy egy pont, vagy pedig képzetes. Ezt a tényt rendszerint valamely alkalmas új koordinátarendszer bevezetésével bizonyítják, amint az bármely analitikus geometria tankönyvben megtalálható. A kúpszeletek fenti definíciói lényegében metrikusak, hiszen a távolság fogalmát használják fel. Van azonban másféle definíciójuk is, amely kijelöli a kúpszeletek helyét a projektív geometriában: a kúpszeletek egyszerűen egy körnek síkra való vetületei. Ha C kört valamely O pontból vetítjük, a vetítő sugarak végtelen kettős kúpot alkotnak, és ennek a kúpnak valamely π síkkal való metszete lesz a C kör vetülete. Ez a metszet aszerint lesz ellipszis vagy hiperbola, amint a sík a kúp egyik vagy mindkét felét metszi. A parabola a közbeeső helyzetnek felel meg, akkor keletkezik, amikor π sík párhuzamos egy O ponton áthaladó egyenessel. (l. 94. ábra.) A vetítőkúpnak nem kell forgáskúpnak lennie, azaz olyan kúpnak, melynek O csúcsa rajta van a C kör középpontjában a kör síkjára emelt merőlegesen, lehet a vetítőkúp ferde is. Bizonyítás nélkül említjük itt meg, hogy a kúp síkkal való metszete utóbbi esetben is olyan görbe, melynek egyenlete másodfokú; megfordítva, minden másodrendű görbe vetítéssel megkapható a körből. Ezért nevezik a másodrendű görbéket kúpszeletnek. Mondottuk, hogy az E metszésvonal ellipszis lesz, ha a sík a forgáskúpnak csupán egyik
248
95. ábra. Dandelin-féle gömbök félkúpját metszi. Bebizonyíthatjuk, hogy E kielégíti az ellipszis fentebb adott szokásos fókuszos definícióját. Az egyszerű és elegáns érveléssel megoldott bizonyítás 1822-ből, G. P. Dandelin belga matematikustól származik. Két gömb: S1 és S2 bevezetésén alapul (95. ábra), amely két gömb F1 illetve F2 pontban érinti π síkot, a kúpot pedig két párhuzamos kör, K1 és K2 mentén érinti. Kössük össze E tetszőleges P pontját F1 -gyel és F2 -vel, és húzzuk meg a P pontot a kúp O csúcsával összekötő egyenest. Ez az egyenes
249
teljes egészében a kúpfelületen fekszik és K1 , K2 köröket Q1 , illetve Q2 pontban metszi. Mármost PF1 és PQ1 a P pontból S1 gömbhöz húzott két érintő, tehát PF1 = PQ1 . Ugyanígy PF2 = PQ2 . Összeadva a két egyenletet, PF1 + PF2 = PQ1 + PQ2 . Azonban PQ1 + PQ2 = Q1 Q2 nem egyéb mint a K1 és K2 párhuzamos körök kúpfelületen mért egymástól való távolsága, és így független a P pont megválasztásától az E görbén. Az eredő PF1 + PF2 = állandó egyenlet, amely E minden P pontjára érvényes, pontosan az ellipszis fókuszos definíciója. E tehát ellipszis és F1 , F2 a fókuszai. Feladat: Ha egy sík a kúp mindkét félkúpját metszi, a metszet hiperbola. Bizonyítsuk be ezt a tényt, egy-egy gömböt használva mindegyik félkúpban.
2. Kúpszeletek projektív tulajdonságai A megelőző pontban mondottak alapján próbálkozzunk meg a következő definícióval: a kúpszelet egy körnek síkra való vetülete. Ez a definíció jobban megfelel a projektív geometria szellemének, mint a szokásos fókuszos definíció, mivel az utóbbi teljes egészében a távolság metrikus fogalmán alapul. Még most adott definíciónk sem mentes ettől a hibától, mivel a „kör” is metrikus geometriai fogalom. Azonban tüstént megadjuk a kúpszeletek tisztán projektív definícióját. Megegyeztünk már abban, hogy a kúpszelet semmi egyéb, mint kör vetülete (azaz
250
96. ábra. Kettősviszony a körön a „kúpszelet” szó a kör projektív osztályának bármely görbéjét jelenti; l. 230. o.), következésképpen a kör minden tulajdonsága, amely vetítésnél invariáns, tulajdonsága bármely kúpszeletnek is. Jól ismert (metrikus) tulajdonsága a körnek, hogy a kör adott ívéhez tartozó minden kerületi szöge egyenlő, bárhol is van a körön a kerületi szög O csúcsa. A 96. ábrán látható, hogy az AB körívhez tartozó AOB kerületi szög nagysága független az O pont helyzetétől. Ez a tény összefüggésbe hozható a kettősviszony projektív geometriai fogalmával, ha a körön nem két pontot: A, B-t tekintünk, hanem négy A, B, C, D pontot. Ezt a négy pontot egy ötödik, a körön fekvő O ponttal összekötő négy a, b, c, d egyenes (a b c d) kettősviszonya egyedül a CA, CB, DA, DB ívekhez tartozó kerületi szögek nagyságától függ. Az A, B, C, D pontokat összekötve egy ötödik, O 0 körön fekvő ponttal, a négy a 0 , b 0 , c 0 , d 0 sugarat kapjuk. A kör most említett tulajdonságából következik, hogy az így nyert két sugárnégyes „kongruens” 7 . Ezért kettősviszonyuk azonos: (a 0 b 0 c 0 d 0 ) = (a b c d). Ha most a kört projekcióval bármely K kúpszeletbe visszük át, kapunk K-n négy pontot, jelöljük ezeket újból A, B, C, D betűkkel, kapunk továbbá két O, O 0 pontot, és két egyenes négyest: a, b, c, 7
Négy, egy ponton áthaladó a, b, c, d egyenes együttesét akkor mondunk kongruensnek másik négy a 0 , b 0 , c 0 , d 0 egyenes együttesével, ha az első együttes minden egyes egyenese ugyanakkora szöget zár be páronként egymással, mint a második együttes megfelelő egyenesei.
251
d-t és a 0 , b 0 , c 0 , d 0 -t. Ez a két négyes nem lesz kongruens, mivel a szögek egyenlőségét a projekció általában nem tartja meg. Azonban mivel a projekció kettősviszonytartó, (a b c d) = (a 0 b 0 c 0 d 0 ) egyenlőség továbbra is érvényes. Így a következő alapvető tételt kapjuk: ha K kúpszelet tetszőleges négy A, B, C, D pontját K egy ötödik O pontjával az a, b, c, d egyenesek kötik össze, akkor az (a b c d) kettősviszony értéke független az O pont K-n elfoglalt helyzetétől (97. ábra).
97. ábra. Kettősviszony ellipszisen Valóban figyelemre méltó eredmény. Tudtuk már, hogy egy egyenes bármely négy adott pontja bármely ötödik O pontból mindig azonos kettősviszonnyal vetül. Ez a kettősviszonyokra vonatkozó tétel a projektív geometriai alapténye. Most megtanultuk, hogy ugyanez áll a kúpszelet bármely négy pontjára is, feltéve hogy figyelembe vesszük a következő fontos megszorítást: az ötödik pont többé nem lehet bárhol a síkon, de még mindig szabadon mozoghat az adott kúpszeleten. Nem nehéz igazolni az eredmény megfordítottját a következő alakban: ha egy K görbén adva van két pont O és O 0 úgy, hogy K minden A, B, C, D pontnégyese ugyanazon kettősviszonyúnak látszik O-ból és O 0 -ből, akkor K kúpszelet (és így A, B, C, D ugyanazon kettősviszonyúnak látszik K egy harmadik O 00 pontjából is). A bizonyítást itt nem közöljük. A kúpszeletek fenti projektív tulajdonságai az ilyen görbék általánosabb szerkesztési módszerére utalnak. Egy sík egyazon adott O ponton áthaladó egyeneseinek az összességét sugársor nak nevezzük. Tekintsük most a K kúpszeleten levő O és O 0 pontokhoz tartozó két sugársort. Az O és O 0 pontot, amelyen a két sugársor egyenesei haladnak
252
át, a két sugársor tartójának nevezzük. Az O és az O 0 tartójú sugársor egyeneseit kölcsönösen egyértelműen megfeleltethetjük egymásnak, ha az O tartójú sugársor a egyeneséhez hozzárendeljük az O 0 tartójú sugársor azon a 0 egyenesét, amely a K kúpszelet A pontjában metszi az a egyenest. Akkor az O sugársor bármely négy a, b, c, d egyenesének ugyanaz a kettősviszonya mint az O 0 sugársor négy megfelelő a 0 , b 0 , c 0 , d 0 egyenesének. Minden kölcsönösen egyértelmű vonatkozást két sugársor között, amelynek megvan ez a tulajdonsága, projektív vonatkozásnak nevezünk. (Ez a definíció nyilvánvaló duális megfelelője a két egyenes pontjai között fennálló, a 221. oldalon megadott projektív vonatkozás definíciójának.) Azokat a sugársorokat, amelyek között projektív vonatkozás definiálható, projektív sugársoroknak nevezzük. Ezzel a definícióval most már kimondhatjuk, hogy K kúpszelet két projektív sugársor megfelelő egyeneseinek metszéspontjaiból álló geometriai hely. Ez a tétel az alapja a kúpszeletek tisztán projektív geometriai definíciójának: a kúpszelet az a geometriai hely, amelyet két projektív sugársor megfelelő egyeneseinek a metszéspontjai határoznak meg.8 Csábító lenne követni azt az utat, amelyet a kúpszeletek elméletében ez a definíció nyitott, azonban csupán néhány megjegyzésre szorítkozhatunk.
98. ábra. Segédábra projektív vonatkozásban álló sugársorok szerkesztéséhez Projektív sugársorpárokat következőképpen lehet kapni. Vetítsük valamely l egyenes minden P pontját két különböző O és O 00 centrumból; feleljenek meg a vetítő sugársorok8
Ez a geometriai hely adott feltételek mellett egyenessé fajulhat el, l. 98. ábra.
253
ban a és a 00 egyenesek egymásnak, egyenesek, amelyek l egyenes egy pontjában metszik egymást. A két sugársor akkor projektív sugársor lesz. Vegyük most O 00 sugársort, és vigyük át valamely merev mozgással O 0 helyzetbe. Az így kapott O 0 sugársor és O sugársor projektív vonatkozásban lesznek. Ezen az úton egyébként két sugársor között minden projektív vonatkozás megkapható. (Ez a tény a 222. oldalon közölt 1. feladat duálja.) Ha O és O 0 sugársorok kongruensek, kört kapunk. Ha a szögek egyenlőek, de ellentétesen irányítottak, a kúpszelet egyenlő szárú hiperbola (l. 99. ábra).
99. ábra. Kör és egyenlő szárú hiperbola szerkesztése projektív sugársorokkal Jegyezzük meg, hogy ez a kúpszelet definíció egyenes vonalat is adhat geometriai helyként, mint az a 98. ábran látható. Ebben az esetben OO 00 egyenes önmagának felel meg, és minden pontját mint a geometriai helyhez tartozót kell tekinteni. Tehát a kúpszelet egyenespárrá fajul el, megegyezésben azzal a ténnyel, hogy vannak két egyenesből álló metszetei a kúpnak (ti. azok, amelyeket a kúp csúcsán áthaladó síkok metszenek ki). Feladatok: 1) Rajzoljunk ellipsziseket, hiperbolákat és parabolákat projektív sugársorok segítségével. (Ajánljuk az olvasónak az ilyen szerkesztésekkel való kísérletezést. Nagymértékben elősegíti a dolgok megértését.) 2) Legyen adva egy ismeretlen K kúpszelet öt pontja: O, O 0 , A, B, C. Szerkesszük meg azt
254
a D pontot, amelyben egy O ponton áthaladó d egyenes metszi K-t. (Útmutatás: Tekintsük az O ponton áthaladó OA, OB, OC által megadott a, b, c sugarakat. Tekintsük továbbá hasonlóképpen a O 0 ponton áthaladó a 0 , b 0 , c 0 sugarakat. Húzzuk meg O ponton keresztül d sugarat és szerkesszük meg O 0 ponton keresztül a d 0 sugarat úgy, hogy (a b c d) = (a 0 b 0 c 0 d 0 ) legyen. Akkor d és d 0 metszéspontja szükségképpen K pontja.)
3. Kúpszelet mint burkológörbe
100. ábra. A kör mint érintőinek halmaza A kúpszelet érintőjének a fogalma a projektív geometriába tartozik, mivel a kúpszelet érintője olyan egyenes, amely a kúpszeletet egyetlen pontban érinti, és ez a tulajdonság vetítéssel szemben invariáns. Kúpszeletek érintőinek projektív tulajdonságai a következő alapvető tételen alapulnak: kúpszelet bármely négy érintőjének egy ötödik kúpszeletérintővel való metszéspontjai mindig ugyanazt a kettősviszonyt adják, bármi is legyen az ötödik érintő helyzete. A tétel bizonyítása nagyon egyszerű. Mivel a kúpszelet kör vetülete, és a tétel csak olyan tulajdonságokkal foglalkozik, amelyek a vetítésnél invariánsak, elegendő a tételt a kör esetére bizonyítani ahhoz, hogy teljes általánosságban kimondhassuk. A kör esetére a tétel az elemi geometria módszereivel bizonyítható. Legyen P, Q,
255
101. ábra. A kör érintési tulajdonsága R, S bármely négy pont K kör kerületén és a, b, c, d a mondott pontokhoz húzott érintők. Legyen T egy további pont a körön és o az érintő ebben a pontban. Messék a, b, c, d érintők o-t A, B, C, D pontokban. Ha M a kör középpontja, akkor nyilvánvaló, hogy TMA^ = 12 TMP^, és 12 TMP^ egyenlő a K körön a TP körívhez tartozó kerületi szöggel. Hasonlóképpen TMB^ egyenlő a TQ körívhez tartozó kerületi szöggel. Tehát AMB^ = 12 PQ, ahol
1 2
_
_
PQ a PQ körívhez tartozó kerületi szög a K körön. Tehát A,
B, C, D pontok olyan négy sugárral vannak vetítve M-ből, amely négy sugárnak a szögét P, Q, R, S rögzített helyzetű pontok adják meg. Következésképpen (A B C D) kettősviszony csak a négy a, b, c, d érintőtől függ, és nem függ az ötödik o érintő speciális helyzetétől. Pontosan ezt állította a bizonyítandó tétel. Láttuk az előző fejezetben, hogy a kúpszelet megszerkeszthető két projektív sugársor megfelelő egyeneseinek metszéspontjaiként. A most bizonyított tétel lehetővé teszi, hogy megadjuk ennek a szerkesztésnek a duálját. Tekintsük K kúpszelet két érintőjét, a-t és a 0 -t. Egy harmadik t érintő a-t A, a 0 -t A 0 pontban metszi. Ha t-t a kúpszelet mentében mozgatjuk, akkor A ↔ A0 leképezést létesíthetjük a és a 0 pontjai között. Ez a leképezés a és a 0 pontjai között projektív vonatkozás, mert tételünk szerint a bármely négy pontjának ugyanaz a kettősviszonya, mint a 0 megfelelő négy pontjának. Látjuk tehát, hogy K kúpszelet, ha
256
102. ábra. Projektív pontsorok egy ellipszis két érintőjén mint érintőinek halmazát tekintjük, azokból az egyenesekből áll, amelyek két, a és a 0 egyenesen levő, projektiv pontsor9 megfelelő pontjait kötik össze. Ez a tény használható a kúpszelet „burkológörbe”-ként, helyesebben egyenesekkel mint elemekkel megadott görbeként való projektív definiálására. Hasonlítsuk össze ezt a definíciót a kúpszeletnek az előbbi pontban adott projektív definíciójával: I
II
A kúpszelet mint pontok halmaza két
A kúpszelet mint egyenesek halmaza
projektív sugársor megfelelő egyenesei-
két projektív pontsor megfelelő pontjait
nek a metszéspontjaiból áll.
összekötő egyenesekből áll.
Ha egy kúpszelet egy pontjába vont érintőjét magának ennek a kúpszeletpontnak a duáljaként tekintjük, és ha a „burkológörbét” (a görbe összes érintőjéből álló egyeneshalmazt) mint a „pontgörbe” (a görbe összes pontjából álló ponthalmaz) duálját fogjuk fel, akkor szembetűnő a két állítás tökéletes duális megfelelkezése. A dualizálás közben, minden fogalmat duáljával cserélve fel, ugyanaz marad a „kúpszelet” szó: egyik esetben „pontkúpszelet” , amit pontjai definiálnak; másik esetben „vonalkúpszelet”, amit érintői definiálnak. (l. a 100. ábrát, a 255. oldalon.) 9
Egy egyenesen levő pontok halmazát pontsor nak nevezzük. Ez a fogalom a sugársor duális megfelelője.
257
Fontos következménye ennek a ténynek, hogy a sík projektív geometriájában a dualitás elve, amit eredetileg csak pontokra és egyenesekre mondtunk ki, kiterjeszthető kúpszeletekre is. Ha bármely, pontokra, egyenesekre és kúpszeletekre vonatkozó tételben minden egyes elemet duáljával helyettesítünk (figyelve arra, hogy kúpszelet egy pontjának duálja a kúpszelet egy érintője), az eredmény ismét igaz tétel lesz. A következő pontban találunk majd az elv alkalmazására példát.
103. ábra. Kongruens pontsorok által definiált parabola
104. ábra. Hasonló pontsorok által definiált parabola Kúpszeletek „vonalkúpszelet”-ként való szerkesztését látjuk a 103. és 104. ábrán. Ha a két projektív pontsoron a két végtelen távoli pont egymásnak felel meg (amint annak kongruens vagy hasonló10 pontsorok esetében lennie kell), a kúpszelet parabola; s ennek a megfordítottja is igaz. 10
Magától értetődik, mi az értelme két pontsor közötti leképezésre vonatkoztatva a „kongruens” és „hasonló” kifejezésnek.
258
Feladat: Bizonyítsuk be a tétel megfordítását: Parabola bármely két rögzített érintőjét a parabola mentén mozgó érintő két hasonló pontsorban metszi.
4. A kúpszeletekre vonatkozó általános Pascal- és Brianchon-féle tételek
105. ábra. Általános Pascal-féle alakzat. Az ábrán két eset van feltüntetve: egyik az 1, 2, 3, 4, 5, 6 hatszögre, a másik az 1, 3, 5, 2, 6, 4 hatszögre A kúpszeletekre vonatkozó dualitás elvének egyik legszebb illusztrációja az általános Pascal-tétel és az általános Brianchon-tétel közötti összefüggés. Az első tételt 1640ben fedezte fel Pascal, a másodikat 1806-ban Brianchon. Mégis, egyik közvetlen következménye a másiknak, mert bármely tétel, amely csak kúpszeletekről, egyenesekről és pontokról szól, igaz marad, ha a duális állítással helyettesítjük. Az 5. §-ban ugyanezen a két néven említett két tétel az alábbi két általánosabb tétel elfajult alakja: Pascal tétele: Egy kúpszeletbe írt hatszög átellenes oldalai három kollineáris pontban
259
metszik egymást. Brianchon tétele: Egy kúpszelet köré írt hatszög átellenes szögpontjait összekötő három átló egy közös pontban metszi egymást (konkurrens). Mindkét tétel nyilvánvalóan projektív jellegű. Duális voltuk a következő megfogalmazásban azonnal szembeötlik: Pascal tétele: Legyen adva egy kúpszeleten hat pont: 1, 2, 3, 4, 5, 6. Kössük össze ezeket a pontokat egymás után (1, 2), (2, 3), (3, 4), (4, 5), (5, 6), (6, 1) egyenesekkel. Jelöljük meg (1, 2) és (4, 5), (2, 3) és (5, 6), valamint (3, 4) és (6, 1) egyenes metszéspontjait. Ez a három metszéspont egy egyenesen fekszik. Brianchon tétele: Legyen adva egy kúpszelet hat érintője: 1, 2, 3, 4, 5, 6. Az egymás utáni sorrendben vett érintők (1, 2), (2, 3), (3, 4), (4, 5), (5, 6), (6, 1) pontokban metszik egymást. Húzzuk meg (1, 2) pontot (4, 5) ponttal, (2, 3) pontot (5, 6) ponttal, valamint (3, 4) pontot (6, 1) ponttal összekötő egyeneseket. Ez a három egyenes egy közös ponton halad át.
106. ábra. Általános Brianchon-féle alakzat. Itt is két eset van ábrázolva
260
107. ábra. Pascal tételének bizonyítása A bizonyítás az elfajult eseteknél használt specializációhoz hasonló módszerrel adható. Legyenek Pascal tételének bizonyítására A, B, C, D, E, F egy K kúpszeletbe írt hatszög szögpontjai. Projekcióval AB párhuzamossá tehető ED-vel és FA párhuzamossá tehető CD-vel, úgyhogy a 107. ábrán feltüntetett konfigurációt kapjuk. (Egyszerűség kedvéért a hatszöget önmagát metszőnek ábrázoltuk, bár ez nem szükségszerű.) Pascal tétele most arra az egyszerű állításra redukálódik, hogy CB párhuzamos FE-vel; azaz, hogy az az egyenes, amelynek pontjaiban a hatszög átellenes oldalai egymást metszik, a sík végtelen távoli egyenese. Ennek az állításnak a bizonyítására tekintsük F, A, B, D pontokat melyeket, mint tudjuk, állandó k kettősviszonyú sugarakkal vetítünk K bármely más, pl. C vagy E pontjából. Vetítsük őket C pontból; akkor a vetítősugarak AF-et négy, F, A, Y, ∞, pontban metszik, e négy pont kettősviszonya k. Tehát YF : YA = k (l. 230. o.). Ha most ugyanezeket a pontokat E pontból vetítjük BA-ra, akkor azt kapjuk, hogy k = (X A B ∞) = BX : BA. Tehát azt kapjuk, hogy BX : BA = YF : YA, amely azt mondja ki, hogy YB és FX párhuzamosak. Ezzel Pascal tétele bizonyítást nyert. Brianchon tétele vagy a dualitás elvéből következik, vagy közvetlenül, a fenti okfejtés
261
duális megfelelőjével. Feladatként hajtsuk végre részleteiben a bizonyítást. 5. A hiperboloid Három dimenzióban a sík kúpszeleteinek megfelelő képződményeket „másodrendű felületek”-nek nevezik. A gömb és az ellipszoid a másodrendű felületek speciális esetei. Ezek a felületek több változatosságot és lényegesen több nehézséget okoznak, mint a kúpszeletek. Az alábbiakban röviden, s a nélkül, hogy bizonyításokat közölnénk, röviden tárgyaljuk az egyik legérdekesebb másodrendű felületet az „egypalástú hiperboloid” -ot.
108. ábra. Három adott kitérő egyenest metsző egyenesek szerkesztése Ez a felület a következőképpen definiálható. Tekintsük a tér bármely három l1 , l2 , l3 általános helyzetű, ún. „kitérő” egyenesét. Ez alatt a kifejezés alatt azt kell értenünk, hogy a három egyenes között nincs kettő egy síkban fekvő, és nem lehet mind a három egy azonos síkkal párhuzamos. Elég melepő tény, hogy végtelen sok olyan egyenes van a térben, amelyik mind a három adott általános helyzetű egyenest metszi. Beláthatjuk ezt, ha az l1 egyenesen át fektetett bármely π síkot tekintjük. Ez a π sík két pontban metszi az l2 és l3 egyenest, és eme két pontot összekötő m egyenes metszi l1 , l2 , l3 egyenest. Forgassuk a π síkot l1 egyenes körül, a sík m egyenese ez alatt a mozgás alatt mindig metszeni fogja l1 , l2 , l3 egyeneseket, és egy végtelen kiterjedésű felületet hoz létre. Ez a felület az egypalástú hiperboloid; m típusú egyenesek végtelen seregéből áll. A sereg tetszőleges három m1 , m2 , m3 egyenese szintén három általános helyzetű egyenes, tehát
262
a tér ezen három egyenest metsző minden egyenese szintén a hiperboloid felülethez tartozik. Éppen ez a hiperboloid alapvető tulajdonsága: két különböző egyenes seregből áll, éspedig úgy, hogy mindkét sereg tetszőleges három egyenese általános helyzetű a saját seregében, és az egyik sereg minden egyes egyenese metszi a másik sereg minden egyenesét.
109. ábra. Hiperboloid A hiperboloid fontos projektív tulajdonsága, hogy az egyik sereg adott egyenesének a másik sereg tetszőleges négy egyenesével való metszéspontja által definiált kettősviszony értéke független az adott egyenes helyzetétől. Közvetlen következménye ez a hiperboloid forgó sík által történő szerkesztésének, amint azt az olvasó feladatképpen könnyen kimutathatja. A hiperboloid egyik legérdekesebb tulajdonsága az, hogy bár egymást metsző egyenesek két seregéből áll, ezek az egyenesek mégsem merevítik meg a felületet. Ha a felület modelljét a metszéspontokban szabadon forgó rudakból készítjük el, az egész figura a legkülönfélébb alakúra deformálható.
263
9. § Axiomatika és nem-euklidészi geometria 1. Az axiomatikus módszer Az axiomatikus módszer a matematikában már legalább olyan régi, mint Euklidész munkái. Igaz, hogy a görög matematika semmiképpen sem fejlődött úgy, s nem szorítkozott arra a merev posztulációs formára, amint az az Elemek ben látható, de ennek a műnek olyan nagy hatása volt a következő nemzedékekre, hogy a matematikai szigorúságú bizonyítás mintaképe lett, általánosságban. Néha még filozófusok is, – pl. Spinoza: Ethica, more geometrico demostrata 11 című művében – megkísérelték érveléseiket axiómákból levezetett tételek formájában előadni. A XVII. és XVIII. század folyamán eltértek az euklidészi tradíciótól, de a modern matematika minden területét újra egyre fokozódó mértékben áthatotta az axiomatika. Az axiomatikus tendencia egyik legújabb eredménye egy új tudomány, a matematikai logika megteremtése volt. Az axiomatikus felfogás nagy általánosságban a következőképpen jellemezhető: deduktív rendszerben akkor bizonyított egy tétel, ha szükségszerű következménye valamely már bizonyított állításnak, amelyet szintén hasonlóképpen kellett bizonyítani, és így tovább. A matematikai bizonyítás így a végtelen regresszió lehetetlenségébe torkollana, ha meg nem állanánk valahol. Kell tehát lenni adott számú olyan állításnak, amelyeket igaznak fogadunk el, és nem kívánjuk a bizonyításukat. Ezeket nevezzük posztulátumok nak vagy axiómák nak. Ezekből kell levezetni tisztán logikai érveléssel minden más tételt. Ha a természettudomány valamely területének tényeit olyan logikai rendben sorakoztattuk, hogy mind néhány kiválasztott (lehetőleg kevés, egyszerű és könnyen érthető) állításból következnek, akkor azt mondjuk, hogy a tárgykört axiomatikus formában állítottuk elő. Az axiómákként tekintett állítások kiválasztása igen nagymértékben önkényes. De nem szabad elfelejteni, hogy az axiomatikus módszer csak akkor ér valamit, ha egyszerű és kevés posztulátumot fogadunk el. A posztulátumoknak ezenkívül konzisztensek nek kell lenniök abban az értelemben, hogy ne lehessen belőlük két egymásnak ellentmondó tételt levezetni. Szükséges továbbá, hogy a posztulátumok teljes rendszert alkossanak, azaz minden tételt le lehessen belőlük vezetni. „Gazdaságosság” okából kivánatos, hogy a posztulátumok kölcsönösen függetlenek legyenek egymástól, azaz egyik posztulátum 11
Etika, geometriai módszerekkel bizonyítva.
264
se legyen logikai következménye a másiknak. Az axiómarendszerek konzisztenciájának és teljességének a kérdése nagy vitákat szült. Az emberi megismerés gyökereiről vallott különféle filozófiai elméletek a matematika alapjaira vonatkozóan látszólag összeegyeztethetetlen nézetekre vezettek. Ha a matematika objektumait a „tiszta szemlélet” világának valóságos tárgyaiként fogjuk fel, olyan dolgoknak, amelyek függetlenek az emberi elme tevékenységétől és definícióitól, akkor az axiómákból levezetett tételek nem lehetnek soha ellentmondóak, hiszen a matematikai tételek a létező valóságot tükröző, objektíve igaz állítások. Ebből a „kantiánus” szempontból tekintve, a konzisztencia kérdése természetesen értelmetlen lenne. Sajnos, a tényleges matematika legnagyobb része nem illeszthető be efféle egyszerű filozófiai keretbe. A modern intuicionista matematika nem erre a tág kanti értelemben vett intuícióra épít. A megszámlálhatóan végtelen sokat fogadják el az intuicionisták a szemlélet egyedüli törvényes gyermekeként, és csak megszerkeszthető tulajdonságokat engednek meg. Ezáltal azonban olyan alapvető fogalmak válnak számkivetetté, mint pl. a számkontinuum, s az élő matematika fontos, nagy részeit kell kirekeszteni, ami pedig megmarad, az reménytelenül bonyolulttá válik. Homlokegyenest ellentétes a „formalisták” álláspontja. Ők semmiféle szemléletes valóságot sem tulajdonítanak a matematikai dolgoknak, nem állítják, hogy az axiómák a tiszta szemlélet valóságára vonatkozó nyilvánvaló igazságokat fejeznek ki. Őket pusztán a posztulátumok alapján történő érvelés formális logikai eljárása érdekli. Ez a felfogás egy szempontból határozottan előnyösebb az intuicionizmusnál, biztosítja ugyanis a matematikusok számára az elmélethez és az alkalmazásokhoz egyaránt szükséges szabadságot. Egyben azonban kötelezi a formalistát annak a bizonyítására, hogy axiómái, amelyek most az emberi elme teljesen önkényes termékeinek látszanak, soha nem vezethetnek ellentmondásra. Az utóbbi húsz esztendő alatt sokat fáradoztak azon, hogy konzisztencia-bizonyítékokat találjanak legalábbis az aritmetika és az algebra axiómái számára és a számkontinuum fogalmára. Az elért eredmények igen jelentősek, de a cél még nagyon messze van. A legújabb eredményekből meg egyenesen az látszik, hogy az efféle kísérletek sohasem járhatnak teljes sikerrel, a konzisztencia és a teljesség bizonyítása a fogalmak valamely szigorúan zárt rendszerén belül elvileg lehetetlen. Jellemző, hogy az alapokra vonatkozó valamennyi meggondolás teljesen konstruktív módszerekkel dolgozik, és szemléletes modellekkel van meghatározva.
265
Az intuicionisták és formalisták közötti vitát, amelyet a halmazelmélet paradoxonai (l. 107. o.) még élesebbé tettek, a két iskola szenvedélyes hívei a nyilvánosság elé vitték. A matematikusok világa visszhangzott az „alapok krízíse” körüli csatáktól. Azonban a riadót nem kellett, s nem kell ma sem túl komolyan venni. Minden tiszteletet megadva az eredményeknek, amiket a matematika alapjainak tisztázásáért folytatott küzdelem hozott, teljesen indokolatlan lenne azt hinni, hogy a legcsekélyebb mértékben is veszélyeztetik a matematika élő törzsét efféle véleménykülönbségek vagy paradoxonok, amelyek a fogalomképzés korlátlan általánosságára való törekvésből származnak. De eltekintve az alapok iránti érdeklődéstől és a filozófiai megfontolásoktól, a matematika tárgyának axiomatikus megközelítési módja a természetes út, amelyen haladva fel lehet gombolyítani a különféle tények közötti kapcsolatok szövevényét, és tisztázni lehet a struktúra logikai vázának a lényegét. Megtörténhet, hogy a figyelem efféle formális struktúrákra való összpontosítása könnyebben vezet általánosításokra, mint a fogalmak szemléletes jelentésének a vizsgálata, és olyan alkalmazásokra hívhatja fel a figyelmet, amelyeket az intuitív módszer alkalmazása közben elkerültünk volna. Jelentős felfedezést vagy messzire világító új ismeretet azonban ritkán lehet az axiomatikus módszer kizárólagos alkalmazásával kapni. A matematika dinamikájának igazi motorja a szemlélet által vezetett konstruktív gondolkodási mód. Lehet az axiomatikus forma végső ideál, de veszélyes tévedés lenne azt hinni, hogy az axiomatika képezi a matematikai gondolkodás lényegét. A matematikus konstruktív szemlélete olyan nem deduktív, irracionális elem, amely a matematika számára éppen olyan életfontosságú, mint az alkotó fantázia a zenéhez vagy a képzőművészetekhez. Euklidész napjai óta a geometria volt az axiomatizált tudomány mintaképe. Századok hosszú során át tanulmányozták elmélyedten Euklidész axiómáit. De csak újabban derült ki, hogy Euklidész posztulátumait módosítani kell, és ki kell egészíteni, ha azt akarjuk, hogy az egész elemi geometria levezethető legyen belőlük. Csak a XIX. század legvégén fedezte fel például Pasch, hogy a pontok rendezése az egyenesen, az ún. „kettő között” fogalma, külön posztulátumot igényel. Pasch a következőképpen megfogalmazott állítást tekintette erre a célra szolgáló axiómának: egy egyenes, amely a háromszög egyik oldalát a háromszög csúcsától különböző pontban metszi, metszi a háromszög még egy oldalát is. (Az efféle részletek elhanyagolása sok látszatparadoxonhoz vezet,
266
amelyek látszólag szigorúan levezetve Euklidész axiómáiból, abszurd következtetéseket tesznek lehetővé. Ilyen pl. az a jól ismert „bizonyítás”, hogy minden háromszög egyenlő szárú. Az ilyen bizonyítások rendszerint nem megfelelő módon rajzolt ábrákra építenek, amelyeken egyenesek bizonyos háromszögeken vagy körökön kívül vagy belül metszeni látszanak egymást, holott a valóságban nem metszik.) Hilbert: Grundlagen der Geometrie 12 című híres könyvében, amelynek első kiadása 1899-ben jelent meg, a geometria kielégítő axiómarendszerét adta, és ugyanakkor alaposan megvizsgálta az axiómák kölcsönös függetlenségét, az axiómarendszer ellentmondásmentességét és teljes voltát. Minden axiómarendszerben lenni kell nem-definiált fogalmaknak. A geometriában ilyenek pl. a „pont” és az „egyenes”. Ezeknek a szavaknak a „ jelentése” vagy a fizikai világ tárgyaihoz való viszonya matematikai szempontból teljesen jelentéktelen. Tisztán absztrakt szimbólumoknak tekinthetők, amelyeknek matematikai tulajdonságait egy deduktív rendszerben kizárólag azok az összefüggések szabják meg, amelyeket az axiómák mondanak ki. Pl. a projektív geometriában kiindulhatunk a „pont”, „egyenes” és „illeszkedés” fogalmaiból és a következő két, egymással duális vonatkozásban levő axiómából: „Minden két ponthoz illeszkedik egy és csak egy egyenes” és „minden két egyenes egy és csak egy közös pontra illeszkedik”. Az axiomatika szemszögéből tekintve éppen az ilyen axiómák duál voltában kell keresni a projektív geometria dualitás elvének az eredetét. Minden tétel, amely állításában és bizonyításában csak duál axiómák által kapcsolt elemeket tartalmaz, dualizálható kell, hogy legyen. Az eredeti tétel bizonyítása ugyanis egyes axiómák egymás utáni alkalmazását igényli, és a duál axiómák ugyanilyen sorrendben történő alkalmazása a duáltétel bizonyításához vezet. A geometria egész axiómarendszerében található meg az olyasféle „definiálatlan” geometriai kifejezések, mint „egyenes”, „pont”, „illeszkedés” stb. implicit definíciója. Az alkalmazások szempontjából fontos, hogy a geometria fogalmai és axiómái jól megegyeznek a „valódi”, megfogható tárgyakra vonatkozó, fizikailag igazolható állításokkal. A „pont” fogalma mögött ott van fizikai realitásként az olyan pici tárgy, mint pl. a ceruzával rajzolt pont, az „egyenes” pedig lehet kifeszített fonál vagy fénysugár absztrakciója. Ezeknek a fizikai pontoknak és egyeneseknek kísérlet útján talált tulajdonságai többé-kevésbé 12
A geometria alapjai.
267
megegyeznek a geometria formális axiómáival. Elképzelhető, hogy pontosabb kísérletek esetleg az axiómák módosítását tennék szükségessé, ha azt akarnánk, hogy a geometria axiómái továbbra is kielégítően írják le a fizikai jelenségeket. De ha a formális axiómák nem egyeznek meg többé-kevésbé a fizikai tárgyak tulajdonságaival, akkor a geometria elveszítené érdekességét. Így még a formalista számára is létezik valami emberi elmétől független tekintély, amely megszabja a matematikai gondolkodás irányát. 2. Hiperbolikus nem-euklidészi geometria Van az euklidészi geometriában egy axióma, melynek „igazsága”, azaz kifeszített fonalak és fénysugarak tapasztalt viselkedésével való megegyezése, távolról sem nyilvánvaló. Ez a híres egyetlen párhuzamos posztulátuma, amely azt állítja, hogy valamely egyeneshez egy kívüle fekvő ponton keresztül egy és csak egy párhuzamos húzható. Ebben az axiómában az a figyelemre méltó, hogy az egyenes egész kiterjedéséről állít valamit, mindkét irányban a végtelenségig meghosszabbíthatónak képzelve azt; ugyanis azzal, hogy két egyenes párhuzamos, azt mondjuk ki, hogy sohasem metszik egymást, bárhogyan hosszabbítjuk is meg őket. Nem kell külön mondani, hogy egy ponton keresztül sok olyan egyenes húzható, amelyik rögzített véges távolságon belül, bármekkora is legyen az, nem metszi az adott egyenest. Mivel tényleges vonalzó, fonál vagy akár teleszkópon keresztül látható fénysugár hosszúsága bizonyosan véges, és mivel bármely véges sugarú körön belül végtelen sok egyenes húzható egy adott ponton keresztül úgy, hogy a körön belül ne messen egy adott egyenest, következik, hogy ezt az axiómát sohasem lehet igazolni a tapasztalatból. Az euklidészi geometria többi axiómája mind véges jellegű, amennyiben egyenesek véges részeire és véges kiterjedésű síkbeli alakzatokra vonatkozik. Az a tény, hogy a párhuzamossági axióma nem igazolható kísérletileg, kérdésessé teszi, vajon független-e a többi axiómától. Ha a többi axióma szükségszerű logikai következményének bizonyulna, akkor el lehetne hagyni az axiómák közül, és bizonyítani lehetne a többi euklidészi axióma segítségével. Évszázadokig próbáltak ilyen bizonyítékot találni a matematikusok, mert a geometria tanulmányozói mind érezték, hogy a párhuzamossági posztulátum jellege lényegesen különbözik a többiekétől, hiányzik belőle az a kényszerítő könnyen érthetőség, ami a geometria többi axiómáiban megvan. Az első ilyen természetű kísérlet Proklosz tól (i. sz. IV. század), Euklidész
268
kommentátorától származik, aki úgy kísérelte meg a párhuzamossági posztulátum kiküszöbölését, hogy definiálta az adott egyenessel párhuzamos egyenest mint az adott egyenestől rögzített távolságban levő pontok geometriai helyét. Nem vette észre, hogy ezáltal csak áthelyezte a nehézséget, bizonyítania kellett volna ui., hogy az ilyen pontok geometriai helye valóban egyenes. Mivel Proklosz ezt bizonyítani nem tudta, el kellett volna fogadnia posztulátumként a párhuzamossági axióma helyett, és így semmit sem nyert volna, mert mint könnyen kimutatható, a két axióma ekvivalens. A jezsuita Saccheri (1667–1733) és később Lambert (1728–1777) indirekt módon próbálták bizonyítani a párhuzamossági posztulatumot, ellenkezőjét tételezve fel, s ebből abszurd következményeket vezettek le. Következtetéseik azonban nemcsak hogy nem voltak abszurdok, ellenkezőleg, felfedezték a későbbi nem-euklidészi geometria egyes tételeit. Ha ezeket nem abszurditásoknak, hanem önellentmondás-mentes állításoknak tekintik, ők lennének a nem-euklidészi geometria felfedezői. Abban az időben azonban minden geometriai rendszert, amely nem egyezett meg tökéletesen Euklidészével, nyilvánvaló ostobaságnak tekintettek. A kor legnagyobb hatású filozófusa, Kant fogalmazta meg legkifejezőbben ezt a szemléletmódot, amikor azt mondotta, hogy Euklidész axiómái az emberi elme elválaszthatatlan tartozékai, és ezért objektív érvényességűek a „valódi” térre. Ez a hit a tiszta szemlélet világában létező euklidészi axiómák csalhatatlanságában, volt Kant filozófiájának egyik alapja. De hosszú távon sem a gondolkodás tehetetlensége, sem a filozófia tekintélye nem tudta elnyomni azt a meggyőződést, hogy a párhuzamossági posztulátum bizonyítására felhozott számtalan próbálkozás sikere nem a tehetség hiányán múlott, hanem azon a tényen, hogy a párhuzamossági posztulátum valójában független a többitől. (Ugyanígy vezetett az ötödfokú egyenlet gyökvonásokkal való megoldásának sikertelensége arra a gyanúra, hogy ilyen megoldás nem létezik, amint azt később igazolták is.) A magyar Bolyai János (1802–1860) és az orosz Lobacsevszkij (1793–1856) oldotta meg a kérdést azáltal, hogy minden részletében megkonstruált egy olyan geometriát, amelyben a párhuzamossági axióma nem érvényes. Amikor a lángeszű ifjú Bolyai első lelkesedésében elküldte művét Gaussnak, a „matematikusok fejedelmé”-nek, az annyira sóvárgott elismerés helyett azt a választ kapta, hogy maga Gauss előzte meg, csak éppen nem merte publikálni eredményeit, mert félt a nyilvánosság felháborodásától.
269
Mit jelent a párhuzamossági posztulátum függetlensége? Egyszerűen azt, hogy pontokkal, egyenesekkel stb. foglalkozó „geometriai” állítások ellentmondásmentes rendszerét lehet megszerkeszteni dedukció útján olyan axiómarendszerből, amelyben a párhuzamossági posztulátumot az ellenkezőjével helyettesítettük. Egy ilyen rendszert nevezünk nem-euklidészi geometriának. Gauss, Bolyai, Lobacsevszkij szellemi bátorságára volt szükség ahhoz, hogy felismerjék egy ilyen nem-euklidészi axiómarendszerre alapított geometria tökéletes önellentmondásmentességét. Az új geometria önellentmondásmentességének a bizonyítására azonban nem elegendő, mint Bolyai és Lobacsevszkij tette, nagy számú nem-euklidészi tételt levezetni. Meg kell szerkeszteni ezen túlmenően egy olyan geometria modelljét, amely a párhuzamossági axióma kivételével az euklidészi axiómákat mind kielégíti. A legegyszerűbb ilyen modellt Felix Klein szerkesztette, akinek ez irányú munkáját Cayley (1821–1895) angol geométer gondolatai ösztönözték. Ebben a modellben végtelen sok „egyenest” lehet húzni egy adott egyenessel „párhuzamosan” valamely, az adott egyenesen kívül fekvő ponton keresztül. Az ilyen geometriát Bolyai– Lobacsevszkij-féle geometriának vagy „hiperbolikus” geometriának nevezik. (Az utóbbi elnevezés magyarázata a 275. oldalon található.) A Klein-féle modell szerkesztésében a közönséges euklidészi geometria objektumaiból indulunk ki, azután ezen objektumok és a közöttük fennálló relációk közül néhányat átkeresztelünk oly módon, hogy nemeuklidészi geometriát kapjunk. Az így nyert geometria eo ipso éppen úgy konzisztens kell legyen, mint az eredeti euklidészi geometria, hiszen más szempontból tekintve és más szavakkal leírva nem egyéb, mint a közönséges euklidészi geometria tényeinek egy csoportja. A Klein-féle modell könnyen megérthető néhány projektív geometriai fogalom segítségével. Legyen adva egy projektív transzformáció, amely a síkot egy más síkba, vagy méginkább önmagába viszi át (amit a képsík eredeti síkkal való egybeejtésével mindig el lehet érni), ilyen transzformáció a kört és belsejét általában valamilyen kúpszeletbe viszi át. Könnyű kimutatni (a bizonyítástól itt eltekintünk), hogy a sík végtelen sokféleképpen transzformálható önmagára úgy, hogy adott kör és belseje önmagába menjen át. Ilyen transzformációk a körtartomány belsejének vagy határának a pontjait elmozdítják, de a kör belsejében levő pontok a belsejében, a határán levő pontok a határán maradnak transzformáció után is. (Természetesen a kör középpontját el lehet tolni bármely más
270
belső pontba.) Tekintsük az ilyen transzformációk összességét. Az alakzatok formáját nyilván nem hagyják változatlanul, s így közönséges értelemben vett merev mozgásról nem beszélhetünk. Most azonban, és ez eljárásunkban a döntő lépés, nevezzük a konstruálandó geometriában ezeket az elmozdulásokat „nem-euklidészi mozgások”-nak. Ezeknek a „nem-euklidészi mozgások”-nak a segítségével definiálhatjuk az egybevágóságot: két alakzatot akkor mondunk egybevágónak, ha létezik olyan nem-euklidészi mozgás, amely egyik alakzatot a másikba viszi át.
110. ábra. A nem-euklidészi geometria Klein-féle modellje A hiperbolikus geometria Klein-féle modellje eszerint a következőképpen írható le: álljon a „sík” kizárólagosan a kör belsejének pontjaiból; a külső pontokat ne tekintsük. A kör belsejének minden pontját nem-euklidészi „pont”-nak, a kör minden húrját nem-euklidészi „egyenesnek” nevezzük; a „mozgást” és „egybevágóságot” úgy definiáljuk, mint fent; „pontok” összekötése és „egyenesek” metszéspontjának meghatározása nem-euklidészi értelemben maradjon ugyanaz, mint ami az euklidészi geometriában volt. Könnyű kimutatni, hogy az új rendszer az euklidészi geometria minden posztulátumát kielégíti, az egyetlenegy párhuzamossági posztulátum kivételével. Az, hogy a párhuzamossági posztulátum ebben az új rendszerben nem érvényes, látszik abból a tényből, hogy egy „egyeneshez” egy nem rajta fekvő „ponton” keresztül végtelen sok olyan „egyenes” húzható, amelynek nincs közös pontja az adott „egyenessel”. Az adott „egyenes” a kör euklidészi értelemben vett húrja, a rajta kívül fekvő ponton áthaladó „egyenes” a kör bármelyik húrja lehet, amelyik áthalad az adott „ponton”, és nem metszi
271
az adott „egyenest” a körön belül. Ilyen egyszerű modell elegendő annak az alapvető kérdésnek az elintézésére, amely a nem-euklikészi geometria megszületésére vezetett. A modell bizonyítja, hogy a párhuzamossági posztulátum nem vezethető le az euklidészi geometria többi axiómájából. Mert ha levezethető lenne, akkor igaz tételnek kellene lennie a Klein-féle modell geometriájában, s láttuk, hogy ez nincs így. Szigorúan véve, a fenti érvelés azon a feltevésen alapul, hogy a Klein-féle modell geometriája konzisztens, úgyhogy valamely igaz tételnek nem bizonyítható be az ellenkezője is. Ezt feltételeztük, azonban nyilvánvaló, hogy a Klein-féle modell geometriája éppen olyan konzisztens, mint a közönséges euklidészi geometria, hiszen a „pontokra”, „egyenesekre” stb. vonatkozó állítások a Klein-féle modellben csupán más nyelven való kifejezései az euklidészi geometria némely tételének. Máig sem sikerült azonban kielégítően bizonyítani az euklidészi geometria axiómáinak konzisztens voltát. Az egyetlen erre a célra alkalmas eljárás, az analitikus geometria fogalmaira való visszavezetés ugyanis végső soron a számkontinuum fogalmára épül, s ennek a fogalomnak önellentmondásmentessége szintén nyitott kérdés.
111. ábra. Nem-euklidészi távolság *Említsünk meg itt egy részletet, amely túlhaladja jelen tárgyalásunk célját, ti. azt, hogy hogyan kell a Klein-féle modellben definiálni a nem-euklidészi távolságot. Ennek a „távolság”-nak invariánsnak kell lennie minden nem-euklidészi mozgás alkalmazása során; mivel a mozgásoknak távolságtartóknak kell lenniük. Tudjuk, hogy a vetítések kettősviszonytartók. Könnyen kapunk a kör belsejének két tetszőleges P és Q pontját
272
tartalmazó kettősviszonyt, ha a PQ szakaszt meghosszabbítjuk, amíg O és S pontban metszi a kört. A négy pont (O S Q P) kettősviszonya az a (pozitív) szám, amelyről azt remélhetjük, hogy a P és Q pontok közötti PQ „távolság” definíciója lehetne. Azonban ezt a definíciót kissé módosítani kell, hogy használható legyen. Ugyanis ha három, P, Q, R pont van adva az egyenesen, érvényben kell legyen a PQ + QR = PR egyenlőség. Mármost általában (O S Q P) + (O S R Q) 6= (O S R P). Érvényes azonban az (O S Q P) · (O S R Q) = (O S R P)
(1)
összefüggés, amint az látható az (O S Q P) · (O S R Q) =
RO/RS QO/QS RO/RS · = = (O S R P) PO/PS QO/QS PO/PS
egyenletekből. Az (1) egyenlet következtében megfelelő additív definíciót vezethetünk be, ha a „távolságot” nem magával a kettősviszonnyal, hanem a kettősviszony logaritmusával mérjük: PQ = P és Q nem-euklideszi távolsága = log(O S Q P). Ez a távolság pozitív szám, mivel (O S Q P) > 1, ha P 6= Q. A logaritmus alaptulajdonságából (l. 534. o.) következik (1) szerint, hogy PQ + QR = PR. Nem lényeges, milyen alapú logaritmust használunk, mivel az alap változása csupán a mértékegységet változtatja meg. Ha egyik pont, mondjuk Q, történetesen a körhöz közeledik, PQ nem-euklidészi távolság tart a végtelenhez. Látjuk tehát, hogy nem-euklidészi geometriánk egyenese éppen úgy végtelen hosszúságú, mint az euklidészi geometria egyenese, csak a hoszúságát kell nem-euklidészi távolságban mérni. Ennek ellenére közönséges euklidészi értelemben véve nem egyéb, mint egy egyenes véges hosszúságú szakasza.
273
3. Geometria és valóság Láttuk a Klein-féle modellből, hogy a hiperbolikus geometria, formális deduktív rendszerként tekintve, éppen olyan konzisztens, mint a klasszikus euklidészi geometria. Kérdezhetnénk mármost, melyik geometria írja le pontosabban a fizikai világot? Említettük már, hogy kísérlettel sohasem lehet eldönteni, hogy egy vagy végtelen sok párhuzamos húzható-e adott ponton keresztül adott egyeneshez. Az euklidészi geometriában azonban a háromszög szögeinek összege 180◦ , a hiperbolikus geometriában pedig kisebb, mint 180◦ . Gauss ezen az alapon végzett kísérletet a kérdés eldöntésére. Pontosan megmérte három egymástól távoli hegycsúcson kitűzött háromszög szögeit, s az összegüket a hibahatáron belül 180◦ -nak találta. Ha az eredmény jelentősen kisebb lett volna, mint 180◦ , ebből az következett volna, hogy a fizikai valóság leírására az euklidészinél jobban megfelel a hiperbolikus geometria. De csakhamar kiderült, hogy a kísérlet semmit sem döntött el, mert ilyen kicsiny, pár mérföld oldalhosszúságú háromszögek esetében, amilyenekkel Gauss dolgozott, a 180◦ -tól való eltérés olyan kicsiny lehet a hiperbolikus geometria esetében, hogy azt a használt műszerekkel egyáltalában nem lehetne kimutatni. Így, bár a kísérlet nem döntött el semmit, annyi azonban kétségtelenné vált, hogy az euklidészi és a hiperbolikus geometria, jóllehet nagyban annyira különböző, viszonylag kicsiny alakzatok esetében csaknem egybeesik, ugyannyira, hogy kísérletileg ekvivalensnek tekinthető. Ezért, amíg a tér tisztán lokális tulajdonságait tekintjük, a két geometria között tisztán egyszerűség és kényelem alapján választunk. Mivel az euklidészi rendszerrel lényegesen egyszerűbb dolgozni, jogos a használata mindaddig, amíg viszonylag kicsiny távolságok (néhány millió mérföld!) körén belül maradunk. Nem szabad azonban azt hinnünk, hogy az euklidészi geometria az univerzum egészének (nagyban tekintve is) szükségképpen helyes leírása lehet. A helyzet pontosan ahhoz hasonló, mint a fizikában, ahol Newton és Einstein rendszere ugyanazt az eredményt szolgáltatja kis távolság és sebesség esetére, de nagyobb távolság és sebesség esetében már eltérőt. A nem-euklidészi geometria felfedezése azért volt forradalmi tett, mert lerombolta azt a hitet, hogy Euklidész axiómái megváltoztathatatlan matematikai keretet képviselnek, amelybe bele kell illeszteni a fizikai valóságról nyert kísérleti tudásunkat.
274
4. A Poincaré-féle modell
112. ábra. A nem-euklideszi geometria Poincaré-féle modellje A matematikusnak joga van „geometriá”-nak tekinteni mindent, amit egy „pontok”-ról, „egyenesek”-ről stb. szóló konzisztens axiómarendszer definiál. A fizikus számára viszont kutatásai már csak akkor lesznek hasznosak, ha axiómái valóságos világi tárgyak fizikai viselkedésének felelnek meg. Vizsgáljuk meg ebből a szempontból annak az állításnak az értelmét, hogy „a fény egyenes vonalban terjed”. Ha ezt az állítást tekintjük az „egyenes vonal” fizikai definíciójának, akkor a geometria axiómáit úgy kell megválasztani, hogy megfeleljenek a fénysugár viselkedésének. Képzeljünk el Poincaré nyomán egy olyan világot, amely egy C kör belsejéből áll, és úgy van megalkotva, hogy a fény sebessége a körön belül minden pontban egyenlő az illető pont körtől való távolságával. Bebizonyítható13 , hogy ebben az esetben a fénysugarak a C körre merőleges körívek lesznek. Ilyen világban a (fénysugarakként definiált) „egyenesek” geometriai tulajdonságai eltérnek az egyenesek euklidészi tulajdonságaitól. Mindenekelőtt a párhuzamossági axióma válik érvénytelenné, mivel minden ponton keresztül végtelen sok olyan „egyenes” húzható, amely nem metsz egy adott „egyenest”. Természetesen, a Poincaré-féle világ „pontjai”-nak és „egyenesei”-nek pontosan olyan tulajdonságai lesznek, mint a Klein-féle modell „pontjai”-nak és „egyenesei”-nek. Azaz a Poincaré-világ másik modell a hiperbolikus geometriára. De alkalmazható erre a világra az euklidészi geometria is, ha a 13
Ennek az a feltételezésnek az alapja, hogy a fénysugár mindig a legrövidebb idő alatt megtehető utat választja két pont között.
275
fénysugarakat nem-euklidészi „egyenesek” helyett C-re merőleges euklidészi köröknek tekintjük. Látjuk tehát, hogy különböző geometriai rendszerek írhatják le ugyanazt a fizikai helyzetet, feltéve, hogy a fizikai dolgokat (ebben az esetben a fénysugarakat) a két rendszer különböző fogalmainak feleltetjük meg: fénysugár → „egyenes”
– hiperbolikus geometria,
fénysugár → „kör”
– euklidészi geometria.
Mivel a homogén közegben terjedő fénysugárnak az euklidészi geometriában az egyenes fogalma felel meg, azt mondhatnank, hogy a C kör belsejében hiperbolikus a geometriája, ami alatt mindössze azt értenénk, hogy a fénysugarak fizikai tulajdonságai ebben a világban a hiperbolikus geometriába tartozó „egyenesek” tulajdonságainak felelnek meg. 5. Elliptikus vagy Riemann-féle geometria
113. ábra. „Egyenesek” a Riemann-geometriában Az euklidészi geometriában éppen úgy, mint a hiperbolikus Bolyai–Lobacsevszkijféle geometriában hallgatólagosan feltettük, hogy az egyenes végtelen (az egyenes végtelen kiterjedése végeredményben a „rendezés” fogalmával és axiómáival függ össze). Miután a hiperbolikus geometria szabaddá tette az utat a geometriák konstruálása előtt, természetesen kutatni kezdték, konstruálhatók-e olyan nem-euklidészi geometriák, amelyekben az egyenes nem végtelen, hanem véges és zárt. Az ilyen geometriákban
276
azonban nemcsak a párhuzamossági axiómát, hanem a „rendezés” axiómáit is el kell hagyni. Az újabb kutatások felfedezték ezeknek a geometriáknak fizikai fontosságát. Ilyen természetű geometriákat Riemann tárgyalt először, habilitációs előadásában 1851-ben, amikor fizetés nélküli instruktor („magántanár”) lett a göttingai egyetemen. Teljesen konzisztens módon szerkeszthetők olyan geometriák, amelyekben az „egyenesek” zárt véges vonalak. Képzeljük el azt a kétdimenziós világot, amelyik egy gömb S felszínéből áll. Definiáljuk ebben a világban „egyenesként” a gömb legnagyobb köreit. Ez lenne a legtermészetesebb leírása a tengerész világának, mert a legnagyobb körök ívei azok a görbék, amelyek legrövidebben kötik össze a gömbfelület két pontját, s éppen ez a síkon az egyenes jellegzetes tulajdonsága. Az ilyen világban két „egyenes” mindig metszi egymást, úgyhogy egyetlen egy párhuzamos (azaz nem metsző egyenes) sem húzható adott „egyeneshez” valamely rajta kívül fekvő ponton keresztül. Ebben a világban „elliptikus geometriá”-nak nevezzük az „egyenesek” geometriáját. Ebben a világban két pont távolságát egyszerűen a két pontot összekötő legnagyobb gömbi kör rövidebb körívével mérjük. A szögeket úgy mérjük, mint az euklidészi geometriában. Általában tipikusnak tekintjük az elliptikus geometriára, hogy nem léteznek benne párhuzamosak.
114. ábra. Elliptikus pont Riemann nyomán a következőképpen lehet általánosítani ezt a geometriát. Tekintsünk a térben egy görbült felületből álló világot, a görbült felületnek nem kell szükségképpen gömbnek lennie. Definiáljuk a felület „egyeneseit” két tetszőleges pontját legrövidebben összekötő „geodetikus vonal”-ként. A felület pontjait két osztályba lehet osztani: – 1. olyan pontok, melyek környezetében a felület a gömbhöz hasonlóan viselkedik, azaz teljesen az e pontban érintő sík egyik oldalán fekszik. 2. Olyan pontok, melyek környeze-
277
115. ábra. Hiperbolikus pont tében a felület nyereg alakú, a felületet e pontban érintő síknak mindkét oldalán fekszik. Az első csoportba tartozó pontokat a felület elliptikus pontjainak nevezzük, mivel ha az érintősíkot önmagával párhuzamosan eltoljuk egy kicsiny távolsággal, elliptikus görbében metszi a felületet. A második csoportba tartozó pontokat hiperbolikus pontoknak nevezzük, mivel az érintősíkot önmagával párhuzamosan eltolva kis távolsággal, hiperbolához hasonló alakú görbében metszi a felületet. A geodetikus „egyenesek” geometriája a felület egy pontja környezetében aszerint elliptikus vagy hiperbolikus, hogy a pont elliptikus vagy hiperbolikus pont-e. A nem-euklidészi geometria ilyen modelljében a szögeket közönséges euklidészi értékük méri. Az ötletet Riemann dolgozta ki, aki a tér geometriáját hasonlónak tekintette a felület most említett geometriájához, amennyiben a tér „görbülete” éppen úgy változtathatja jellegét pontról pontra. A Riemann-geometriában a geodetikus vonalak az „egyenesek”. Einstein általános relativitás-elméletében a tér geometriája Riemann-geometria, a fény geodetikus vonalak mentén terjed, és a tér görbületét a kitöltő anyag természete határozza meg. A nem-euklidészi geometria az axiómarendszer vizsgálatából indult ki, s a fizikai világ megismerésének egyik legfontosabb eszköze lett. A relativitás-elméletben, az optikában, a hullámmozgás általános elméletében a jelenségek nem-euklidészi leírása gyakran sokkal megfelelőbb, mint az euklidészi.
278
Függelék: *Több dimenziós terek geometriája 1. Bevezetés A „valóságos tér”, azaz fizikai tapasztalataink közege, háromdimenziós, a síknak két dimenziója van, az egyenesnek egy. Térszemléletünk, közönséges értelemben véve, határozottan három dimenzióhoz kötött. Mégis sokszor kényelmes négy- vagy még több dimenziójú „terek”-ről beszélni. Mi az értelme valamely n dimenziós térnek, ha n nagyobb, mint három, s mire lehet használni? Analitikus és tisztán geometriai úton egyaránt választ kaphatunk ezekre a kérdésekre. Az n dimenziós tér terminológiáját a közönséges geometriai szemlélet számára már nem hozzáférhető matematikai gondolatok kifejezésére szolgáló szuggesztív nyelvnek kell tekinteni. Jelezzük röviden azokat az egyszerű megfontolásokat, amelyek ezt a nyelvet indokolják, és használatát jogossá teszik. 2. Analitikus eljárás Utaltunk már arra a jelentésbeli fordulatra, amely az analitikus geometria fejlődése során bekövetkezett. Kezdetben a pontokat, egyeneseket, görbéket stb. tisztán „geometriai” természetű dolgoknak tekintették, s az analitikus geometria feladatát pusztán abban látták, hogy egyenleteket rendeljen hozzájuk vagy számok rendszerét, s hogy a geometriai elméletet algebrai és analitikus módszerek segítségével interpretálja és fejlessze. Lassan azonban az ellentétes álláspont erősödött meg és vált uralkodóvá. Valamely x számot vagy egy x, y számpárt, vagy egy x, y, z számhármast tekintettek alapobjektumoknak, s ezeket az analitikai természetű dolgokat szemléltették azután pontként egyenesen, a síkon vagy a térben. Ebből a szempontból a geometriai nyelv csupán számok közötti vonatkozások kifejezésére szolgál. Teljesen eltekinthetünk a geometriai objektumok primér vagy akár önálló jellegétől is azt mondván, hogy az x, y számpár maga a sík pontja, vagy azt, hogy az összes x, y számpárok halmaza, amelyek kielégítik az L(x, y) = ax + by + c = 0 egyenletet, ahol a, b, c meghatározott számok, maga az egyenes stb. Hasonló definíciókat lehet bevezetni a háromdimenziós térben. Még ha elsősorban valamely algebrai probléma iránt érdeklődünk, akkor is előfordulhat, hogy a geometria nyelve a legegyszerűbb a probléma megfelelő tárgyalására, és a
279
geometriai szemlélet mutatja meg a megfelelő algebrai megoldásmód útját. Pl., ha egy három lineáris egyenletből álló L(x, y, z) = ax + by + cz + d = 0 L 0 (x, y, z) = a 0 x + b 0 y + c 0 z + d 0 = 0 L 00 (x, y, z) = a 00 x + b 00 y + c 00 z + d 00 = 0 egyenletrendszert akarunk megoldani x, y, z ismeretlenekre, úgy szemléltethetjük a problémát a háromdimenziós térben – amit R3 -mal jelölünk –, hogy megkeressük az L = 0, L 0 = 0, L 00 = 0 egyenletek által definiált síkok metszéspontját. Ha pedig csak azon x, y számpárokat tekintjük, amelyre x > 0, ezeket úgy szemléltethetjük, mint az x-tengelytől jobbra levő félsíkot. Általánosabban, azon x, y számpárok összessége, amelyekre L(x, y) = ax + by + d > 0, felfogható az L = 0 egyenes egyik oldalán levő félsíkként, és azoknak az x, y, z számhármasoknak az összessége, amelyekre L(x, y) = ax + by + cz + d > 0, felfogható, mint az L(x, y, z) = 0 sík egyik oldalán elterülő „féltér”. „Négydimenziós”, vagy akár „n dimenziós” terek bevezetése ezek után egészen természetesen adódik. Tekintsünk egy x, y, z, t számnégyest. Azt mondjuk, hogy egy ilyen számnégyes a négydimenziós tér, az R4 egy pontját reprezentálja, vagy egyszerűbben azt, hogy ez a számnégyes az R4 egy pontja. Általánosabban, az n dimenziós tér, az Rn egy pontját egyszerűen n valós szám, x1 , x2 , . . . , xn rendezett halmazaként definiálhatjuk. Semmit sem számít, hogy ilyen pontot képtelenek vagyunk elképzelni. A geometriai nyelv azért továbbra is éppen olyan szuggesztív marad az n változót igénylő algebrai tulajdonságok kifejezésére. Ennek az az oka, hogy a lineáris egyenletek és más algebrai képződmények sok algebrai tulajdonsága lényegében független a bennük szereplő ismeretlenek számától vagy, ahogy geometriai nyelven mondhatjuk, a változók
280
terének dimenziójától. Így pl. „hipersík”-nak nevezhetjük az n dimenziós tér, az Rn azon x1 , x2 , . . . , xn szám n-esekből álló pontjainak az összességét, amelyek kielégítik az L(x1 , x2 , . . . , xn ) = a1 x1 + a2 x2 + . . . + an xn + b = 0 lineáris egyenletet. Akkor az n lineáris egyenletből álló n ismeretlenű L1 (x1 , x2 , . . . , xn ) = 0 L2 (x1 , x2 , . . . , xn ) = 0 ····················· Ln (x1 , x2 , . . . , xn ) = 0 egyenletrendszer megoldásának alapvető algebrai problémája geometriai nyelven úgy fejezhető ki, hogy meg kell keresni az n számú L1 = 0, L2 = 0, . . ., Ln = 0 hipersík metszéspontját. Ennek a geometriai kifejezési módnak azonban csupán az az előnye, hogy hangsúlyozza azokat az algebrai sajátságokat, amelyek függetlenek n-től és n 5 3 esetében szemléletesen elképzelhetők. Ilyen kifejezési mód használata sokszor előnyös az alkalmazásokban, mert megkönnyíti, megrövidíti és irányítja az önmagukban véve analitikus természetű megfontolásokat. Példaként említhetjük a relativitáselméletet, amelynek fejlődésében nagyon fontos kiindulópont volt az x, y, z térkoordináták és a t időkoordináta „eseménnyé” való egyesítése az x, y, z, t számnégyesek sokaságából álló „téridő”-ben. Nem-euklidészi hiperbolikus geometriát vezetve be, ebben az analitikus vonatkoztatási rendszerben sok nagyon bonyolult helyzetet sikerült feltűnően egyszerűen leírni. Hasonló előnyökre sok példát hozhatunk a mechanikából vagy a statisztikus fizikából, vagy akár magából a tiszta matematikából is. Íme néhány matematikai példa. A sík összes köreinek halmaza háromdimenziós sokaságot alkot, mert az x, y középpontú és t sugarú kör pontként reprezentálható, amelynek x, y, t a koordinátái. Mivel a körök sugara pozitív szám, a köröket reprezentáló pontok összessége éppen egy félteret tölt be. Ugyanígy a közönséges háromdimenziós tér összes gömbjeinek a halmaza négydimenziós sokaságot alkot, mivel mindegyik x, y, z középpontú és t sugarú gömb x, y, z, t koordinátájú pontként ábrázolható a
281
négydimenziós térben. A háromdimenziós tér azon kockáját, melynek élhosszúsága 2 egység, oldallapjai a koordinátasíkokkal párhuzamosak, középpontja pedig a koordinátarendszer kezdőpontja, azon x1 , x2 , x3 számhármasokból álló pontok összességeként foghatjuk fel, amelyekre |x1 | 5 1, |x2 | 5 1, |x3 | 5 1. Ennek mintájára az n dimenziós tér, az Rn , 2 egység élhosszúságú „kockáját”, melynek oldallapjai a koordinátasíkokkal párhuzamosak, és középpontja a koordináta-rendszer kezdőpontja, azon x1 , x2 , . . ., xn szám n-esekből álló pontok összességeként definiálhatjuk, amelyekre egyszerre igaz, hogy |x1 | 5 1, |x2 | 5 1, . . . , |xn | 5 1. Ezen kocka „felszíne” azon pontok összességéből áll, amelyekre legalább egy koordinátájuk esetében az egyenlőségjel érvényes. Az n − 2 dimenziós felületelemek pedig azon pontok, melyeknek legalább két koordinátájára érvényes az egyenlőségjel, és így tovább. Feladat: Írjuk le egy ilyen kocka felületét három, négy és n dimenzió esetében.
*3. Geometriai vagy kombinatorikus eljárás Noha az n dimenziós geometria analitikus meghatározása egyszerű, és a legtöbb alkalmazásban jól használható, mégis érdemes megemlíteni, hogy a több dimenziós geometria egy másik, tisztán geometriai jellegű eljárás segítségével is megadható. Ez az eljárás az n dimenziós adatok (n − 1) dimenziós adatokra való visszavezetéséből áll, s így matematikai indukció útján képesek vagyunk több dimenziójú geometria definiálására is. Induljunk ki egy két dimenzióban definiált ABC háromszöget határoló háromszögvonalból. Ezt a zárt sokszögvonalat C pontban felvágva, AC és BC egyeneseket AB egyenesbe forgatva, mint ahogy azt a 116. ábra mutatja, egy egyszerű egyenest kapunk, amelyen a C pont kétszer szerepel. Ez az egydimenziós alakzat tökéletesen reprezentálja a kétdimenziós háromszöget határoló sokszögvonalat. AC és BC szakaszokat a síkban összehajtva, újból fedésbe hozhatjuk a két C pontot. Azonban – s az egészben ez a lényeges – nem kell ezt az összehajtást a két C pont egyesítése kedvéért valóban végrehajtanunk. Csupán abban kell megegyeznünk, hogy a 116. ábrán a két C pontot „azonosítjuk”, azaz nem teszünk köztük különbséget, jóllehet mint közönséges értelemben
282
116. ábra. A háromszög definiálása identifikált végpontú szakaszokkal vett geometriai dolgok, valójában egyáltalán nem esnek egybe. Még egy lépéssel továbbmehetünk és szétválaszthatjuk A és B pontoknál a három érintkező szakaszt három különálló CA, AB, BC szakaszra, amelyeket azután ismét össze lehet rakni a „valódi” háromszöggé, egybeejtve az azonosított pontpárokat. Ez az ötlet, különálló szakaszok sokszögvonallá való egyesítése, különböző pontok azonosításának, identifikálásának az útján (mint azt most a háromszög esetében tettük), néha nagyon jól alkalmazható a gyakorlatban. Pl., ha egy acélrudakból álló bonyolult vázszerkezetet kell behajózni, mondjuk egy híd vázát, akkor a rudakat szétszedve egyenként lehet elcsomagolni, azonos jellel tüntetve fel a váz térbeli helyzetében összekötendő végpontokat. A jellel ellátott rudak rendszere tökéletesen ekvivalens a térbeli szerkezettel. Ez a példa sejteti, hogyan kell a háromdimenziós térben egy poliédert alacsonyabb dimenziójú alakzatra redukálni. Tekintsük pl. a kocka felszínét (117. ábra). Ez azonnal redukálható hat négyzet alakú síkdarabra, amelyeknek határoló szakaszait megfelelőképpen azonosítottuk, egy második lépésben azután tizenkét szakaszra redukálható, a szakaszok végpontjait megint megfelelőképpen azonosítva. Általánosságban, a háromdimenziós tér, az R3 , bármely poliédere redukálható ilyen módon vagy sokszöglapok, vagy pedig egyenes szakaszok rendszerére. Feladat: Hajtsuk végre ezt a redukciót az összes szabályos test (l. 289. o.) esetében.
Nyilvánvaló, hogy okoskodásunkat megfordíthatjuk. Definiálhatunk a síkban sokszöget szakaszokkal és az R3 -ban poliédert R2 -beli sokszöglapok rendszerével, vagy
283
117. ábra. A kocka definiálása csúcsok és élek identifikálásával továbbmenve a redukcióval, megintcsak szakaszok valamilyen rendszerével. Természetes módon kínálkozik tehát, hogy a négydimenziós tér, az R4 , egy „poliéderét” kétdimenziós lapjaiknál megfelelőképpen azonosított R3 -beli poliéderek valamely rendszerével definiáljuk; az R5 valamely poliéderét R4 -beli poliéderek rendszerével, és így tovább. Végül az Rn minden poliéderét szakaszok rendszerére redukálhatjuk. Nem ismertethetjük itt bővebben az elméletet. Csupán néhány megjegyzés következik, bizonyítás nélkül. Az R4 kockáját 8 háromdimenziós kocka határolja, mindegyik azonosítva egy „szomszédjával” egy kétdimenziós lapja mentén. Az R4 -ben a kockának 16 csúcsa van, mindegyik csúcsban négy fut össze a kocka 32 éléből. Az R4 -ben hat szabályos test van. A „kockán” kívül van egy szabályos test, amit 5 szabályos tetraéder határol, egy, amit 16 tetraéder határol, egy, amit 24 oktaéder, egy, amit 120 dodekaéder és egy, amit 600 tetraéder határol. Ha a tér dimenziója n > 4, akkor – amint azt bebizonyították – csak 3 szabályos test lehetséges: egy n + 1 csúcsú, amit n + 1 Rn−1 -beli poliéder határol, mindegyik poliédernek n számú (n − 2) dimenziós oldala van; továbbá egy 2n csúcsú szabályos test, amelyet 2n számú 2n − 2 oldalú Rn−1 -beli poliéder határol; meg egy 2n
284
csúcsú, amelyet az Rn−1 2n számú n oldalú poliédere határol. Feladat: Hasonlítsuk össze az R4 -beli kocka 2. pontban adott definícióját ebben a pontban adott definíciójával, és mutassuk meg, hogy a kocka felszínének a 2. pontban adott „analitikus” definíciója ekvivalens ebben a pontban adott „kombinatorikus” definíciójával.
Ebből a strukturális vagy „kombinatorikus” szempontból tekintve a 0, 1, 2, 3 dimenziós terek legegyszerűbb geometriai idomai sorra a pont, az egyenes szakasz, a háromszög és a tetraéder. Jelöljük ezeket az alakzatokat az egyöntetűség kedvéért T0 , T1 , T2 és T3 jelekkel. (Az indexek a dimenziószámot jelölik.) Mindegyik alakzat struktúráját kifejezi az az állítás, hogy mindegyik Tn n + 1 csúcsú, és hogy egy Tn bármely i + 1 számú (i = 0, 1, . . ., n) csúcsa egy Ti -t határoz meg. Pl. T3 , azaz a háromdimenziós tetraéder, 4 csúcsot, 6 egyenes szakaszt és 4 háromszöget tartalmaz.
118. ábra. Az 1-, 2-, 3-, 4-dimenziós tér legegyszerűbb térelemei (ún. szimplexei) Nyilvánvaló, hogyan kell tovább haladni. T4 -et, azaz a négydimenziós „tetraédert”, úgy kell öt csúcs megadásával definiálni, hogy az ötből négy csúcs mindig egy T3 -at határozzon meg, három mindig egy T2 -t, és így tovább. T4 vázlatos diagramja a 118. ábrán látható. Látjuk, hogy T4 5 csúcsot, 10 egyenes szakaszt, 10 háromszöget és 5 tetraédert tartalmaz. Az általánosítás n dimenzióra közvetlenül adódik. Tudjuk a kombinatorikából, hogy r adott elemből kiválasztott i elemet tartalmazó együttesek száma pontosan Cri =
r! . i!(r − i)!
285
Tehát egy n dimenziós tetraéderben van C1n+1 = n + 1
csúcs
(T0 ),
C2n+1 =
(n + 1)! 2!(n − 1)!
egyenes szakasz
(T1 ),
C3n+1 =
(n + 1)! 3!(n − 2)!
háromszög
(T2 ),
C4n+1 =
(n + 1)! 4!(n − 3)!
tetraéder
(T3 ),
············ n+1 Cn+1 =1
(Tn ).
Feladat: Rajzoljuk meg T5 diagramját és határozzuk meg a benne foglalt különböző Ti -k számát i = 0, 1, . . ., 5 esetére.
286
V. fejezet. Topológia Bevezetés A XIX. század közepén új irány indult el a geometriában, s csakhamar a modern matematika egyik hajtóereje lett. Ez az új irány, amelyet analysis situs-nak vagy topológiának neveznek, geometriai alakzatok olyan tulajdonságaival foglalkozik, melyek még akkor is megmaradnak, ha az alakzatokat olyan durva torzításoknak vetjük alá, hogy minden metrikus és projektív tulajdonságukat elveszítik. A. F. Moebius (1790–1868), kora egyik legnagyobb geométere, akit szerénysége arra kárhoztatott, hogy jelentéktelen csillagászként éljen Németország egyik másodrendű csillagvizsgálójában, hatvannyolc éves korában egy értekezést küldött be a Francia Akadémiának az „egyoldalú” felületekről. Ez az értekezés ennek az újfajta geometriának néhány legmeglepőbb tényét tartalmazta. Hasonlóan annyi más régebbi fontos felfedezéshez, ez az értekezés is évekig hevert az Akadémia valamelyik fiókjában, míg végül aztán maga a szerző publikálta. Hasonló felfedezésre jutott, Moebius-tól függetlenül, J. B. Listing (1808–1882) göttingai csillagász, és eredményeit 1847-ben Gauss javaslatára egy kis könyvben közölte, melynek címe Vorstudien zur Topologie (Előtanulmányok a topológiához) volt. Mikor Bernhard Riemann (1826–1866) a göttingai egyetemre került diáknak, azt találta, hogy a városka egyeteme telítve volt ezek iránt az új, különös geometriai eszmék iránti érdeklődéssel. Csakhamar felismerte, hogy itt kell keresni a kulcsot a komplex változós analitikus függvények mélyebb megértéséhez. Talán semmi sem mozdította annyira elő a topológia későbbi fejlődését, mint Riemann függvénytanának nagyszerű struktúrája, amelyben a topológiai fogalmak abszolút alapvetőek. Az új terület módszereinek újdonsága miatt a matematikusoknak eleinte nem volt idejük arra, hogy eredményeiket az elemi geometria tradicionális posztulációs köntösébe öltöztessék. A nagy úttörők, mint pl. Poincaré, elsősorban a geometriai szemléletre bízták magukat. Még ma is azt érzi, aki elmélyed a topológiában, hogy ha túlságosan ragaszkodik
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526104152+02’00’
287
az előadásmód szigorához, könnyen szem elől veszítheti a formális részletek tömegében a geometriai lényeget. Mégis nagy érdeme az újabb munkáknak, hogy a topológiát a szigorú matematika keretei közé szorították, ahol az intuíció az igazság forrása, de nem végső igazolása. Ezt a törekvést L. E. J. Brouwer munkái indították el, s a topológia fontossága fejlődésével párhuzamosan a matematika csaknem minden ágában erősen megnőtt. Fontos szerepük volt a topológia fejlesztésében amerikai matematikusoknak. Elsősorban O. Veblen, J. W. Alexander és S. Lefschetz nevét kell ezzel kapcsolatban megemlíteni.1 Jóllehet a topológia rendszeres fejlődése alig százéves, van néhány idetartozó korábbi felfedezés, amit később beillesztettek a szisztematikus felépítésbe. Messze legfontosabb ezek közül az a formula, amely egy egyszerű poliéder csúcsainak, éleinek és lapjainak a száma közötti összefüggést fejezi ki. Már Descartes felismerte 1640-ben, s azután Euler 1752-ben újra felfedezte, s rendszeresen alkalmazta. Azt, hogy ez az összefüggés tipikusan topologikus jellegű, sokkal később ismerték fel, Poincaré vette észre, hogy „Euler képlete” és általánosításai a topológia egyik központi tételét alkotják. Így történeti és matematikai okokból egyaránt, Euler képletével kezdjük a topológia tárgyalását. Mivel a tökéletes szigorúság ideálja sem nem szükséges, sem nem kívánatos akkor, ha valaki egy addig ismeretlen területen teszi meg első lépéseit, nem restellünk majd időnként az olvasó geometriai szemléletére hivatkozni.
1. § Euler poliéder tétele Noha a poliéderek tanulmányozásának fontos szerepe volt a görögök geometriai gondolkozásában, mégis csak Descartes és Euler fedezték fel a következő tényt: jelentse V egy egyszerű poliéder csúcsainak számát, E az éleinek számát és F az oldallapjainak számát; akkor minden esetben érvényes, hogy V − E + F = 2.
(1)
Poliéder az olyan test, melynek felülete sokszögtartományokból áll. Szabályos testek esetében a határoló sokszögtartományok egybevágóak, és a csúcsoknál levő szögek mind 1
A topológia későbbi fejlődésében igen fontos a szovjet topológiai iskola szerepe, különösen P. Sz. Alekszandrov és L. Sz. Pontrjagin munkássága. (Ford.)
288
egyenlőek. A poliéder egyszerű, ha nincsenek benne „lyukak”, azaz ha felülete folytonos deformációval gömbfelületté alakítható át. A 120. ábrán látható egyszerű poliéder, amely azonban nem szabályos test, a 121. ábrán pedig olyan poliéder, amely nem egyszerű.
119. ábra. Szabályos testek Feladatképpen ellenőrizzük azt az állítást, hogy Euler képlete érvényes a 119. és 120. ábrán közölt egyszerű poliéderekre, de nem érvényes a 121. ábrán közölt poliéderre. Euler képletének igazolására, képzeljük az adott egyszerű poliédert üresnek, s a felületét vékony gumiból levőnek. Ha az üres poliéder oldallapjai közül kivágunk egyet, akkor a megmaradó felületet valamilyen deformációval kinyújtóztathatjuk a síkra. Természetesen a poliéder oldallapjainak a területe és az élei közötti szögek eközben megváltoznak. Azonban a csúcsok és élek hálója a síkon ugyanannyi számú csúcsot és élt fog tartalmazni, mint amennyit az eredeti poliéder tartalmazott, a sokszögek száma pedig eggyel kisebb lesz, mint az eredeti poliéderen volt, hiszen egy oldallapot eltávolítottunk. Kimutatjuk, hogy erre a síkhálóra V − E + F = 1, s ha hozzászámoljuk az eltávolított oldallapot, V − E + F = 2 érvényes az eredeti poliéderre.
289
120. ábra. Egyszerű poliéder V − E + F = 9 − 18 + 11 = 2 Először is a síkhálóban „háromszögelést” vezetünk be a következőképpen: A háló valamelyik sokszögében, amelyik eredetileg nem háromszög, húzunk egy átlót. Ezáltal E és F egyaránt 1-gyel nőtt, úgyhogy V − E + F értéke nem változott. Folytassuk pontpárok összekötésével az átlóhúzást (122. ábra), amíg az alakzat csupa háromszögekből áll, aminek végül mindig be kell következni. A háromszögelt hálóban V − E + F értéke ugyanaz kell legyen, mint a háromszögelés előtt volt, hiszen az átlók húzása ezt az értéket nem változtatta meg. Vannak háromszögek, melyeknek oldala a síkháló határán van. Van ezek között, mint pl. az ábrán ABC, amelyeknek csak egy oldaluk van a háló határán, de van olyan, amelyeknek kettő. Vegyük az összes határon fekvő háromszöget, és mindből távolítsuk el azt az élet, amely nem tartozik egy másik háromszöghöz is. Így pl. ABC háromszögből eltávolítjuk AC élet, az egész háromszöglapot úgy, hogy csak A, B, C csúcs és AB meg BC él marad meg belőle; DEF háromszögből eltávolítjuk a lapot, DF és FE élet meg F csúcsot. Az ABC típusú háromszög eltávolítása eggyel-eggyel csökkenti E és F értékét, V értékét nem változtatja meg, úgyhogy V − E + F értéke nem változik. DEF típusú háromszög eltávolítása 1-gyel csökkenti V, 2-vel E és 1-gyel F értékét, tehát V − E + F újból változatlan marad. A leírt műveletek megfelelően választott sorozatával minden olyan háromszöget el lehet távolítani, melynek oldala a határon fekszik (s amelyek minden eltávolítás után mások és mások lesznek), míg végül egyetlen
290
121. ábra. Nem egyszerű poliéder V − E + F = 16 − 32 + 16 = 0 egy háromszög marad, három oldalával, három csúcsával, egy lapjával. Erre az egyszerű hálóra V − E + F = 3 − 3 + 1 = 1. Láttuk azonban, hogy a háromszögek egymás utáni elhagyása nem változtatta meg V − E + F értékét. Tehát V − E + F értékének az eredeti hálóban is 1-nek kell lennie, és így 1-nek kell lennie az egylaphíjas poliéderre is. Tehát a hiánytalan poliéderre V − E + F = 2. Ezzel Euler tételét bebizonyítottuk. (Lásd az (56) és (57) feladatot a 644. oldalon.) Euler tétele alapján könnyű kimutatni, hogy nem létezhet ötnél több szabályos test. Legyen ugyanis egy F oldallapú szabályos testünk, legyen mindegyik oldallap n oldalú szabályos sokszög, és mindegyik csúcsban r él fusson össze. Az éleket az oldallapok és a csúcsok szerint összeszámlálva látjuk, hogy nF = 2E;
(2)
291
122. ábra. Euler tételének bizonyítása mivel minden él két oldallaphoz tartozik, és így az nF szorzatban kétszer számoltuk; továbbá látjuk, hogy rV = 2E,
(3)
mivel minden élnek két csúcsa van. Tehát az (1)-ből 2E 2E + −E=2 n r egyenletet kapjuk, vagyis 1 1 1 1 + = + . n r 2 E
(4)
Kezdjünk n = 3 és r = 3 értékkel, hiszen bármely sokszögnek legalább három oldala kell legyen, és minden térszögben legalább három élnek kell összefutni. Azonban n és r egyszerre nem lehet nagyobb, mint három, mivel akkor a (4) egyenlet baloldala nem haladhatná meg 12 -et, s ez E bármely pozitív értékénél lehetetlen. Lássuk tehát, milyen értékeket vehet fel r, ha n = 3, és milyen értékeket vehet fel n, ha r = 3. Ez által a két eset által megszabott lehetőségek adják meg a lehetséges szabályos testek számát.
292
n = 3 esetében (4) egyenlet 1 1 1 − = r 6 E alakú, tehát r lehet 3, 4 vagy 5. (Nyilvánvalóan nem lehet 6 vagy 6-nál nagyobb szám, hiszen 1/E mindig pozitív.) n és r ezen értékeire E = 6, 12 vagy 30, a tetraédernek, az oktaédernek és az ikozaédernek megfelelően. Ugyanígy, r = 3 esetére 1 1 1 − = n 6 E egyenlet érvényes, s ebből következik, hogy n = 3, 4, vagy 5 és E = 6, 12, vagy 30. Ezek az értékek sorra a tetraédernek, kockának és dodekaédernek felelnek meg. Behelyettesítve n, r és E most kapott értékeit a (2) és (2) egyenletekbe, megkapjuk az egyes poliéderek csúcs- és oldalszámát.
2. § Az alakzatok topologikus tulajdonságai 1. Topologikus tulajdonságok Egyszerű poliéderek esetében bebizonyítottuk Euler képletének érvényességét. A képlet érvényessége azonban nem korlátozódik az elemi geometria sík lapokkal és egyenes élekkel határolt poliédereire. A közölt bizonyítás éppen úgy alkalmazható akkor is, ha az egyszerű poliéder oldallapjai tetszőleges felületek és élei tetszőleges görbék, vagy görbe ívekkel határolt tartományokra osztott gömbfelületek. Sőt akár akkor is, ha a vékony gumihártyából képzelt poliéder vagy gömbfelületet tetszőlegesen deformáljuk, mindaddig, amíg a gumi el nem szakad deformálás közben. A formula ugyanis kizárólagosan a csúcsok, élek és oldallapok számára vonatkozik, semmi köze sincs a hosszúsághoz, területhez, egyenességhez, kettősviszonyhoz, vagy az elemi és a projektív geometria bármelyik megszokott fogalmához. Emlékeztetünk rá, hogy az elemi geometria olyan nagyságokkal (hosszúság, szög, terület) foglalkozik, amelyeket a merev mozgások nem változtatnak meg, a projektív geometria pedig azokkal a fogalmakkal (pont, egyenes, illeszkedés, kettősviszony), amelyek a projektív transzformációk még nagyobb csoportjában is invariánsok. Azonban merev mozgások és projektív transzformációk csak speciális esetei az ún. topologikus
293
transzformációknak. Valamely A geometriai alakzat topologikus transzformációját egy másik A 0 alakzatra az A és A 0 alakzat p és p 0 pontjai közötti olyan p → p0 leképezés adja meg, amelynek a következő két tulajdonsága van: 1. A leképezés kölcsönösen egyértelmű. Ez azt jelenti, hogy A minden p pontjának A 0 egy és csak egy p 0 pontja felel meg, és megfordítva. 2. A leképezés mindkét irányban folytonos. Ez azt jelenti, hogy ha veszünk A-n két tetszőleges p és q pontot, és p-t úgy mozgatjuk, hogy a p és q közötti távolság nulla értékhez tartson, akkor A 0 alakzat megfelelő p 0 és q 0 pontjai közötti távolság is nulla értékhez tart, és megfordítva. A geometriai alakzat minden tulajdonságát, amely tulajdonsága egy A-ból valamilyen topologikus transzformációval előállított másik alakzatnak is, A topologikus tulajdonságának nevezzük. A topológia pedig a geometriának az az ága, amely az alakzatok topologikus tulajdonságait tanulmányozza. Képzeljünk el egy gondos, de ügyetlen rajzolót, aki szabadkézzel másol alakzatokat, egyeneseket görbékké torzítva s szögeket, távolságokat és területeket megváltoztatva: bár az eredeti ábra metrikus és projektív tulajdonságai elvesznek, topologikus tulajdonságai nem változnak. Az általános topologikus transzformációkra legszemléletesebb példa a deformáció, a torzítás. Képzeljünk el egy alakzatot, pl. egy gömböt, vékony gumihártyából vagy egy háromszöget, vékony gumihártyára rajzolva. Nyújtsuk s csavarjuk most a gumihártyát tetszőleges módon, de ne szakítsuk el és ne engedjük meg, hogy két különböző pontja összeessen. (Különböző pontok egybeejtése megsértené az 1. feltételt. A gumihártya elszakítása megsértené a 2. feltételt, mert két pont a szakítási vonal két oldalán, melyek az eredeti alakzaton egymáshoz tartottak, a szakítás után nem lennének többé egybeejthetők.) Az alakzat végső helyzete akkor az eredeti alakzat valamely topologikus képe lesz. Háromszöget pl. bármely más háromszöggé, körré vagy ellipszissé lehet torzítani, s így ezeknek az alakzatoknak azonosak a topologikus sajátságaik. De nem lehet a kört pl. egyenesszakasszá deformálni, torzítani, se a gömbfelületet egy biciklibelső felületévé. A topologikus transzformáció általános fogalma bővebb, mint a torzítás fogalma. Pl.,
294
123. ábra. Topológiailag ekvivalens felületek
124. ábra. Topológiailag nem ekvivalens felületek ha egy alakzatot torzítás közben szétvágunk, és a vágott széleket torzítás után pontosan úgy varrjuk össze, mint ahogy eredetileg voltak, az eljárás még mindig az eredeti alakzat egy topologikus transzformációját definiálja, amely azonban többé már nem torzítás. Így a 134. ábrán (310. o.) látható két görbe topologikusan ekvivalens egymással és a körrel, mivel szétvághatók, kicsomózhatók és újból összevarrhatók. De nem lehet úgy eltorzítani az egyik görbét, hogy a másik görbét vagy egy kört kapjunk belőle. Alakzatok topologikus tulajdonságai (amilyent pl. Euler tétele és más, ebben a fejezetben tárgyalandó tételek adnak meg) a matematikai kutatás számos ágában elsőrendű fontosságúak. Azt lehetne mondani, hogy ezek a legalapvetőbb, legmélyebb geometriai sajátságok, mivel a legdrasztikusabb alakváltozásokban is megmaradnak. 2. Összefüggés A 125. ábrán láthatunk két síktartományt, amelyek nem topologikus megfelelői egymásnak. Az első a kör összes belső pontjából áll, a második azokból a pontokból, amelyek két koncentrikus kör által határolt tartományban foglalnak helyet. Az a tartomány minden zárt görbéjét folytonos torzítással vagy „zsugorítással” egyetlen pontra lehet összehúzni,
295
125. ábra. Egyszeresen összefüggő és kétszeresen összefüggő tartomány
126. ábra. Kétszeresen összefüggő tartomány átalakítása keresztmetszet alkalmazásával egyszeresen összefüggővé a tartományon belül maradva. Ha egy tartomány ilyen tulajdonsággal rendelkezik, egyszeresen összefüggőnek nevezzük. b tartomány nem egyszeresen összefüggő. Pl. a tartományt határoló két körre koncentrikus, közöttük félúton fekvő kört nem lehet a tartomány egyetlen pontjára összezsugorítani, mivel eközben a görbe szükségképpen áthaladna a körök középpontján, s ez pedig nem a tartomány pontja. Nem egyszeresen összefüggő tartományt többszörösen összefüggőnek nevezünk. Ha a b többszörösen összefüggő tartományt egy sugár mentén felvágjuk, amint az a 126. ábrán látható, az így keletkező tartomány egyszeresen összefüggő lesz. Általánosabban, konstruálhatunk két, három vagy több „lyuk”-at tartalmazó tartományokat, amint az pl. a 127. ábrán látható. Az ábrán látható tartományt két keresztmetszettel lehet egyszeresen összefüggő tartománnyá alakítani. Ha valamely D többszörösen összefüggő tartomány egyszeresen összefüggővé alakításához n − 1 egymást nem metsző, határtól határig terjedő metszet szükséges, akkor D tartomány n-szeresen összefüggő.
296
127. ábra. Háromszorosan összefüggő tartomány redukálása Egy síktartomány összefüggés foka a tartomány fontos topologikus invariánsa.
3. § További példák topológiai tételekre 1. Jordan-féle síkgörbetétel
128. ábra. A sík mely pontjai vannak ennek a sokszögvonalnak a belsejében? Rajzoljunk a síkon egyszerű zárt görbét (azaz olyan görbét, amelyik nem metszi
297
önmagát). Milyen tulajdonsága marad meg ennek a görbének, ha a síkot tetszőleges módon torzítható gumihártyának tekintjük? A görbe hosszúsága és a görbe által bezárt terület torzítás következtében megváltozik. Azonban van az alakzatnak egy topológiai tulajdonsága, amely olyan egyszerű, hogy szinte semmitmondónak látszik: Egy C egyszerű zárt síkgörbe a síkot pontosan két tartományra osztja, a görbe belsejére és külsejére. Azt kell ezen érteni, hogy a sík pontjai két olyan csoportba oszthatók – A, a görbe külseje és B, a belseje –, hogy azonos osztályba tartozó pontok mindig összeköthetők C-t nem metsző görbével, míg minden görbe, amely a két különböző osztály egy-egy pontját köti össze, szükségképpen metszi C-t. Ennek az állításnak az igazsága kör vagy ellipszis esetére nyilvánvaló, de ha pl. egy olyan bonyolultabb görbét tekintünk, amilyen pl. a 128. ábrán látható, az állítás már nem is olyan magától értetődő. A tételt Camille Jordan (1838–1922) mondotta ki először híres Cours d’Analyse 2 című könyvében. A matematikusok egész nemzedéke tanulta meg ebből a könyvből, hogyan kell a szigorúság modern fogalmát alkalmazni az analízisben. Elég különös, hogy a Jordan által adott bizonyítás sem rövid nem volt, sem egyszerű, s a meglepetés még nőtt, mikor kiderült, hogy méghozzá nem is állja meg a helyét, s érvelésének hiányosságait csak tekintélyes erőfeszítések árán sikerült kiigazítani. A tétel első szigorú bizonyítása nagyon bonyolult és nehezen érthető volt, még jól képzett matematikusok számára is. Csak legújabban sikerült viszonylag egyszerű bizonyítást találni. A nehézség egyik oka az „egyszerű zárt görbe” fogalmának általános voltában rejlik, amely fogalom nem korlátozódik a sokszögek vagy a „sima” görbék osztályára. Ide tartozik minden görbe, amely a kör topologikus képének tekinthető. Másrészről pedig sok, a szemlélet számára teljesen világos fogalmat, mint „belseje”, „külseje” stb., pontosan meg kell határozni, mielőtt szigorú bizonyítás egyáltalán lehetséges. Elsőrendű elméleti fontosságú, hogy az ilyen fogalmakat teljesen általánosságban analizálják, s ennek a munkának van szentelve a modern topológia nagy része. Sohasem szabad azonban elfelejteni, hogy a konkrét geometriai jelenségek tanulmányozásából származó esetek legnagyobb részében teljesen felesleges olyan fogalmakkal dolgozni, amelyeknek extrém általánossága szükségtelen nehézségeket teremt. Valóban, a Jordan-tétel is meglehetősen egyszerűen bizonyítható afféle „ jó magaviseletű” görbékre, mint a sokszögvonalak, vagy az olyan 2
Bevezetés az analízisbe.
298
görbék, amelyeknek az érintői folytonos forgással jönnek létre egymásból; a legtöbb fontos problémában ilyenek fordulnak elő. A fejezet függelékében sokszögvonalakra bizonyítjuk a tételt. 2. A négyszínprobléma A Jordan-tétel példájából azt hihetnénk, hogy a topológia feladata nagy szigorúsággal bizonyítani olyan nyilvánvaló állításokat, amelyekben ép elmével senki nem kételkedhet. De éppen ellenkezőleg, nagyon sok topológiai kérdés van, közöttük egészen egyszerűek is, amelyekre a szemlélet semmiféle választ nem ad. Például ilyen a híres „négyszínprobléma”.
129. ábra. Térképszínezés Földrajzi térképeken különbözőre szokás színezni az országokat, ha határuk egy része közös. Azt tapasztalták, hogy akárhány és akárhogyan elhelyezett országot is kellett színezni ezen a módon, mindig elég volt négy különböző szín. Könnyű belátni, hogy ennél kevesebb szín nem minden esetben elég. A 129. ábrán pl. egy sziget látható, amelyet bizonyosan nem lehet négynél kevesebb színnel kiszínezni, mert négy ország van a szigeten, s mindegyik ország érintkezik a másik hárommal. Az a tény, hogy eddig nem találtak térképet, amelynek megfelelő kiszínezése négynél több színt igényelt volna, a következő matematikai tétel kimondására ösztönöz:
299
bárhogyan is osztjuk a síkot fedésmentes tartományokra, mindig lehetséges a tartományokat négy szám – 1, 2, 3, 4 – egyikével oly módon megjelölni, hogy két szomszédos tartomány soha ne kapja ugyanazt a számot. „Szomszédos” tartományokon olyan tartományokat értünk, amelyeknek a határa egy egész vonaldarab mentén közös; két tartományt, amely egyetlen vagy véges számú pontban érintkezik (mint pl. Colorado és Arizona államok) nem nevezünk szomszédosnak, hiszen semmi zavart nem okozna, ha az ilyeneket azonos színnel színeznénk ki. A probléma bizonyítását először valószínűleg Moebius tűzte ki 1840-ben, majd 1850ben de Morgan, majd Cayley, 1878-ban. 1879-ben közölt egy bizonyítást Kempe, de 1890-ben Heawood hibát talált Kempe érvelésében. A Kempe-féle bizonyítás javított alakjával sikerült Heawoodnak azt bebizonyítani, hogy öt szín mindig elegendő. (Az ötszíntétel bizonyítását a fejezet függelékében közöljük.) Sok híres matematikus fáradozása ellenére is ennél a szerény eredménynél tart még ma is a dolog: sikerült bizonyítani, hogy öt szín mindenféle térkép kiszínezésére elegendő, és sejtjük azt, hogy négy szín is elég lenne. Azonban, akarcsak a híres Fermat-tétel (l. 50. o.) esetében, sem ezt a sejtést nem sikerült bizonyítani, sem ellenpéldát nem sikerült találni rá, s így egyike maradt a matematika nagy megoldatlan problémáinak. Pontosabban, bebizonyították, hogy harmincnyolcnál kevesebb tartományt tartalmazó térképek esetében a tétel igaz. Ennek a ténynek a fényében világos, hogyha az általános tétel hamisnak bizonyulna is, akkor sem lenne könnyű egyszerű ellenpéldát találni rá. A négyszínproblémában a térkép egyaránt rajzolható síkra vagy gömb felületére. A két eset ekvivalens: bármely gömbi térkép reprezentálható a síkon, ha az A tartományok egyikének belsejében kis lyukat vágunk, és az eredő felületet addig torzítjuk, amíg sík lesz, mint azt az Euler-tétel bizonyításában láttuk. Az így kapott sík térkép a megmaradó tartományokból álló „sziget” lesz, körülvéve A tartomány „tengerétől”. Ugyanígy, ennek az eljárásnak a megfordításával bármely síktérkép reprezentálható a gömbön. Továbbá, mivel a tartományok és határvonalaik torzítása nem változtat a problémán, feltehetjük, hogy mindegyik tartomány határa körívekből álló egyszerű zárt sokszög. Azonban a probléma még ebben a „regularizált” alakjában is megoldatlan; a nehézség itt, ellenkezőleg mint a Jordan-tétel esetében, nem a tartomány és a görbe fogalmának általános voltában gyökeredzik.
300
A négyszínproblémával kapcsolatos figyelemre méltó tény, hogy síknál és gömbnél bonyolultabb felületek esetére sikerült a megfelelő tételt bizonyítani, s így elég paradox módon bonyolultabb geometriai felületek analízise ebben a tekintetben könnyebbnek látszik, mint a legegyszerűbb felületeké. Pl. egy tóruszfelület (l. 123. ábra) esetére, amely olyan alakú, mint egy soproni perec vagy egy felfújt biciklibelső, sikerült kimutatni, hogy bármely térkép kiszínezhető hét szín használatával, és hogy szerkeszthetők hét tartományból álló térképek, minden egyes tartományukkal érintkezésben a többi hattal. *3. A dimenzió fogalma Amíg egyszerű geometriai alakzatokkal foglalkozunk, amilyenek a pontok, egyenesek, háromszögek és poliéderek, a dimenzió fogalma semmi nagyobb nehézséget nem okoz. Egyetlen pontnak vagy a pontok bármely véges halmazának nulla a dimenziója, a szakasz egydimenziós, a háromszög vagy egy gömbfelület kétdimenziós. Egy kocka belsejében levő pontok halmaza háromdimenziós. Azonban, ha ezt a fogalmat általánosabban ponthalmazokra kívánjuk kiterjeszteni, pontosabb definícíó szükséges. Milyen dimenziót kell pl. hozzárendelni az x-tengely azon pontjaiból álló R ponthalmazhoz, amely pontoknak a koordinátái racionális számok? A racionális számok mindenütt sűrűn fedik az egyenest, ezért halmazukat egydimenziósnak tekinthetnénk, mint magát az egyenest. Másrészt azonban bármely racionális pontpár között irracionális hézagok vannak, akárcsak egy véges ponthalmaz két pontja között, úgyhogy eszerint R dimenzióját vehetnénk nullának is.
130. ábra. A Cantor-féle ponthalmaz
301
Még bonyolultabb probléma keletkezik, ha megpróbálunk dimenziót rendelni az alábbi különös, először Cantor által tárgyalt ponthalmazhoz. Távolítsuk el az egységszakaszból a középső harmadát, azaz mindazokat az x pontokat, amelyekre 1/3 < x < 2/3. Nevezzük a megmaradó ponthalmazt C1 -nek. Távolítsuk el most C1 -ből mindkét szakaszának középső harmadát, és nevezzük az így keletkezett halmazt C2 -nek. Ismételjük meg az eljárást, eltávolítva C2 mind a négy intervallumából a középső egyharmadot. Nevezzük az így kapott halmazt C3 -nak, s állítsuk elő ugyanilyen módon C4 , C5 , C6 . . . halmazokat. Jelölje C az egységszakasz azon pontjainak halmazát, amelyek megmaradtak, miután mindezeket az intervallumokat eltávolítottuk, azaz C a C1 , C2 . . . halmazok végtelen sorozatának közös pontjaiból álló halmaz. Mivel az első lépésben egy 1/3 hosszúságú intervallumot távolítottunk el, a második lépésben két, egyenként 1/32 hosszúságú intervallumot stb.; az eltávolított szakaszok hosszúságának összege " # 2 1 2 2 1 1 2 1 1+ + + ... . 1 · + 2 · 2 + 2 · 3 + ... = 3 3 3 3 3 3 A zárójelbe tett végtelen sor geometriai sor, melynek összege 1/(1−2/3) = 3; tehát az eltávolított szakaszok hosszúságának összege 1. Mégis maradnak pontok C halmazban. Ilyenek pl. az 1/3, 2/3, 1/9, 2/9, 7/9, 8/9, . . . pontok, amelyek harmadolják az egymásután következő szakaszokat. Könnyű kimutatni, hogy C pontosan azokból az x pontokból áll, melyeknek végtelen triadikus törtekbe való sorbafejtése x=
a1 a2 a3 an + 2 + 3 + ... + n + ... 3 3 3 3
alakba írható, ahol mindegyik ai vagy 0 vagy 2, míg minden eltávolított pont triadikus kifejtésében az ai számok legalább egyikének az értéke 1. Mi lesz C halmaz dimenziója? A valós számok nem megszámlálható voltának bizonyítására használt diagonális eljárás módosításával be lehet bizonyítani, hogy C halmaz nem megszámlálható. Úgy gondolhatnánk tehát, hogy C halmaznak egydimenziósnak kell lennie. Azonban C nem tartalmaz egyetlen, bármilyen kicsiny teljes intervallumot sem, úgyhogy C gondolható lenne nulla dimenziósnak is, akárcsak pontok valamely véges halmaza. Ugyanebben a szellemben kérdezhetnénk, vajon a sík pontjainak a halmaza, amelyet azáltal kapunk, hogy minden racionális pontból vagy a Cantor-féle C halmaz minden egyes pontjából kiindulva, egy egységnyi hosszúságú szakaszt rajzolunk, egydimenziósnak tekintendő-e vagy kétdimenziósnak. Poincaré volt az első, aki figyelmeztetett rá (1912-ben), hogy a dimenzió fogalmát alaposabban kell analizálni és pontosabban definiálni. Poincaré észrevette, hogy az egyenes azért egydimenziós, mert bármely két pontját elválaszthatjuk egyetlen pontot (azaz 0 dimenziójú képződményt)
302
kivágva belőle, a sík pedig azért kétdimenziós, mert két pontjának az elválasztására egy egész (1 dimenziójú) zárt görbét ki kell vágni belőle. Ez a tény a dimenzionalitás induktív voltára utal: n dimenziós a tér akkor, ha bármely két pontja elválasztható eltávolítva a tér egy (n − 1) dimenziós részhalmazát, és ha erre a célra (n − 1)-nél alacsonyabb dimenziójú részhalmaz nem mindig elegendő. A dimenzionalitás induktív definíciója implicite megtalálható Euklidész Elemei ben, ahol az egydimenziós alakzat olyasvalami, amelynek határa pontokból áll, a kétdimenziós alakzat az, melynek határa görbékből áll, és háromdimenziós egy alakzat, ha a határa felületekből áll. Az utóbbi években a dimenzió extenzív elméletét dolgozták ki. A dimenzió egyik definíciója azzal kezdődik, hogy pontosan meghatározzák a „nulla dimenziójú ponthalmaz” fogalmát. A pontok bármely véges halmazának az a tulajdonsága, hogy a halmaz minden pontja bezárható a tér egy tetszőlegesen kicsinnyé tehető tartományába, s a halmaz egyetlen pontja sincs ennek a tartománynak határán. Ezt a tulajdonságot tekintjük a 0 dimenziójúság definíciójának. Kényelem kedvéért azt mondjuk, hogy egyetlen pontot sem tartalmazó, üres halmaz dimenziója −1. Tehát egy S ponthalmaz dimenziója akkor lesz 0, ha a ponthalmaz nem −1 dimenziós (azaz, ha S legalább egy pontot tartalmaz, és ha S minden pontja bezárható egy tetszőlegesen kicsinnyé tehető tartományba, amelynek határa S-et egy −1 dimenziós halmazban metszi (azaz, amelynek határa nem tartalmazza S egyetlen pontját sem). Pl. a racionális pontok halmaza az egyenesen 0 dimenziós, mivel mindegyik racionális pont egy tetszőleges kicsiny, irracionális végpontú intervallum felezőpontjának vehető. A Cantor-féle C halmaz dimenziója is 0, hiszen ugyanúgy, mint a racionális pontok halmazát, az egyenes pontjainak egy mindenütt sűrű halmazát eltávolítva kell képezni. Eddig csak a −1 és 0 dimenzió fogalmát definiáltuk. Az 1 dimenzió definíciója azonban önként kínálkozik: egy S ponthalmaz akkor 1 dimenziós, ha nem −1 vagy 0 dimenziós, és ha S minden pontja bezárható egy tetszőlegesen kicsinnyé tehető tartományba, melynek határa S-et 0 dimenziós halmazban metszi. Az egyenes szakasz pl. ilyen tulajdonságú, mivel bármely intervallumának határa két pont, amely a megelőző definíció szerint 0 dimenziós halmaz. Ugyanígy haladva definiálhatjuk egymásután a 2, 3, 4, 5, . . . dimenzió fogalmát, mindegyiket a megelőző definíciójára alapítva. Tehát egy S halmaz akkor lesz n dimenziós, ha nem alacsonyabb dimenziójú, és S minden egyes pontja bezárható egy tetszőlegesen kicsiny tartományba, melynek határa S-et n − 1 dimenziós halmazban metszi. Pl. a sík 2 dimenziós, mivel a sík minden pontja
303
bezárható tetszőlegesen kicsiny körtartornányba, melynek kerülete 1 dimenziós3 . A közönséges tér egyetlen ponthalmazának a dimenziója sem lehet nagyobb 3-nál, mivel a tér minden pontja egy tetszőlegesen kicsiny, 2 dimenziós felületű gömbtartomány középpontjává tehető. A modern matematikában azonban a „tér” elnevezést használják bármely rendszer megjelölésére, amelyben a „távolság” vagy a „környezet” fogalma definiálható (l. 382. o.), ezeknek az absztrakt „terek”-nek a dimenziója lehet több mint 3. Egyszerű példa erre az n dimenziós cartesiusi tér, ennek a pontjai n valós számból álló rendezett szám n-esek: P = (x1 , x2 , x3 , . . . , xn ), Q = (y1 , y2 , y3 , . . . , yn ); P és Q pont közötti „távolság” pedig a d(P, Q) =
q (x1 − y1 )2 + (x2 − y2 )2 + . . . + (xn − yn )2
képlettel van defíniálva. Kimutatható, hogy ez a tér n-dimenziós. Olyan teret, amelynek dimenziója tetszőlegesen nagy n egész szám esetében is több mint n, végtelendimenziós térnek nevezünk. Ilyen terekre sok példa ismert. A dimenzióelmélet egyik legérdekesebb ténye a két-, három-, vagy általában n dimenziós alakzatok következő jellegzetes tulajdonsága. Tekintsük először a kétdimenziós esetet. Ha bármely egyszerű kétdimenziós alakzatot elegendően kicsiny tartományokra osztunk be (hozzászámítva mindegyik tartományhoz a határát is), akkor szükségképpen lesznek pontok, ahol e tartományok közül három vagy több találkozik, függetlenül attól, hogy milyen a beosztást létesítő tartományok alakja. Lesznek továbbá az alakzatnak olyan beosztásai, hogy minden pontjuk a beosztás legfeljebb három tartományához tartozik. Ha tehát a kétdimenziós alakzat négyzet, amint az a 131. ábrán látható, akkor lesz pont, mely az ábrán látható módon három, 1, 2 és 3-mal jelölt, tartományhoz tartozik, s az adott beosztás egyetlen pontja sem tartozik háromnál több tartományhoz. Hasonlóan bizonyítható be háromdimenziós esetben, hogy ha adott térfogatot kellőképpen kicsiny térfogatok rendszerével töltjük be, mindig léteznek olyan pontok, melyek a beosztás legalább négy kis térfogatához tartoznak, és megfelelőképpen választott beosztás esetében nem lehet négynél több kis térfogatnak közös pontja. 3
Nem állítjuk, hogy ez szigorú bizonyítása annak, hogy a sík definíciónk értelmében kétdimenziós, mivel feltételezi, hogy a kör kerületéről eleve tudjuk, hogy egydimenziós, s ugyanígy a síkról eleve tudnunk kell, hogy nem 0 vagy 1 dimenziós. Azonban ezek a tények, s magasabb dimenziókban vett megfelelőik bizonyíthatók. A bizonyításból látható, hogy az általános ponthalmazok dimenziójának definíciója nem mond ellent a szó egyszerű, halmazoknál megszokott, közönséges használatának.
304
131. ábra. A cserepezési tétel A fenti megfigyelések a következő, Lebesgue és Borel által kimondott tételre utalnak: Ha egy n dimenziós alakzatot valamely elegendően kicsiny zárt résztartományokból álló, zárt fedőrendszerrel fedünk, lesznek az alakzatnak pontjai, melyek a fedőrendszer résztartományai közül legalább n + 1-hez tartoznak, továbbá, mindig lehetséges tetszőlegesen kicsiny zárt tartományokból álló olyan fedőrendszert találni, amelynek egyetlen pontja sem tartozik n + 1-nél több tartományhoz. A fedőrendszer előállítási módja miatt nevezik ezt a tételt „cserepezési” tételnek is. A tétel jellemzi bármely geometriai alakzat dimenziószámát: azok az alakzatok, amelyekre érvényes a tétel, n dimenziósak, a többiek valamely más dimenziószámúak. Éppen ezért a tételt a dimenzió definíciójának lehet tekinteni, amint azt egyesek valóban teszik is. Egy halmaz dimenziója a halmaz topologikus tulajdonsága; két különböző dimenziószámú alakzat nem lehet topológiailag ekvivalens. Ez a „dimenziószám invarianciájá”-nak híres topológiai tétele, melynek jelentőségét jobban megértjük, ha emlékezünk a 105. oldalon említett tényre, ami szerint egy négyzet pontjainak a halmaza ugyanolyan számosságú, mint az egyenesszakasz pont jainak a halmaza. Az ott definiált vonatkozás nem topológiai, mert megsérti a folytonosság követelményét.
*4. Egy fixponttétel A topológia alkalmazásában a matematika más ágaira, igen fontos szerepük van a „fixpont”-tételeknek. Tipikus példája ezeknek a következő, Brouwer től származó tétel. Ez a tétel a topológia többi tényeinél sokkal kevésbé szemléletes.
305
Tekintsünk a síkban egy körlemezt. Ezen a kifejezésen a kör belsejét értjük, kerületével együtt. Tételezzük fel, hogy a körlemez pontjait tetszőleges folytonos transzformációnak vetjük alá (amelynek még kölcsönösen egyértelműnek sem kell lenni), olyanképpen, hogy a körlemez pontjai a körlemez más pontjaiba mennek ugyan át, de mindegyik pont a körlemezen belül marad. Pl. egy vékony gumihártyából álló lemezt zsugoríthatunk, forgathatunk, gyűrhetünk, nyújthatunk, torzíthatunk tetszőleges módon, arra ügyelve csak, hogy a körlemez minden pontjának végső helyzete eredeti kerületén belül maradjon. Vagy pl., ha egy üvegedénybe tett folyadékot oly módon hozunk mozgásba, hogy a felületen levő folyadékrészecskék, a felület más pontjaiba kerülve is, a felületen maradjanak, akkor a felületen levő folyadékrészecskék helyzete minden pillanatban a részecskék eredeti eloszlásának valamely folytonos transzformációját definiálja. Mármost Brouwer tétele azt állítja, hogy minden ilyen transzformációban létezik legalább egy fixpont; azaz létezik legalább egy olyan pont, melynek helyzete a leképezés után azonos eredeti helyzetével. (A fenti folyadékfelszínpéldában ez a fixpont az időben általában változik, de egyszerű forgó mozgás esetére a középpont az, amely megtartja helyzetét.) A fixpont létezésének bizonyítása számos topológiai tétel igazolására használt érvelési mód tipikus példája.
132. ábra. Transzformációvektorok Tekintsük a körlemezt transzformáció előtt és után, és tételezzük fel, hogy a tétel állításával ellentmondásban egyetlen fixpont sem marad, úgyhogy a leképezés minden pontot más pontba visz át a körön belül vagy a körön. Rendeljünk hozzá az eredeti
306
körlemez minden egyes P pontjához egy nyilat, mely mint egy „vektor” mutassa a PP 0 irányt, ahol P 0 jelentse a P pont transzformáció által kapott képét. A körlemez minden egyes pontjához tartozik ilyen nyíl, hiszen feltettük, hogy minden pont valahová máshová mozdul el. Tekintsük most a körlemez határán levő pontokat, a hozzájuk tartozó nyilakkal együtt. Ezeknek a vektoroknak mind a kör belsejébe kell mutatni, mert feltevés szerint egyetlen pont sem képeződik le körön kívüli pontba. Járjuk körül a határoló kört valamely P1 pontjából kiindulva az óramutató járásával ellenkező irányban. Eközben a vektor iránya változik, hiszen a határkör pontjaihoz különbözöképpen irányított vektorok vannak hozzárendelve. Ezeknek a vektoroknak az irányát feltüntethetjük egyetlen pontból kiinduló nyilakat rajzolva a síkon. Figyeljük meg, hogy ha P1 pontból kiindulva egyszer körüljárjuk a kört és ismét P1 pontba jutunk vissza, a vektor körülfordult s visszatért eredeti helyzetébe. Nevezzük ezen vektor teljes körülfordulásainak számát a köri vektorok „indexé”-nek; pontosabban, definiáljuk az indexet mint a vektorok különböző szögváltozásainak algebrai összegét, a részforgásoknak az óramutató járásával megegyező irányba eső részét negatívnak, az óramutató járásával ellenkező irányba eső részét pozitívnak véve. Az index a priori 0, 1, 2, 3, . . . számok egyike kell, hogy legyen, megfelelően a szögek 0, ±360, ±720, . . . fokos összváltozásának. Mármost az állítjuk, hogy az index 1-gyel egyenlő, azaz a vektor egész irányváltozása pontosan egy körülfordulásnyi. Hogy ezt bizonyíthassuk, emlékeztünk rá, hogy a transzformációhoz hozzárendelt vektor a határkör bármely P pontjában mindig a kör belsejébe irányul, sohasem lehet érintőleges. Mármost, ha ez a transzformációvektor más szöggel fordul el, mint az érintővektor, mialatt P pont egyszer körüljárja a kört (amely utóbbi 360◦ -kal fordul el, hiszen az érintővektor éppen egy teljes fordulatot ír le), akkor ez a különbség a transzformációvektor és az érintővektor elfordulása között csak 360◦ nem-nulla többszöröse lehet, mert mindkét vektor egész számú körülfordulást végez. Következésképpen a P1 ponttól P1 pontig való teljes körbejárás alatt a transzformációvektornak legalább eggyel több teljes kört kellene leírni, mint az érintővektornak, és mivel mindkét vektor folytonos forgást végez, a határkör valamely pontjában a transzformációvektornak pontosan az érintővektor irányába kellene mutatni. Ez azonban, amint láttuk, lehetetlen. Mármost, ha a határkör bármely koncentrikus körét tekintjük a körlemezben, s vesszük megfelelő transzformációvektorait, az utóbbiak indexének e koncentrikus körön is 1-nek
307
133. ábra kell lennie. Ha ugyanis folytonosan térünk át a határkörről bármely koncentrikus körére, az indexnek folytonosan kell változnia, mivel a transzformációvektorok iránya a körlemezen belül pontról pontra folytonosan változik. Azonban az index csak egész számú értékeket vehet fel, és ezért állandóan meg kell tartania eredeti 1 értékét, mivel 1-ről valamely más egész számra való ugrás diszkontinuitás lenne az index viselkedésében. (Ez a következtetés, hogy folytonosan változó mennyiség, amely csak egész számú értékeket vehet fel, szükségképpen állandó, sok bizonyításban előforduló, tipikusan matematikai érvelés.) Találhatunk tehát a koncentrikus körök között tetszőlegesen kicsit, amelyre a megfelelő transzformációvektorok indexe 1. De ez lehetetlen, hiszen a transzformáció feltételezett folytonossága esetén elegendően kicsi kör transzformációvektorainak nagyjából mind ugyanabba az irányba kell mutatniuk, mint a kör középpontjának a vektora. Így szögeiknek összváltozása tetszőlegesen kicsinnyé tehető, kisebbé mint mondjuk 10◦ , azáltal, hogy elegendően kicsi kört választunk. Az index tehát, amely egész szám kell legyen, szükségképpen 0. Ez azonban ellentmond kiinduló feltevésünknek, hogy a transzformációnak nincs fixpontja, s ezáltal befejezi a bizonyítást. A most bizonyított tétel nemcsak körlemezre érvényes, hanem háromszögre, négyzetre, vagy bármely más alakú felületre is, amely topologikus transzformációval állítható elő a
308
körlemezből. Ugyanis, ha A bármely alakzat, melyet a kölcsönösen egyértelmű folytonos transzformáció rendel hozzá a körlemezhez, akkor A fixpont nélküli önmagába való folytonos leképezése a körlemez önmagába való fixpont nélküli folytonos leképezését definiálná, amiről éppen most láttuk, hogy lehetetlen. Érvényes a tétel három dimenzióban is, gömbökre vagy kockákra, de a bizonyítás itt már nem olyan egyszerű, mint a fenti. Jóllehet a Brouwer-féle fixponttétel a szemlélet számára nem nagyon nyilvánvaló, könnyű kimutatni, hogy közvetlen következménye az alábbi, szemléletesen nyilvánvaló ténynek: lehetetlen körlemezt folytonos leképezéssel kerületébe átvinni úgy, hogy a kerület minden pontja fixpont maradjon a leképezésben. Kimutatjuk, hogy a körlemez önmagába való fixpontmentes leképezése ellentmond ennek a ténynek. Tegyük fel ugyanis, hogy P → P 0 ilyen leképezés lenne; a körlemez minden P pontjához hozzárendelhetnénk egy P 0 pontból kiinduló és P ponton áthaladó nyilat, amely a körkerületet valamely P∗ pontban metszené. P → P∗ akkor az egész körlemez kerületébe való folytonos leképezését definiálná, s a kerület minden pontja fixpontja lenne ennek a leképezésnek, ellentétben azzal a feltevéssel, hogy ilyen transzformáció lehetetlen. Hasonló érvelés alkalmazható Brouwer tételének bizonyítására három dimenzióban, gömb vagy kocka esetére. Könnyű belátni, hogy vannak geometriai alakzatok, amelyeknek önmagukba való folytonos fixpontmentes leképezése lehetséges. Pl. két koncentrikus kör közötti gyűrű alakú tartomány folytonosan és fixpontmentesen leképezhető önmagába, bármely középpontja körüli 360◦ -nak nem egész számú többszörösével való forgatással. A gömb felülete leképezhető önmagába folytonosan és fixpontmentesen olyan transzforrnációval, amely minden pontját az átellenesen szemben fekvő pontba viszi át. De a körlemez esetében használt érveléshez hasonlóan bebizonyítható, hogy gömb esetében is minden transzformációnak, amely valamely pontot nem az átellenesen szemben fekvő pontba visz át (azaz pl. bármely kis deformációnak), van fixpontja. Ehhez hasonló fixponttételek eredményes módszerei sok olyan matematikai „egzisztencia tétel” bizonyításának, amely első látásra egyáltalán nem geometriai jellegű. Fixponttételek közé tartozó híres tételt sejtett meg 1912-ben, rövid idővel halála előtt, Poincaré. Ennek a tételnek közvetlen következménye, hogy a korlátozott háromtestproblémában végtelen sok periodikus pálya adódik megoldásként. Poincaré nem tudta sejtését bizonyítani, s az amerikai matematika egyik nagy teljesítménye volt, mikor a következő évben G. D. Birkhoff igazolta a sejtést. Azóta is igen sikeresen alkalmazzák a topológiai módszereket a dinamikai rendszerek kvalitatív viselkedésének vizsgálatában.
309
5. Csomók
134. ábra. Topológiailag ekvivalens csomók, amelyeket nem lehet deformációval egymásba átalakítani Utolsó példaként említsük meg, hogy a csomók tanulmányozása topológiai természetű, nehéz matematikai problémákra vezet. Csomó keletkezik, ha egy darab kötélen hurkot képezünk, és a kötél két végét egyesítjük. Az eredő görbe által reprezentált geometriai alakzat lényegében azonos marad, amíg a kötelet el nem szakítjuk, bárhogyan is deformáljuk húzás vagy csavarás által. Hogyan kell azonban jellemeznünk ezt a megcsomózott zárt görbét ahhoz, hogy a dolog természetéből következően különböztessük meg valamilyen nem csomózott zárt görbétől, például körtől? A felelet egyáltalában nem egyszerű, és még kevésbé egyszerű a különféle csomók s különbségeik matematikai analízise. Még a legegyszerűbb eset is hatalmas munkát igényel. Tekintsük pl. a két háromlevelű lóhereszerű csomót a 134. ábrán. A két csomó tökéletesen szimmetrikus, „tükörképei” egymásnak, s topologikusan ekvivalensek, de nem egybevágóak. Lehetséges-e egyik csomót folytonos deformációval átvinni a másikba? A válasz negatív, de a bizonyításához olyan sok minden szükséges a topológia és csoportelmélet technikájából, hogy itt nem közölhetjük.
310
4. § Felületek topológiai osztályozása 1. A felületek nemszáma
135. ábra. Metszet a gömbön és a tóruszon
136. ábra. Egy két nemszámú felület A két dimenziós felületek tanulmányozása sok egyszerű és fontos topológiai tényre vezet. Hasonlítsuk pl. össze a gömb és a tórusz felületet. Látszik a 135. ábrából, hogy a két felület alapjában különbözik egymástól. A gömbön, akárcsak a síkon, minden egyszerű zárt görbe, mint amilyen C, két részre osztja a felületet. De a tóruszon van olyan zárt görbe, mint pl. C 0 , amely nem választja szét a felületet két részre. Az, hogy C két részre osztja a felületet annyit jelent, hogyha a gömböt C mentén felvágjuk, két különböző, össze nem függő darabra esik szét, vagy ami ugyanazt jelenti, találhatunk a gömbön két pontot úgy, hogy az őket összekötő bármely gömbfelületi görbe szükségképpen
311
metszi C-t. Azonban ha a tóruszt vágjuk fel a zárt C 0 görbe mentén, a kapott felület továbbra is összefüggő marad, ugyanis a felület bármely pontja összeköthető a felület bármely más pontjával, olyan görbével, amelyik nem metszi C 0 -t. Ez a különbség gömbfelület és tórusz között két topológiailag különböző felülettípust jelöl ki, amelyek nem deformálhatók folytonos módon egymásba. Tekintsük ezután a 136. ábrán látható kétlyukú felületet. Ezen a felületen két egymást nem metsző zárt görbét rajzolhatunk, s mégsem esik szét két részre a felület. Az ábrán A és B jelöli a két görbét. Három egymást nem metsző zárt görbe azonban már ezt a kétlyukú felületet is mindig szétdarabolja.
137. ábra. Két nemszámú felületek Ezek a tények arra indítanak, hogy definiáljunk a felületen egy nemszám nevű fogalmat, a felületen húzható olyan egymást nem metsző, egyszerű zárt görbék számaként, amelyek nem darabolják szét a felületet. A gömb nemszáma 0, a tóruszé 1, a 136. ábrán látható felületé 2. Egy ehhez hasonló, de p lyukú felület nemszáma p. A nemszám a felület topologikus tulajdonsága, s ugyanaz marad, ha deformáljuk a felületet. Megfordítva, meg lehet mutatni (a bizonyítástól eltekintünk), hogy ha két zárt felület nemszáma azonos, akkor deformálhatók egymásba, úgyhogy topológiai szempontból tökéletesen jellemzi a zárt felületet p = 0, 1, 2, . . . nemszáma. (Feltételezzük, hogy csak közönséges, ún. „kétoldalú” felületeket vizsgálunk. Ennek a fejezetnek a 3. pontjában tárgyaljuk majd az ún. „egyoldalú” felületeket.) Pl. a 137. ábrán látható kétlyukú perec és a kétfülű gömb nemszáma egyaránt 2, és nyilvánvaló, hogy a két felület folytonos deformációval átalakítható egymásba. Mivel a p lyukú perec, vagy ekvivalense, a p fülű gömb egyaránt p nemszámú, a két felület bármelyikét tekinthetjük az összes p nemszámú zárt felület topológiai reprezentánsaként.
312
*2. A felület Euler-féle karakterisztikája Legyen S egy p nemszámú zárt felület. Daraboljuk szét S-et görbe ívekkel, összekötve S-en kitűzött szögpontokat. Bebizonyítjuk, hogy V − E + F = 2 − 2p,
(1)
ahol V = szögpontok száma, E = görbe ívek száma, F = azoknak a daraboknak a száma, amelyekre a szögpontok összekötése által daraboltuk szét a felületet. Ezt a 2 − 2p számot a felület Euler-féle karakterisztikájának nevezzük. Láttuk már, hogy gömb esetében V − E + F = 2, megegyezésben (1)-gyel, mivel gömb esetében p = 0.
138. ábra (1) általános formula bizonyítására tegyük fel, hogy S egy p fülű gömb. Ugyanis, amint láttuk, bármely p nemszámú felület átalakítható folytonos deformációval p fülű gömbbé, és e közben a deformáció közben V − E + F és 2 − 2p szám nem változik. Úgy választjuk a deformációt, hogy az A1 , A2 , B1 , B2 , . . . zárt görbék, amelyek mentén a fülek a gömbhöz illeszkednek, a felület adott darabolásának ívei között legyenek. (Lásd a 138. ábrát, amely p = 2 esetére szemlélteti a bizonyítást.) Vágjuk fel S felületet A2 , B2 , . . . felületi görbék mentén, és egyenesítsük ki a füleket. Ezáltal mindegyik fülnek keletkezik egy-egy szabad vége, amelyet egy-egy új A∗ , B∗ , . . . görbe határol. Ezeknek ugyanannyi szögpontjuk és szögpontot összekötő ívük van, mint a megfelelő A2 , B2 , . . . görbéknek. Tehát V −E+F nem változik, mivel az újonnan hozzájövő szögpontokat pontosan kiegyenlítik az újonnan hozzájövő ívek, új felületdarabokat pedig nem teremtettünk. Deformáljuk most a felületet, lelapítva a kiálló fogantyúkat, míg egy egyszerű gömböt kapunk, amelyből 2p darabot eltávolítottunk. Mivel tudjuk, hogy a
313
gömb bármely szétdarabolására V − E + F értéke 2, V − E + F = 2 − 2p egyenletet kapjuk a 2p helyen kilyuggatott, s így az eredeti 2p fülű gömb számára is, ami bizonyítandó volt. A 121. ábrán látható az (1) képlet alkalmazása, egy sík sokszögekből álló S felületre. Ez a felület átvihető folytonos deformációval tóruszba úgy, hogy nemszáma p = 1, és 2 − 2p = 2 − 2 = 0. (1) képlet alkalmazásával pedig V − E + F = 16 − 32 + 16 = 0. Feladat: Osszuk darabokra a 137. ábrán látható kétlyukú perecet, és mutassuk meg, hogy V − E + F = −2.
3. Egyoldalú felületek Minden közönséges felületnek két oldala van. Ez érvényes zárt felületekre, mint amilyen a gömb vagy a tórusz, s olyan felületekre, amelyeket görbék határolnak, mint pl. a körlemez vagy a tórusz, ha eltávolítunk belőle egy darabot. Az ilyen felület két oldalát megkülönböztetésül különböző színűre festhetjük. Ha a felület zárt, a két szín sehol sem találkozik. Ha a felületet görbe határolja, a két szín csakis ennek a görbének mentében találkozik. Egy bogár, melynek nem engedjük meg a felület határgörbéinek – ha ugyan vannak ilyenek – átlépését, a felületnek mindig ugyanazon az oldalán maradna mászkálása közben. Moebiustól származik az a meglepő felfedezés, hogy vannak egyoldalú felületek is. Legegyszerűbb efféle felület az ún. Moebius-féle szalag. Ez hosszú téglalapalakú papírszalagból állítható elő, két végét hossztengelye körüli félfordulat után összeragasztva, amint az a 139. ábrán látható. Ha ezen a szalagon bogár mászik végig a szalag középvonala mentén, míg kiinduló helyzetébe visszajut, közben megfordul fejjel lefelé. A Moebius-féle szalagnak csak egy széle van, mert határa egyetlen zárt görbe. Annak a közönséges felületnek, amelyet egy hosszú téglalap két végének elforgatás nélküli összeragasztásával kapunk, két külön határgörbéje van. Ha az utóbbi szalagot középvonala mentén kettévágjuk, két hasonló szalagra esik szét. Ha azonban a Moebius-féle szalagot vágjuk fel középvonala mentén (l. 139. ábra) nem esik két darabra, egy darabban marad. Aki
314
139. ábra. A Moebius-féle szalag előállítása nem ismeri a Moebius-féle szalagot, nemigen fogja előre kitalálni ezt a tulajdonságát, annyira ellentétben áll azzal, aminek az ember szemlélete szerint történni „kellene”. Ha a Moebius-féle szalag középvonala mentén való felvágásából keletkező felületet ismét felvágjuk középvonala mentén, két különálló, de egymásba láncolt csíkot kapunk. Elbűvölő dolog efféle szalagokkal játszogatni, határgörbéjükkel párhuzamosan 1/2, 1/3 stb. távolságokban felvagdosva őket. A Moebius-féle szalag határgörbéje csomómentes zárt görbe, folytonos deformációval vihető át valamely síkgörbébe, pl. körbe. Deformáció közben megengedhető, hogy a szalag önmagát messe, az így keletkező egyoldalú, önáthatoló felületet, amely a 140. ábrán látható, süvegfelületnek nevezzük. Az önáthatolás vonalát két különböző vonalnak tekintjük, ebben a vonalban önmagát metsző felület egyik és másik részéhez tartozónak. A Moebius-féle szalag egyoldalúsága megmarad, mivel ez topologikus tulajdonság;
315
140. ábra. Süvegfelület egyoldalú felületet nem lehet folytonos deformációval kétoldalú felületbe átvinni. Bár elég meglepő, még úgy is elvégezhető a deformáció, hogy a Moebius-féle szalag határa síkgörbébe, pl. háromszögbe menjen át, s a szalag önáthatolásmentes maradjon. A 141. ábrán látható ilyen, B. Tuckermanntól származó modell; a határgörbe háromszög, amely egy szabályos oktaéder egyik átlósíkjának fele, maga a szalag az oktaéder hat lapjából és négy derékszögű háromszögből áll, az utóbbiak mindegyike az oktaéder egy-egy átlósíkjának egy-egy megfelelő negyede. Másik érdekes egyoldalú felület a „Klein-féle palack”. Ez a felület zárt, de nincsen se belseje, se külseje. Topológiailag ekvivalens két, határgörbéje mentén összeforrasztott süvegfelülettel. Bebizonyítható, hogy bármely zárt, p = 1, 2, . . . nemszámú egyoldalú felület topológiailag ekvivalens egy gömbbel, amelyből p körlemezt eltávolítottunk, és az eltávolított darabok helyébe süvegfelületeket ragasztottunk. Ebből azonnal következik, hogy egy ilyen felület V − E + F Euler-féle karakterisztikája és p nemszáma között a V −E+F=2−p összefüggés írható fel. A bizonyítás hasonlóan történik, mint a kétoldalú felületek esetében. Először azt bizonyítjuk be, hogy egy süvegfelület vagy egy Moebius-féle szalag Euler-féle karakterisztikája 0. Ebből
316
141. ábra. Moebius-féle szalag, síkban fekvő határral a célból meg kell figyelni, hogy ha egy Moebius-féle szalagot, amelyet meghatározott számú tartományra osztottunk be, keresztben szétvágunk, olyan négyszöget kapunk, amely eggyel több szögpontot, eggyel több élet és ugyanannyi tartományt tartalmaz, mint a Moebius-féle szalag. A négyszögre, amint azt a 289. oldalon bebizonyítottuk, V − E + F = 1. Tehát a Moebius-féle szalagra V − E + F = 0. Feladatként fejezze be az olvasó a bizonyítást.
Sokkal egyszerűbb az efféle felületek topológiai természetét olyan síkbeli sokszögek segítségével tanulmányozni, melyeknek megfelelően választott élpárait identifikáltuk (vö. IV. fejezet, Függelék 3. pont). A 143. ábra diagramjain a párhuzamos nyilakat kell helyzet és irány szerint – ténylegesen vagy fogalmilag – azonosítani. Használható ez az identifikációs módszer háromdimenziós zárt sokaságok definiálására is, hasonlóan a kétdimenziós zárt felületekéhez. Ha például identifikáljuk egy kocka átellenes oldallapjainak pontjait (144. ábra), zárt háromdimenziós sokaságot kapunk, amelyet háromdimenziós tórusznak neveznek. Ez a sokaság két koncentrikus tóruszfelület közötti tér topologikus ekvivalense, amelyben a két egymásba helyezett koncentrikus tóruszfelület megfelelő pontjait identifikáltuk (145. ábra). Ugyanis az utóbbi sokaságot
317
142. ábra. Klein-féle palack kapjuk a kockából, ha két fogalmilag identifikált lappárt összehozunk.
Függelék *1. Az ötszíntétel Az Euler-féle képlet alapján be tudjuk bizonyítani, hogy a gömbön bármely térkép kellőképpen kiszínezhető legfeljebb öt különböző színnel. (Egy térképet akkor tekintünk kellőképpen kiszínezettnek, ha egyetlen olyan tartománynak sincs azonos színe, amely egy egész vonalszakasz mentén közös határú.) Olyan térképekre fogunk szorítkozni, melyeknek tartományait körívekből összetett, egyszerű zárt sokszögek határolják. Feltehetjük továbbá, hogy minden szögpontban pontosan három ív találkozik; az ilyen térképet szabályosnak nevezzük. Ugyanis, ha minden csúcsot, amelyben háromnál több ív találkozik, egy kis körrel veszünk körül, s minden ilyen kis kör belsejét a csúcsban találkozó tartományok egyikéhez csatoljuk, új térképet kapunk, amelyben a többszörös csúcsokat hármas csúcsokkal helyettesítettük. Az új térkép ugyanannyi tartományt tartalmaz, mint a régi. Ha ezt a – most már szabályos – térképet kellőképpen ki lehet színezni öt színnel, akkor a köröket pontokká zsugorítva, megkapjuk a kívánt színezési tételt az eredeti térképre. Így elegendő azt bebizonyítani, hogy a gömbön bármely szabályos térkép kiszínezhető öt színnel. Először azt mutatjuk ki, hogy minden szabályos térképnek tartalmazni kell legalább egy hatnál kevesebb oldalú sokszöget. Jelölje Fn egy szabályos térkép n oldalú tartományainak a számát; akkor, ha F jelöli az összes tartomány számát, F = F1 + F2 + F3 + F4 + . . . .
318
(1)
143. ábra. Zárt felületek definiálása síkidomok éleinek identifikálásával. a) henger, Moebius szalag, b) tórusz, Klein-féle palack Minden ívnek két vége van és minden szögpontban három ív találkozik. Tehát, ha E jelöli a térkép íveinek számát és V a szögpontokét, 2E = 3V.
(2)
Továbbá, egy n ív által határolt tartománynak n szögpontja van, és mindegyik szögpont három tartományhoz tartozik, tehát 2E = 3V = 2F2 + 3F3 + 4F4 + . . . .
(3)
Euler formulája szerint V − E + F = 2,
vagy
6V − 6E + 6F = 12.
319
144. ábra. Határfelületek identifikálása által definiált háromdimenziós tórusz
145. ábra. Háromdimenziós tórusz másféle ábrázolása (Az ábrát az identifikáció láthatóvá tételére felvágtuk.) (2)-ből látjuk, hogy 6V = 4E, tehát 6F − 2E = 12. Tehát (1) és (3)-ból 6(F2 + F3 + F4 + . . .) − (2F2 + 3F3 + 4F4 + . . .) = 12, vagy (6 − 2)F2 + (6 − 3)F3 + (6 − 4)F4 + (6 − 5)F5 + (6 − 6)F6 + (6 − 7)F7 + . . . = 12. Tehát a baloldalon legalább egy tagnak pozitívnak kell lenni, így az F2 , F3 , F4 , F5 , számok közül legalább az egyik pozitív, nullától különböző szám, amint azt állítottuk. Ezek után bizonyítsuk be az ötszíntételt. Legyen M tetszőleges szabályos térkép a gömbfelületen, összesen n tartománnyal. Tudjuk, hogy ezek között a tartományok között
320
van legalább egy hatnál kevesebb oldalú.
146. ábra Első eset. M tartalmazzon egy 2, 3, vagy 4 oldalú A tartományt. Távolítsuk el A és egyik szomszédos tartománya közül a határgörbét. (Ha A-nak négy oldala van, ugyanaz a tartomány érintheti kívülről A két nem szomszédos oldalát. Ha ez a helyzet, a Jordan-tétel szerint A másik két oldalával határos tartományok különbözők egymástól, s A meg az utóbbi két tartomány valamelyike közötti határvonalat eltávolítjuk.) Az így kapott M 0 térkép n − 1 tartományt tartalmazó szabályos térkép lesz. Ha M 0 kellőképpen kiszínezhető 5 színnel, akkor ugyanígy kiszínezhető M is. Mivel ugyanis M-nek legfeljebb négy tartománya szomszédos A-val, mindig találhatunk egy ötödik színt A számára.
147. ábra Második eset. M egy ötoldalú A tartományt tartalmaz. Jelöljük az A-val szomszédos tartományokat sorra B, C, D, E és F betűkkel. Mindig találhatunk ezek között olyan kettőt, amely nem érintkezik egymással; ugyanis ha mondjuk B és D érintkeznek,
321
megakadályozzák C-t abban, hogy akár az E akár az F tartománnyal érintkezzék, mivel minden útnak, amely C-ből E-be vagy F-be vezet, keresztül kell haladni az A, B és D tartományok közül legalább egyen. (147. ábra). (Nyilvánvaló, hogy ez a tény is a Jordantételen alapul, amely a sík vagy a gömb esetére érvényes. Nem igaz pl. a tórusz esetére.) Feltehetjük azért, hogy mondjuk a C és F nem érintkeznek. Távolítsuk el A C-vel és F-fel érintkező oldalait, ami által egy új M 0 térképet kapunk, amely n − 2 tartományt tartalmaz és szabályos. Ha az új térkép kellőképpen kiszínezhető öt színnel, akkor ugyanígy kiszínezhető az eredeti M térkép is. Ugyanis, ha visszaállítjuk a határokat, A nem érintkezik négynél több különböző színnel, mivel C és F azonos színűek, és így találhatunk A számára ötödik színt. Tehát mindkét esetben, ha M n tartományt tartalmazó szabályos térkép, szerkeszthetünk egy n − 1 vagy n − 2 tartományt tartalmazó szabályos térképet, s ha M 0 öt színnel kiszínezhető, akkor kiszínezhető ugyanígy M is. Az eljárás újból alkalmazható M 0 -re, és így tovább, s végül M-ből levezetett térképek M, M 0 , M 00 , . . . sorozatát kapjuk. Mivel a térképek tartományainak a száma ebben a sorozatban állandóan csökken, végül el kell jutnunk egy olyan térképhez, amely csak öt vagy még kevesebb tartományt tartalmaz. Ilyen térkép pedig mindig kiszínezhető legfeljebb öt színnel. Tehát, lépésenként visszatérve M-re, látjuk, hogy maga M is kiszínezhető öt színnel. Ezzel a bizonyítást befejeztük. Jegyezzük meg, hogy a közölt bizonyítás konstruktív, amennyiben tökéletesen kivitelezhető, bár fáradságos módszert ír elő bármely n tartományt tartalmazó térkép véges számú lépésben történő tényleges kiszínezésére. 2. A Jordan-tétel sokszögek esetében A Jordan-tétel azt állítja, hogy bármely C egyszerű zárt görbe a sík nem C-n fekvő pontjait két külön tartományba osztja, melyeknek közös határa C (és nincs közös pontjuk). Be fogjuk bizonyítani a tételt arra az esetre, ha C valamely P zárt sokszögvonal. Kimutatjuk, hogy a sík nem P-n fekvő pontjai két, A és B osztályba oszthatók úgy, hogy azonos osztály bármely két pontja összeköthető egy C-t nem metsző sokszögvonallal, míg
322
bármely sokszögvonal, amely A egy pontját B egy pontjával köti össze, szükségképpen metszi P-t. A osztályt a sokszögvonal „külsejé”-nek, B osztályt „belsejé”-nek nevezzük. Azzal kezdjük a bizonyítást, hogy választunk a síkban egy rögzített irányt, amely nem párhuzamos P egyetlen oldalával sem. Mivel P-nek csak véges számú oldala lehet, ez mindig lehetséges. Definiáljuk most A és B osztályt a következőképpen: p pont A-hoz tartozik, ha a p-ből kiinduló és a rögzített irányba haladó félegyenes páros számú, 0, 2, 4, 6, . . . pontban metszi P-t. p pont B osztályba tartozik, ha a p pontból kiinduló és a rögzített irányba haladó félegyenes P-t páratlan számú, 1, 3, 5, . . . pontban metszi.
148. ábra. Metszéspontok megszámlálása Ami azokat a félegyeneseket illeti, amelyek P szögpontjain mennek keresztül, ha P két oldala, amelyek a szögpontban találkoznak, a félegyenes egyazon oldalán fekszenek, nem számítjuk metszéspontnak a találkozást, azonban egy metszéspontot számítunk, ha a szögpontban találkozó két oldal a szögponton áthaladó félegyenes két különböző oldalán fekszik. Ha két pont: p és q ugyanazon osztályba, vagy A-ba vagy B-be tartozik, azt mondjuk, hogy azonos „paritásúak”. Először is vegyük észre, hogy valamely P-t nem metsző egyenesszakasz bármely pontjának azonos a paritása. Ugyanis egy ilyen szakaszon mozgó p pont paritása csak akkor változhat, ha a rögzített irányba haladó, p pontból kiinduló félegyenes áthalad P egy szögpontján, és az ekkor lehetséges két eset közül egyikben sem változik meg ténylegesen a paritás, a megelőző bekezdésben bevezetett megállapodás szerint. Ebből következik, hogy ha sokszögvonallal kötjük össze A bármely p1 pontját és B bármely
323
149. ábra p2 pontját, ennek a sokszögvonalnak szükségképpen metszenie kell P-t, ugyanis egyébként a sokszögvonal minden pontjának, közöttük p1 -nek és p2 -nek a paritása azonos lenne. Továbbá be lehet bizonyítani, hogy ugyanazon osztály, A vagy B, összeköthető P-t nem metsző sokszögvonallal. Nevezzük a két pontot p és q-nak. Ha a p és q pontot összekötő pq szakasz nem metszi P-t, ez a keresett vonal. Ellenkező esetben legyen p 0 ennek a szakasznak első metszéspontja P-vel és q 0 az utolsó ilyen pont (149. ábra). Szerkesszük meg a keresett sokszögvonal első darabját pp 0 szakasz mentén, azután közvetlenül p 0 előtt térjünk el, és haladjunk P mentén mindaddig, amíg P q 0 -nél újra áthalad pq-n. Ha be tudjuk bizonyítani, hogy ez a vonal pq-t q 0 és q között metszi és nem p 0 és q 0 között, akkor a törött vonal folytatható q 0 q mentén q-ig anélkül, hogy metszené P-t. Nyilvánvaló, hogy két r és s pont, amely elég közel van egymáshoz, de P valamely szakaszának két különböző oldalán, különböző paritású kell, hogy legyen, mivel az r-ből kiinduló félegyenes eggyel több pontban metszi P-t, mint az s-ből kiinduló félegyenes. Látjuk tehát, hogy ha a pq szakasz mentén túlhaladunk a q 0 ponton, a paritás változik. Következésképpen a pontozott vonal q 0 és q között keresztezi pq-t, mivel p és q (és így a pontozott vonal minden pontja) azonos paritású. Ezzel befejeztük a Jordan-tétel bizonyítását P poligon esetére. P „külseje” mostmár azonosítható A osztállyal, mivel ha elég messze megyünk a rögzített irányba haladó bármely félegyenesen, eljutunk egy olyan ponthoz, amelyen túl a félegyenes már nem metszi P-t, úgyhogy ettől kezdve a pontok paritása 0, s így az A osztályba tartoznak. De akkor P „belsejét” B osztállyal kell azonosítanunk. Nem számít, akármilyen módon s bonyolultan is hajtogatott a P egyszeresen zárt sokszögvonal, mindig meg tudjuk
324
határozni, hogy a sík egy adott p pontja P belsejében vagy külsejében van-e. Ehhez csupán egy p-ből kiinduló félegyenest kell húzni és megszámolni a félegyenes P-vel való metszéspontjait. Ha ez a szám páratlan, p pont be van zárva P-be, s nem léphet ki belőle anélkül, hogy ne keresztezné valahol P-t. Ha ez a szám páros, a p pont P külsejében van. (Próbáljuk ki a 128. ábrán.) * Következőképpen is bebizonyíthatjuk a Jordan-tételt sokszögvonalak esetére: valamely p0 pont rendjét tetszőleges C zárt görbére vonatkozóan, amely nem halad át a p0 ponton, úgy definiáljuk, mint p0 pontot a görbén mozgó p ponttal összekötő vektor teljes körülfordulásainak a számát, miközben p egyszer fut le a görbe mentén. Legyen A = minden nem P-n fekvő p0 pont halmaza, melynek P-re vonatkozó rendje páros, B = minden nem P-n fekvő p0 pont halmaza, melynek P-re vonatkozó rendje páratlan. Akkor az így definiált A és B P külsejét, ill. belsejét állítja elő. A bizonyítás részleteit feladatként az olvasóra bízzuk.
**3. Az algebra alaptétele Az „algebra alaptétele” azt állítja, hogy ha f(z) = zn + an−1 zn−1 + an−2 zn−2 + . . . + a1 z + a0 ,
(1)
ahol n = 1 és an−1 , an−2 , . . ., a0 tetszőleges komplex szám, akkor létezik olyan α komplex szám, hogy f(α) = 0. Másként elmondva, a komplex számtestben minden egyenletpolinomnak van gyöke. (A 124. oldalon arra a következtetésre jutottunk, hogy f(z) n lineáris tényezőre faktorizálható: f(z) = (z − α1 )(z − α2 ) . . . (z − αn ), ahol α1 , α2 , . . ., αn f(z) zérushelyei.) Figyelemre méltó, hogy ezt a tételt a Brouwer-féle fixponttétel bizonyításához hasonló, topológiai jellegű megfontolással lehet bizonyítani. Emlékeztetünk arra, hogy a komplex szám egy x + yi alakú jelölés, ahol x és y valós számok és i-nek az a tulajdonsága, hogy i2 = −1. Az x + yi komplex szám ábrázolható a
325
sík azon pontjával, melynek két egymásra merőleges tengelyre vonatkozó koordinátái x és y. Ha polárkoordinátákat vezetünk be a síkon, a kezdőpontot a polárkoordináta-rendszer pólusának, az x-tengelyt polártengelynek véve, felírhatjuk, hogy z = x + yi = r(cos ϑ + i sin ϑ), ahol r =
p x2 + y2 . De Moivre képletéből következik, hogy zn = rn (cos nϑ + i sin nϑ).
(L. 119. o.). Tehát, ha a z komplex számmal egy r sugarú kört íratunk le a kezdőpont körül, zn addig, amíg z ezt az egy kört leírta, n-szer ír le egy rn sugarú teljes kört. Emlékeztetünk arra is, hogy r, a z komplex szám modulusa, |z| alakba írva z-nek 0-tól való távolságát adja meg, és hogy ha z 0 = x 0 + iy 0 , akkor |z − z 0 | a z és z 0 közötti távolság. Ezeket előrebocsátva, térjünk a tétel bizonyítására.
150. ábra. Az algebra alaptételének bizonyítása
326
Tételezzük fel, hogy (1) polinomnak nincs gyöke, tehát f(z) 6= 0 bármely z komplex számra. E szerint a feltevés szerint, ha z bármely zárt görbét ír le az x, y síkon, f(z) olyan zárt görbét ír le, amely sohasem halad át a kezdőponton (150. ábra). Definiálhatjuk tehát a 0 kezdőpont rendszámát f(z) függvényre vonatkozóan bármely C zárt görbére azoknak a teljes körülfordulásoknak a számaként, amelyeket a 0 pontot f(z) pont által leírt Γ görbén mozgó ponttal összekötő vektor tesz meg, mialatt z végighalad a zárt C görbén. Vegyük C görbének a 0 középpontú és t sugarú kört, és definiáljuk erre a körre ϕ(t) függvényt 0 pont f(z) függvényre vonatkoztatott rendszámaként. Nyilvánvaló, hogy ϕ(0) = 0, mivel a 0 sugarú kör egyetlen pont, és Γ görbe is egyetlen f(0) 6= 0 pontra redukálódik. A következő bekezdésben kimutatjuk, hogy t nagy értékeire ϕ(t) = n. Azonban ϕ(t) rendszám folytonosan függ t-től, mivel f(z) folytonos függvénye z-nek. Ellentmondásra jutunk tehát, mivel ϕ(t) függvény csak egész értékeket vehet fel, és nem mehet át folytonosan 0 értékről n-re. Hátra van még annak a bizonyítása, hogy nagy t értékekre ϕ(t) = n. Egy z = t sugarú körön, ha a sugár olyan nagy, hogy t > 1 és
t > |a0 | + |a1 | + . . . + |an−1 |,
érvényes az |f(z) − zn | = |an−1 zn−1 + . . . + a0 | 5 5 |an−1 | · |zn−1 | + |an−2 | · |zn−2 | + . . . + |a0 | = |a0 | n−1 =t |an−1 | + . . . + n−1 5 t 5 tn−1 [|an−1 | + |an−2 | + . . . + |a0 |] < tn = |zn |. A bal oldalon álló kifejezés zn és f(z) pont közötti távolság, a jobb oldal utolsó kifejezése pedig zn pont kezdőponttól való távolsága, látjuk ebből, hogy f(z) és zn pontot összekötő egyenesszakasz nem haladhat át a kezdőponton, amíg z a kezdőpont körül z sugárral rajzolt körön mozog. Ha ez így van, az f(z) által meghatározott görbét folytonos
327
deformációval vihetjük át a zn által megadott görbébe, egyszerűen f(z) minden pontját eltolva a zn -hez kapcsoló vektor mentén, anélkül, hogy át kellene haladni a kezdőponton. Mivel a kezdőpont rendszáma folytonosan változik, és csak egész számú értékeket vehet fel a deformáció során, ugyanaz kell, hogy legyen mindkét görbére. Mivel zn rendszáma n, f(z)-é is n kell legyen. Ezzel a bizonyítást befejeztük.
328
VI. fejezet. Függvény és határérték Bevezetés A modern matematika legnagyobb részében centrális jelentősége van a függvény és a határérték fogalmának. Ebben a fejezetben rendszeresen analizáljuk majd ezt a két fogalmat. Olyan típusú kifejezésnek, mint x2 + 2x − 3 mindaddig nincs határozott számértéke, amíg x-nek határozott értéket nem tulajdonítunk. Azt mondjuk, hogy a kifejezés értéke x értékének függvénye, és ezt a tényt x2 + 2x − 3 = f(x) jellel jelöljük. Pl. ha x = 2, akkor 22 + 2 · 2 − 3 = 5, tehát f(2) = 5. Ugyanígy, közvetlen behelyettesítéssel kapjuk meg f(x) értékét, ha x tetszőleges egész, tört, irracionális vagy akár komplex szám. Az n-nél kisebb prímszámok száma az n egész szám valamely π(n) függvénye. Ha n értéke adott, π(n) értéke meghatározott, bár nem ismeretes olyan algebrai kifejezés, amellyel ténylegesen kiszámítható lenne. A háromszög területe a három oldal hosszúságának függvénye; az oldalak hosszúságával változik, és ha az oldalaknak határozott értéket adunk, a terület is meghatározott értékű lesz. Ha a síkot projektív vagy topologikus transzformációval önmagára képezzük le, a pontok transzformáció utáni koordinátái az eredeti koordinátáiktól függenek, azaz az eredeti koordináták függvényei. Mindig találkozunk a függvény fogalmával akkor is, ha mennyiségeket valamilyen meghatározott fizikai vonatkozás kapcsol össze. A hengerbe zárt gáz térfogata a hőmérséklet és a dugattyúra nehezedő nyomás függvénye. Egy léggömbbel észlelhető légnyomás a
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526104517+02’00’
329
tengerszint feletti magasság függvénye. A periodikus jelenségek egész világát egyszerű trigonometrikus függvények, sin x és cos x kormányozzák. Ilyen periodikus jelenség pl. az árapály, a megpenditett húr rezgése, az izzó szál által kibocsátott fényhullámok. A „függvény” elnevezést Leibniz (1646–1716) használta először. Az ő és a XVIII. század matematikusai szemében a függvény fogalma többé-kevésbé azonosítható volt az összefüggés pontos természetét kifejező egyszerű matematikai képlet létezésével. Azonban ez a felfogás szűknek bizonyult a matematikai fizika szempontjából, és a függvény fogalmát a határérték rokon fogalmával együtt hosszú munkával kellett megfelelőképpen általánosítani és tisztázni. Erről számolunk be jelen fejezetünkben.
1. § Változók és függvények 1. Definíciók és példák Gyakran szerepelnek a matematikában olyan objektumok, amelyeket szabadon választhatunk az objektumok valamely S halmazából. Az ilyen objektumot változónak nevezzük, amely az S tartományban változik. A változókat az abécé végéről vett betűkkel szokás jelölni. Így pl., ha S az egész számok halmazát jelenti, X változó az S tartományban tetszőleges egész számot jelent. Azt mondjuk, hogy „X változó az S tartományban változik”, ami alatt azt kell érteni, hogy az X jelet tetszés szerint azonosíthatjuk S halmaz bármely elemével. Ha egy halmaz tetszőleges elemére vonatkozó állítást akarunk kimondani, igen kényelmes a változók használata. Jelentse pl. S ismét az egész számok halmazát, legyen továbbá X és Y két változó az S tartományban, akkor az X+Y =Y+X állítás kényelmes szimbolikus kifejezése annak a ténynek, hogy két egész szám összegének az értéke független az összeadás sorrendjétől. Speciális esetét fejezi ki ennek az állandókkal felírt 2+3=3+2
330
egyenlet, azonban bármely számpárra érvényes általános törvény kifejezésére olyan jelölés szükséges, amely magában foglalja a változó fogalmát. Egyáltalában nem szükséges, hogy az X változó S tartománya számok halmaza legyen. Lehet pl. S a sík összes körének halmaza; ebben az esetben X tetszőleges kört jelent S körei közül. Vagy lehet S a sík összes zárt sokszögeinek a halmaza, akkor X ezek közül jelent egy sokszöget. Az sem szükséges, hogy a tartomány, amelyben a változó változhat, végtelen sok elemből álljon. Jelentheti pl. X egy adott időben adott S lélekszámú város tetszőleges lakosát. Vagy jelentheti X a lehetséges maradékok egyikét, valamely egész szám 5-tel való osztásában: ebben az esetben S tartomány öt számból áll: 0, 1, 2, 3, 4. Ha a változási tartomány elemei számok, a változót rendszerint kisbetűvel, pl. xszel jelöljük. Legfontosabb itt az az eset, amelyben S változási tartomány a valós számegyenes valamely a 5 x 5 b intervalluma. Ekkor x-et folytonos változónak nevezzük a kérdéses intervallumban. Valamely folytonos változó változási tartománya kiterjeszthető a végtelenbe. Így pl. lehet S az összes pozitív valós szám halmaza, x > 0, vagy lehet akár kivétel nélkül az összes valós szám halmaza. Hasonlóképpen tekinthetünk olyan X változót is, melynek értékei a sík, vagy a sík valamely adott tartományának, pl. egy négyszög vagy egy kör belsejének a pontjai. Mivel a sík minden pontját két rögzített tengelyre vonatkoztatott x és y koordinátája határozza meg, ebben az esetben gyakran mondjuk, hogy két folytonos változónk van, x és y. Előfordulhat, hogy egy X változó minden értékéhez egy másik U változó valamely meghatározott értéke tartozik. Ebben az esetben U-t az X függvényének nevezzük. Az összefüggést, amelyben U és X vannak U = F(X) (olv.: „U egyenlő nagy ef iksz”) jelöléssel fejezzük ki. Ha X változási tartománya valamely S halmaz, az U változó változási tartománya egy másik halmaz lesz, mondjuk T . Legyen pl. S a sík összes X háromszögeinek a halmaza. Definiálhatunk egy F(X) függvényt azáltal, hogy minden X háromszöghöz hozzárendeljük kerületének U hosszúságát: U = F(X). Ebben az esetben T az összes pozitív szám halmaza lesz. Meg kell jegyeznünk, hogy két különböző, X1 és X2 háromszögnek lehet ugyanakkora kerülete, tehát az F(X1 ) = F(X2 ) egyenlet akkor is fennállhat, ha X1 6= X2 . Az S sík valamely más T síkra való projektív
331
transzformációja S minden pontjához T egyetlen pontját rendeli hozzá, mégpedig meghatározott szabály szerint, amelyet U = F(X) függvényjelölessel jelölhetünk. Ebben az esetben mindig fennáll, hogy F(X1 ) 6= F(X2 ), ha X1 6= X2 , azt mondjuk, hogy S leképezése T -re kölcsönösen egyértelmű (l. 97. o.). Folytonos változók függvényeit gyakran definiáljuk algebrai kifejezésekkel. Erre a definiálási módra példák az u = x2 ,
u=
1 , x
u=
1 1 + x2
kifejezések. Az első és utolsó kifejezésben x változási tartománya a valós számok teljes halmaza, a második esetben x bármely valós értéket felvehet a 0 kivételével – a 0 értéket ki kell zárni, mivel 1/0 nem szám. Egy n egész szám törzstényezőinek B(n) száma az n függvénye, ahol n a természetes számok halmazában minden értéket felvehet. Általánosabban, a számok bármely a1 , a2 , a3 , . . . sorozatát tekinthetjük egy u = F(n) függvény értékeinek, ahol az n független változó a természetes számok halmazában minden értéket felvehet, a függvény „értelmezési tartománya” a természetes számok halmaza. Csupán a rövidség kedvéért jelöljük a sorozat n-edik tagját an -nel a teljesebb F(n) függvényszerű összefüggést kifejező jelölés helyett. Az I. fejezetben tárgyalt S1 (n) = 1 + 2 + . . . + n =
n(n + 1) , 2
S2 (n) = 12 + 22 + . . . + n2 =
n(n + 1)(2n + 1) , 6
S3 (n) = 13 + 23 + . . . + n3 =
n2 (n + 1)2 4
kifejezések az n pozitív egész változó függvényei. Az U = F(X) jelölésben rendszerint független változónak nevezzük X-et, U-t pedig függő változónak, mivel értéke attól függ, milyen értéket választunk X számára. Megtörténhet, hogy az összefüggés X minden értékéhez U ugyanazon értékét rendeli úgy, hogy T halmaz egyetlen elemből áll. Ebben a speciális esetben a függvény U értéke valójában nem változik, azaz U állandó, konstans. Ezt az esetet is a függvény általános fogalmához soroljuk, bár ez kicsit különös lehet a kezdő számára, aki természetes módon
332
azt a gondolatot tartja fontosnak, hogy X változásával U is változik. De semmi baj nem származik belőle – és igen hasznos lesz majd –, ha az állandót olyan változó speciális esetének tekintjük, amelynek „változási tartománya” egyetlen elemből áll. A függvény fogalma nemcsak a tiszta matematikában alapvető fontosságú, hanem a matematika gyakorlati alkalmazásaiban is. A fizika törvényei semmi egyebek, mint arra vonatkozó állítások, hogyan függenek egyes mennyiségek más mennyiségektől, ha megengedjük, hogy az utóbbiak közül néhány szabadon változzék. Így a megpendített húr által adott hang magassága a húr hosszúságától, súlyától és feszültségétől függ, a levegő nyomása a tengerszín feletti magasságtól függ, a puskagolyó energiája tömegétől és sebességétől függ. A fizikus feladata ennek a függvényszerű összefüggésnek pontos vagy megközelítő meghatározása. A függvényfogalom segítségével lehet egzakt matematikai módon jellemezni a mozgást. Ha egy mozgó részecskét, amelynek koordinátái x, y, z, a tér egyetlen pontjába koncentrálunk, és ha t az idő mértékét jelöli, akkor a részecske mozgását teljesen le lehet írni, megadva x, y, z koordinátáit a t idő függvényeként: x = f(t),
y = g(t),
z = h(t).
Így pl., ha a részecske szabadon esik a függőleges irányú z-tengely mentében, pusztán a nehézségi erő hatása alatt, x = 0,
y = 0,
1 z = − gt2 , 2
ahol g a gravitációs gyorsulás állandója. Ha a részecske egyenletesen forog az x, y síkban az egységsugarú körön, mozgását x = cos ωt,
y = sin ωt
függvények jellemzik, ahol ω állandó, a mozgás ún. szögsebessége. A matematikai függvény egyszerűen változó mennyiségek összefüggését szabályozó törvény. Semmiféle „ok-okozati” összefüggés nem következik belőle a változó mennyiségek között. Pl. Boyle törvénye állandó hőmérsékleten levő gázok esetében azt állítja, hogy zárt edényben levő, állandó hőmérsékleten tartott gáz p nyomásának és v térfogatának
333
a szorzata valamely c állandó (amelynek értéke viszont függ a hőmérséklettől): pv = c. Ez az összefüggés megoldható vagy p-re, vagy v-re, mind a kettő kifejezhető a másik függvényeként, p=
c v
vagy
v=
c p
anélkül, hogy ebből az következnék, hogy a térfogatváltozás az „oka” a nyomás változásának, vagy pedig a nyomásváltozás az „oka” a térfogatváltozásnak. A matematikus számára csupán a két változó közötti kapcsolat alakjának van jelentősége. A matematikusok és fizikusok gyakran két különböző szempontból tartják fontosnak a függvényfogalmat. A matematikusok rendszerint a hozzárendelés törvényét hangsúlyozzák, azt a matematikai műveletet, amelyet az x független változóra kell alkalmazni, hogy az u függő változó értékét megkapjuk. Ebben az értelemben f( ) matematikai művelet jele; u = f(x) érték az f( ) művelet x számra való alkalmazásának az eredménye. A fizikust azonban inkább maga az u mennyiség érdekli, s nem a matematikai művelet, amelynek segítségével u értékei kiszámíthatók x értékeiből. Így pl. a levegő mozgó tárggyal szembeni u ellenállása a tárgy v sebességétől függ, és kísérletileg meghatározható, akár ismeretes u = f(v) kiszámítására matematikai képlet, akár nem. A fizikust a tényleges ellenállás érdekli elsősorban, s nem valamely speciális f(v) matematikai formula, kivéve, ha egy ilyen formula tanulmányozása elősegíti az u mennyiség viselkedésének az analízisét. Általában ez a szemléletmód jellemzi azokat, akik a matematikát a fizikára vagy a mérnöki tudományokra alkalmazzák. A függvényekkel való bonyolultabb számolásokban gyakran csak úgy lehet elkerülni a zavart, ha pontosan tudjuk, vajon az x mennyiséghez u = f(x) mennyiséget hozzárendelő f( ) műveletet értjük-e a függvény alatt, vagy magát az u mennyiséget, amelyet egészen más módon is elő lehet állítani valamely más z változó függvényeként. Pl. a kör területét meg lehet adni u = f(x) = πx2 függvénnyel, ahol x a sugarat jelenti, de meg lehet adni az u = g(z) = z2 /4π függvény által is, ahol z a kör kerületét jelenti.
Talán a polinomok képviselik az egyváltozós matematikai függvények legegyszerűbb
334
típusát. Az egyváltozós polinomok alakja u = f(x) = a0 + a1 x + a2 x2 + . . . + an xn , ahol a0 , a1 , . . ., an állandó „együtthatók”. Ezek után következnek a racionális függvények, mint pl. u=
1 , x
u=
1 , 1 + x2
u=
x4
2x + 1 , + 3x2 + 5
amelyek polinomok hányadosai, azután következnek a trigonometrikus függvények, cos x, sin x, tg x = sin x/ cos x, melyeket legalkalmasabban a ξ, η sík ξ2 + η2 = 1 egységkörére vonatkoztatva lehet definiálni. Ha a P(ξ, η) pont ennek a körnek mentében mozog, és ha x az az irányított szög, amellyel el kell forgatni a pozitív ξ-tengelyt, hogy OP-vel egybeessék, akkor P koordinátái cos x és sin x: cos x = ξ, sin x = η. 2. Az ívmérték A gyakorlatban a szögeket olyan egységekben mérik, melyeket a derékszög egyenlő részekre való osztásával kapnak. Ha a derékszöget 90 egyenlő részre osztják be, a kapott egység a közönséges „fok”. A 100 részre való osztás jobban alkalmazkodnék a tízes számrendszerhez, de még mindig ugyanezt a mérési elvet képviselné. Elméleti célokra azonban sokkal megfelelőbb a szög nagyságának jellemzésére lényegesen különböző módszert használni, az ún. ívmértéket. Ebben a rendszerben sok fontos, szögek trigonometrikus függvényeit tartalmazó képlet egyszerűbben írható fel, mintha a szögeket fokokban mérjük. Egy szög ívmértékét megtalálhatjuk, ha a szög csúcsa körül egységsugarú kört írunk. A szög ennek a körnek a kerületéből kimetsz egy s ívet, és ennek az ívnek a hosszúságát definiáljuk a szög ívmértékeként. Mivel az egységsugarú kör teljes kerületének a hosszúsága 2π, a 360◦ -os teljesszög ívmértéke 2π. Következésképpen, ha x jelöli egy szög ívmértékét és y ugyanezen szög fokokban kifejezett mértékét, akkor x-et és y-t az y x = 360 2π
335
összefüggés kapcsolja össze, vagyis πy = 180x. Tehát a 90◦ -os (y = 90) szög ívmértéke x = 90 · π/180 = π/2 stb. Másrészt az 1 ívmértékű szög (az a szög, melynek ívmértéke x = 1) a körből a kör sugarával egyenlő hosszúságú ívet kimetsző szög; fokokban kifejezve y = 180/π = 57, 2957 . . . fok. Ha egy szög fokokban kifejezett y mértékét akarjuk megkapni x ívmértékéből, mindig 180/π tényezővel kell megszoroznunk az ívmértéket. Egy szög x ívmértéke egyenlő a szög által az egységkörből kivágott szektor A területének a kétszeresével; mivel ez a terület úgy aránylik a kör egész területéhez, mint a szög által a körből kimetszett ív hosszúsága az egész kör kerületéhez: x/2π = A/π, x = 2A. A továbbiakban x szög azt a szöget fogja jelenteni, melynek ívmértéke x. A kétértelműség elkerülésére a fokokban kifejezett x szöget x◦ alakban fogjuk írni. Látjuk majd, hogy az ívmérték igen alkalmas analitikus műveletek céljára. Gyakorlati alkalmazás szempontjából azonban meglehetősen kényelmetlen lenne. Mivel π irracionális, az egységnyi szög, azaz az 1 ívmértékű szög ismételt felmérésével egy adott körön sohasem jutnánk vissza a kiindulópontba. A közönséges szögmérték ezzel szemben úgy van felvéve, hogy 1 fok 360-szori felmérésével vagy 90 fok 4-szeri felmérésével visszajutunk a kiinduló helyzetbe. 3. A függvény grafikus ábrázolása. Inverz üggvény A függvény jellege gyakran igen világosan látható egyszerű geometriai ábráról. Ha x, u a pont két merőleges tengelyre vonatkoztatott koordinátája a síkon, akkor az olyan lineáris függvények mint u = ax + b egyenessel ábrázolhatók; másodfokú függvények mint u = ax2 + bx + c
336
parabolákkal; az u=
1 x
hiperbolával stb. Egy u = f(x) függvény görbéje definíciószerűen a sík azon pontjainak az összességéből áll, amely pontoknak x, u koordinátái között az u = f(x) összefüggés érvényes. A sin x, cos x, tg x függvények görbéi a 151. és 152. ábrán láthatók. A görbéken jól lehet látni, hogyan nő vagy csökken a függvény értéke x változásával.
151. ábra. sin x és cos x görbéje
152. ábra. u = tg x
153. ábra. u = x3
Új függvények bevezetésére szolgáló fontos módszer a következő. Induljunk ki egy ismert F(X) függvényből, és kíséreljük meg megoldani az U = F(X) egyenletet X-re úgy, hogy X változó U függvényeként legyen kifejezve: X = G(U).
337
154. ábra. Inverz függvények Ebben az esetben G(U) függvényt F(X) egy inverz függvényének nevezzük. Az eljárás eredménye csak akkor lesz egyértelmű, ha az U = F(X) függvény az X tartományának U tartományára való kölcsönösen egyértelmű leképezését definiálja, azaz ha az X1 6= X2 egyenlőtlenségből mindig következik az F(X1 ) 6= F(X2 ) egyenlőtlenség, mert csak ebben az esetben tartozik minden egyes U-hoz egyértelműen definiált X. Láthatjuk ezt a fenti példánk esetén, amelyben X a sík tetszőleges háromszögét jelentette és U = F(X) a háromszög kerületét. Nyilvánvaló, hogy a háromszögek S halmazának leképezése a pozitív valós számok T halmazára nem kölcsönösen egyértelmű, mivel végtelen sok különböző háromszögnek van azonos hosszúságú kerülete. Tehát ebben az esetben az U = F(X) összefüggés nem használható fel egyértelmű inverz függvény definiálására. Ezzel szemben m = 2n függvény, ahol n az egész számok S halmazában változik, m pedig a páros számok T halmazából vehet fel értékeket, kölcsönösen egyértelmű vonatkozást definiál a két halmaz között, és így az n = m/2 inverz függvény egyértelműen meg van határozva. További példa a kölcsönösen egyértelmű leképezésre az u = x3 függvény. Amint x végighalad a valós számok halmazán, u is végighalad a valós számok halmazán, minden értéket egyszer és csak egyszer véve fel. Az egyértelműen definiált
338
inverz függvény x=
√ 3 u.
Az u = x2 függvény esetében nincs egyértelműen meghatározott inverz függvény. Mivel ugyanis u = x2 = (−x)2 , u minden pozitív értékének két x érték felel meg. Ha azonban, amint az √ szokásos, a u szimbólumot úgy definiáljuk, hogy azt a pozitív számot jelentse melynek négyzete u, akkor létezik az x=
√
u
inverz függvény, mindaddig, amíg x és u pozitív értékeire szorítkozunk. A függvény grafikus ábrázolására vetett egyetlen pillantás elárulja, létezik-e az u = f(x) egyváltozós függvények egyértelmű inverze. Az inverz függvény csak akkor van egyértelműen definiálva, ha u minden értékének egy és csak egy x érték felel meg. Grafikus ábrázolásban ez azt jelenti, hogy egyetlen x-tengellyel párhuzamos egyenesnek sem szabad a függvény görbéjét egynél több pontban metszeni. Bizonyosan ez a helyzet, ha az u = f(x) függvény monoton, azaz ha x növekedtével állandóan növekszik vagy állandóan csökken. Pl., ha u = f(x) állandóan növekszik, akkor x1 < x2 esetében mindig fennáll, hogy u1 = f(x1 ) < u2 = f(x2 ). Tehát adott u értékhez legfeljebb egy olyan x érték tartozik, amelyik kielégíti az u = f(x) összefüggést, és így az inverz függvény egyértelműen definiálva van. Az x = g(u) inverz függvény görbéjét egyszerűen megkapjuk, ha az eredeti görbét a szaggatott vonal körül 180◦ -kal elforgatjuk (154. ábra), ami által az x- és az u-tengelyek helyzete felcserélődik. Az új helyzetben a grafikus ábrázolás x-et tünteti fel u függvényeként. Az eredeti ábrázolásban a görbe pontjainak u értékei a pontok vízszintes x-tengely feletti magasságát adják meg, az elforgatás után ugyanazon az ábrán x adja meg a vízszintes u-tengely feletti magasságokat. A megelőző bekezdés fejtegetéseit szemléltethetjük az u = tg x
155. ábra. u = arc tg x
339
függvény esetében. Ez a függvény −π/2 < x < π/2 intervallumban monoton (152. ábra). u értéke, amely növekvő x-szel állandóan növekszik, −∞-től +∞-ig növekszik; tehát az x = g(u) inverz függvény u minden értékére definiálva van. Ezt a függvényt tg−1 u vagy arc tg u jellel jelöljük. Így arc tg(1) = π/4, mivel tg π/4 = 1. Ennek a függvénynek a görbéjét a 155. ábrán láthatjuk. 4. Összetett függvények Másik fontos módszer új függvények előállítására az új függvény összetétele két vagy több adott függvényből. Pl. az u = f(x) =
p 1 + x2
a két egyszerűbb z = g(x) = 1 + x2 ,
u = h(z) =
√
z
függvényből van „összetéve”, és u = f(x) = h(g[x]) (olv. „u egyenlő há gé iksz”). Hasonlóképpen u = f(x) = √
1 1 − x2
függvény három z = g(x) = 1 − x2 ,
340
w = h(z) =
√
z,
u = k(w) =
1 w
függvényből van összetéve, így u = f(x) = k(h(g[x])).
156. ábra. u = sin x1 Az u = f(x) = sin
1 x
függvény a két z = g(x) =
1 , x
u = h(z) = sin z
függvényből van összetéve. Az f(x) függvény nincs definiálva x = 0 helyen, mivel 0-ra 1/x kifejezésnek nincs értelme. Ennek a figyelemre méltó függvénynek a görbéjét a szinusz görbéből lehet megkapni. Tudjuk, hogy z = kπ-re, ahol k bármely pozitív vagy negatív egész szám lehet, sin z = 0. Továbbá 1
π , 2 sin z = −1 ha z = (4k − 1) · π 2 ha z = (4k + 1) ·
341
bármely k egész számra. Tehát 0 1 sin = 1 x −1
ha x =
1 , kπ
2 , (4k + 1)π 2 . ha x = (4k − 1)π ha x =
Ha egymás után k = 1, 2, 3, 4, . . . értékeket helyettesítünk be, akkor, mivel a törtek nevezői minden határon túl nőnek, x azon értékei, amelyekre a sin(1/x) függvény értéke 1, −1, 0 egyre közelebb és közelebb jutnak az x = 0 ponthoz. Bármely ilyen pont és a kezdőpont között még mindig végtelen sok oszcillációja lesz a függvénynek. A függvény görbéje a 156. ábrán látható. 5. Folytonosság Az eddig tárgyalt függvények görbéi alapján szemléletesen elképzelhetjük, mit jelent a folytonosság tulajdonsága. A 4. §-ban pontosan analizáljuk majd ezt a fogalmat, miután szigorúan megalapoztuk a határérték fogalmát. Durván szólva azt mondhatjuk, hogy egy függvény akkor folytonos, ha grafikus ábrázolása szakadásmentes görbe (l. 375. o.). Egy adott u = f(x) függvény folytonosságát úgy vizsgálhatjuk, hogy az x független változót folytonosan mozogni engedjük jobbról és balról egy rögzített x1 érték felé. E közben az u = f(x) függvény értéke is változni fog, hacsak nem állandó x1 környezetében. Ha f(x) értéke a függvény rögzített x = x1 pontban felvett f(x1 ) értékéhez tart határértékként, akár egyik, akár másik oldalról közeledünk x1 -hez, akkor azt mondjuk, hogy a függvény x1 helyen folytonos. Ha ez egy adott intervallum minden x1 pontjára áll, akkor azt mondjuk, hogy a függvény az adott intervallumban folytonos. Jóllehet minden szakadásmentes görbével ábrázolt függvény folytonos, könnyű olyan függvényt definiálni, amely nem mindenütt folytonos. Pl. a 157. ábrán látható függvény, amelyet f(x) =
342
1 + x
ha x > 0
−1 + x
ha x 5 0
157. ábra. Szakadás a függvény ugrása által definiál x minden értékére, nem folytonos az x1 = 0 pontban, ahol értéke −1. Ha megkíséreljük ábrázolni ezt a görbét, ebben a pontban fel kell emelnünk irónunkat a papírról. Ha jobb oldalról közeledünk az x1 = 0 értékhez, akkor f(x) értéke +1-hez közeledik. Azonban ez az érték különbözik a függvény x1 = 0 helyen felvett tényleges értékétől, amely −1. Az a tény, hogy ha x balról közeledik 0-hoz f(x) értéke −1-hez közeledik, nem elegendő a folytonossághoz. Az az f(x) függvény, amelyet f(x) = 0
ha x 6= 0, f(0) = 1
definiál minden x-re, másféleképpen nem folytonos az x1 = 0 pontban. Itt létezik jobb és bal oldali határérték, és a kettő egyenlő lesz, ha x tart a 0-hoz, azonban ez a közös határérték különbözik f(0)-tól. Más típusú a 158. ábrán látható függvény nemfolytonossága. Az u = f(x) =
1 x2
függvény az x = 0 pontban nem folytonos. Bármelyik oldalról is közeedik x értéke 0-hoz, u tart a végtelenhez; ezen a helyen a függvény görbéje megszakad és az x = 0
343
158. ábra. Végtelen szakadás hely környezetében x igen kicsiny változásaira is u-ban nagy változások észlelhetők. Szigorúan szólva a függvény értéke x = 0 értékre nincs definiálva, mivel a végtelent nem fogadjuk el számnak, és ezért nem mondhatjuk, hogy f(x) értéke végtelen, ha x = 0. Azért csak azt mondjuk, hogy f(x) „tart a végtelenhez”, ha x közeledik a zérushoz. A nemfolytonosság további típusa látható az u = sin 1/x függvénynél az x = 0 pontban, amint az a függvény görbéjéből leolvasható (156. ábra). A fenti példákból látjuk, hogy egy függvény többféleképpen lehet nem folytonos, szakadásos egy x = x1 pontban: 1. A függvényt az x = x1 helyen folytonossá lehet tenni megfelelőképpen definiálva vagy újradefiniálva értékét, ha x = x1 . Pl. az u = x/x függvény állandóan egyenlő 1-gyel, ha x 6= 0; x = 0-ra nincs értelmezve, mivel 0/0 értelmetlen szimbólum. De ha megegyezünk abban, hogy az u = 1 érték feleljen meg az x = 0 értéknek is, az így kibővített függvény x minden értékére kivétel nélkül folytonos. Ugyanez érhető el a fentebb említett f(x) = 0 ha x 6= 0, f(0) = 1 által definiált függvény esetében, ha f(0)-t f(0) = 0 alakban újradefiniáljuk. Az ilyen jellegű szakadásokat megszüntethető szakadásoknak nevezzük. 2. A függvény különböző határértékhez tart, aszerint, hogy x jobbról vagy balról
344
közeledik x1 -hez, amint az a 157. ábrán látható. 3. Még bal vagy jobb oldali határérték sem létezik az illető helyen, amint az pl. a 156. ábrán látható. 4. A függvény végtelenhez tart, ha x közeledik x1 -hez, amint az a 158. ábrán látható. Az utóbbi három típusú szakadást meg nem szüntethető, lényeges szakadásnak nevezzük, ezeket nem lehet megszüntetni a függvény pusztán x = x1 pontban való megfelelő definiálásával vagy újradefiniálásával. Feladatok: 1) Ábrázoljuk az x−1 , x2
x2 − 1 , x2 + 1
(x2
x − 1)(x2 + 1)
függvényeket, és keressük meg szakadási helyeiket. 2) Ábrázoljuk az x sin x1 és x2 sin x1 függvényt, és igazoljuk, hogy x = 0 helyen folytonosak, ha x = 0-ra mindkét esetben u = 0 definíciót vezetjük be. *3) Mutassuk ki, hogy az arc tg x1 függvénynek 2. típusú szakadása („véges szakadás” vagy „ugrás”) van az x = 0 helyen.
*6. Több változós függvények Térjünk vissza a függvényfogalom rendszeres tárgyalására. Ha a P független változó a sík egy pontja, melynek koordinátái x, y és ha minden ilyen P pontnak egyetlen u szám felel meg – lehet u pl. a P pont kezdőponttól számított távolsága – akkor szokás szerint azt írjuk, hogy u = f(x, y). Ezt a jelölést használjuk akkor is, ha – mint gyakran történik – két x és y mennyiség kezdettől fogva láthatóan független változók. Pl. a gázok u nyomása az x térfogat és az y hőmérséklet függvénye, a háromszög u területe az oldalak x, y, z hosszúságának u = f(x, y, z) függvénye.
345
159. ábra. Félgömb
160. ábra. Hiperbolikus paraboloid
Ugyanúgy, ahogyan az egyváltozós függvény geometriai ábrázolása görbe volt, a kétváltozós u = f(x, y) függvény geometriai ábrázolása felület a háromdimenziós térben, melynek koordinátái x, y és u. Az x, y sík minden pontjához hozzárendeljük a tér egy p pontját, melynek koordinátái x, y és u = f(x, y). Így pl. az u = 1 − x2 − y2 függvény olyan gömbfelülettel ábrázolható, amelynek egyenlete u2 + x2 + y2 = 1 (159. ábra), az u = ax + by + c lineáris függvény síkkal ábrázolható, az u = xy függvény hiperbolikus paraboloiddal (160. ábra) stb.
161. ábra. Egy u = f(x, y) felület,
346
162. ábra. . . . és a megfelelő szintvonalak
163. ábra. Egy u = x + y függvény szint- 164. ábra. Forgásparabo- 165. ábra. . . . és a megfelevonalai loid, lő szintvonalak Ábrázolható az u = f(x, y) függvény másféleképpen is, tisztán az x, y síkban, szintvonalak segítségével. Ahelyett, hogy az u = f(x, y) függvény háromdimenziós „tájképét” tekintenénk, úgy járunk el, mint a térkép szerkesztésekor, meghúzva a függvény nívógörbéit, kijelölve az x, y síkon azoknak a pontoknak a vetületét, amelyek azonos u magasságban vannak a sík felett. Ezek a szintvonalak egyszerűen az f(x, y) = c görbék, ahol c egy-egy görbére állandó. Így pl. az u = x + y függvényt a 163. ábra jellemzi. Egy gömbfelület szintvonalai koncentrikus körök. A forgásparaboloidot előállító u = x2 + y2 függvény szintén koncentrikus körökkel jellemezhető (165. ábra). Az egyes görbékhez írt számokkal jelölhetjük a görbék u = c magasságát. Több változós függvények a fizikában akkor fordulnak elő, ha folytonos közeg mozgását kell leírni. Tegyük fel pl., hogy az x-tengely két pontja között kifeszített húrt úgy deformálunk, hogy a húr x koordinátájú részecskéjét az x-tengelyre merőlegesen adott távolsággal elmozdítjuk. Ha most elengedjük a húrt, rezgésbe kezd, s az eredetileg x koordinátájú részecske t időben u = f(x, t) távolságra lesz az x-tengelytől. A mozgást akkor írtuk le teljesen, ha ismerjük az u = f(x, t) függvényt. Az egyváltozós függvényekre megadott folytonosságdefiníció közvetlenül átvihető több változós függvényekre. Az u = f(x, y) függvényt akkor nevezzük az x = x1 , y = y1 pontban folytonosnak, ha f(x, y) mindig az f(x1 , y1 ) értékhez tart, bármilyen irányból közeledjék is x, y pont az x1 , y1 ponthoz. Van azonban egy fontos különbség az egy- és több változós függvények között. Az utóbbi esetben ugyanis nincsen értelme az inverz függvény fogalmának, mivel valamilyen
347
u = f(x, y) egyenletet, pl. az u = x + y egyenletet, nem lehet úgy megoldani, hogy x és y független mennyiségek mindegyike kifejezhető legyen egyetlen u mennyiséggel. De az egy- és több változós függvényeknek ez a különbsége is eltűnik, ha a függvény lényegét abban látjuk, hogy leképezést vagy transzformációt definiál. *7. Függvény és transzformáció Jellemezzük egy l egyenes pontjait az egyenes mentében vett x koordinátákkal, egy másik, l 0 egyenes pontjait ezen egyenes mentében vett x 0 koordinátákkal. Az l és az l 0 egyenes pontjai közötti vonatkozás nem egyéb, mint egy x 0 = f(x) függvény. Ha a vonatkozás kölcsönösen egyértelmű, létezik az x = g(x 0 ) inverz függvény is. A mondottakra legegyszerűbb példa lehet a vetítés által képviselt transzformáció, amelyet általánosságban x 0 = f(x) = (ax + b)/(cx + d) alakú függvény jellemez, ahol a, b, c állandók. Az állítás bizonyításától itt eltekintünk. Ebben az esetben az inverz függvény x = g(x 0 ) = (−dx 0 + b)/(cx 0 − a). Az x, y koordinátákkal ellátott π sík leképezése két dimenzióban az x 0 , y 0 koordinátákkal behálózott π 0 síkra nem állítható elő egyetlen x 0 = f(x) fügvénnyel, hanem két kétváltozós függvényt igényel: x 0 = f(x, y), y 0 = g(x, y). Pl. projektív transzformációt az ax + by + c , gx + hy + k dx + ey + f y0 = gx + hy + k x0 =
függvényrendszer ad meg, ahol a, b, . . ., k állandók, x, y koordináták az egyik, x 0 , y 0 pedig a másik síkban. Ebből a szempontból már van értelme az inverz transzformáció fogalmának. Egyszerűen meg kell oldanunk ezt az egyenletrendszert x-re és y-ra, ki kell fejeznünk explicit alakban x-et és y-t ebből az egyenletrendszerből x 0 -vel és y 0 -vel. Geometriailag ez annyi, mint megkeresni az inverz leképezést: π 0 leképezését π-re. Ez
348
az inverz leképezés egyértelműen definiálva van, feltéve, hogy a két sík pontjai között kölcsönösen egyértelmű vonatkozás létesíthető. A síknak a topológiában tanulmányozott transzformációit nem egyszerű algebrai egyenletek adják meg, hanem bármilyen x 0 = f(x, y), y 0 = g(x, y) függvényrendszer, amely kölcsönösen egyértelmű és kölcsönösen folytonos transzformációt definiál. Feladatok: *1) Mutassuk ki, hogy az a transzformáció, amelyet az egységkörre vonatkozó inverzió (III. fejezet, 177. o.) képvisel, analitikusan x 0 = x/(x2 +y2 ), y 0 = y/(x2 +y2 ) egyenletekkel adható meg. Keressük meg az inverz transzformációt. Bizonyítsuk be analitikusan, hogy az inverzió az egyeneseket és köröket újból egyenesekbe és körökbe viszi át. 2) Bizonyítsuk be, hogy az x 0 = (ax + b)/(cx + d) transzformáció az x-tengely négy pontját kettősviszonytartó módon képezi le az x 0 -tengely négy pontjára. (L. 218. o.)
2. § Határérték 1. Az an sorozat határértéke Láttuk az 1. §-ban, hogy a függvény folytonosságának a fogalma a határérték fogalmán alapul. A határérték fogalmát az eddigiekben többé-kevésbé szemléletes módon alkalmaztuk. A jelen, s a következő pontokban rendszeresebben fogjuk ezt tárgyalni. Mivel a sorozatok lényegesen egyszerűbb matematikai képződmények, mint egy folytonos változó függvényei, a sorozatokkal kezdjük a tárgyalást. Találkoztunk már a II. fejezetben a számok an sorozatával, és tanulmányoztuk határértéküket n minden határon túl való növekedésének esetében, vagy ahogy mondjuk, abban az esetben, ha „n tart a végtelenhez”. Pl. annak a sorozatnak, melynek n-edik tagja an = 1/n, tehát az 1,
1 1 1 , ,..., ,... 2 3 n
(1)
349
sorozatnak 0 a határértéke növekvő n-re: 1 → 0 ha n → ∞. n
(2)
Kíséreljük meg pontosan meghatározni, mit is értünk ezen a kifejezésen. Egyre messzebb haladva a sorozatban, a tagok egyre kisebbek és kisebbek lesznek. A 100. tag után pl. minden tag kisebb már 1/100-nál, az 1000. tag után 1/1000-nél, és így tovább. Ténylegesen egyetlen tag sem lesz soha nullával egyenlő. De ha elég messze megyünk az (1) sorozatban, bizonyosak lehetünk, hogy minden további tag tetszőlegesen kicsiny értékkel fog csupán különbözni 0-tól. Az egyetlen kifogásolható dolog ebben a magyarázatban az, hogy a kurzívan szedett szavak értelme nem egészen világos. Mikor van „elég messze” és milyen kicsi az a „tetszőlegesen kicsiny”? Ha ezeknek a szavaknak pontos értelmét tudjuk adni, akkor pontos értelmét adtuk a határátmenetet kifejező (2) jelölésnek. A helyzetet geometriai interpretáció segítségével tehetjük világosabbá. Ha az (1) sorozat tagjait a számegyenesen nekik megfelelő pontokkal ábrázoljuk, megfigyelhetjük, hogy az így ábrázolt sorozat tagjai a 0 pont körül sűrűsödnek. Válasszunk a számegyenesen tetszőleges I intervallumot, melynek felezőpontja a 0 pont, és teljes hosszúsága 2ε, úgy hogy az intervallum a 0 pont mind a két oldalán ε távolságig nyúlik. Ha ε = 10-et választunk, akkor természetesen a sorozat minden an = 1/n tagja ezen az I intervallumon belül fekszik. Ha ε = 1/10-et választunk, akkor a sorozat elejének néhány tagja ezen az I intervallumon kívül esik, de az a11 tagtól kezdve minden tag, tehát 1 , 11
1 , 12
1 , 13
1 ,... 14
az I intervallumon belül lesz. Még ha ε = 1/1000-et választunk is, csak a sorozat első ezer tagja fog kívül esni az így választott intervallumon, az a1001 tagtól kezdve az összes többi végtelen sok a1001 ,
a1002 ,
a1003 , . . .
tag mind az I intervallumon belül lesz. Világos, hogy ez az okoskodás bármely pozitív
350
ε számra érvényes: mihelyt választottunk egy pozitív ε számot, bármilyen kicsiny is legyen az, mindig találhatunk egy N egész számot, amely olyan nagy, hogy 1 < ε. N Ebből következik, hogy a sorozat minden an tagja melyre n = N az I intervallumon belül fekszik, és csak véges számú a1 , a2 , . . ., aN−1 tagja reked az intervallumon kívül. Az egésznek a lényege két dolog: először is az, hogy I intervallum hosszúságát teljesen tetszőlegesen adjuk meg ε megválasztásával, másodszor pedig az, hogy lehet alkalmas N egész számot találni. Ez az eljárás, hogy ti. először választunk egy ε számot és azután keresünk egy megfelelő N egész számot, bármely pozitív ε szám esetében végrehajtható, akármilyen kicsiny is legyen ε. Éppen ez az eljárás adja pontos értelmét annak az állításnak, hogy az (1) sorozat minden tagja tetszőlegesen kicsiny értékkel különbözik 0-tól, feltéve, hogy elég messze haladtunk a sorozatban. Foglaljuk össze az eddigieket. Legyen ε tetszőleges pozitív szám. Akkor mindig találhatunk olyan N egész számot, hogy az (1) sorozat minden an tagja amelyre n = N a 0 felezőpontú 2ε hosszúságú I intervallumon belül fekszik. Ez a pontos jelentése a határátmenet (2) jelölésének. Ennek a példának alapján mármost pontosan definiálhatjuk, mi az értelme annak az általános állításnak, hogy „a valós számok a1 , a2 , a3 , . . . sorozatának a a határértéke”. Zárjuk be a-t egy I intervallumba a számegyenesen. Ha az intervallum kicsiny, az an számok közül néhány kívül rekedhet az intervallumon, de mihelyt n elegendő nagy lesz, nagyobb mondjuk, mint egy N egész szám, minden an számnak, amelyre n = N az intervallumon belül kell lennie. Természetesen megtörténhet, hogy igen nagy N egész számot kell vennünk, ha az I intervallumot igen kicsire választottuk, azonban akármilyen kicsiny is legyen az I intervallum, mindig kell léteznie ilyen N egész számnak, ha azt akarjuk, hogy a sorozatnak legyen egy a határértéke. Azt a tényt, hogy az an sorozatnak a a határértéke, következőképpen jelöljük: lim an = a,
ha n → ∞,
351
vagy egyszerűen an → a,
ha n → ∞
(olvasd: an tart az a-hoz, vagy konvergál a-hoz). Az an sorozat a-hoz való konvergálásának a definícióját következőképpen lehet tömörebben megfogalmazni: akkor mondjuk, hogy az a1 , a2 , a3 , . . . sorozat határértéke a, amikor n tart a végtelenhez, hogyha bármely tetszőlegesen kicsiny pozitív ε számhoz található olyan (ε-tól függő) N egész szám, hogy |an − a| < ε
(3)
legyen minden n=N értékre. Ez sorozat esetében a határértékfogalom absztrakt megfogalmazása. Nem csoda, hogy első látásra nem lehet a mélyére hatolni. Sok tankönyvírónak az a – szerencsétlen, sőt egyenesen sznob és nagyképű – felfogása, hogy ezt a definíciót rögtön, alapos előkészítés nélkül kell adni, mintha a magyarázat a matematikus méltóságához nem illő dolog volna. A definíció két ember, A és B egymásra való rálicitálására emlékeztet. A azt a követelményt támasztja, hogy egy rögzített a mennyiséget egy választott ε = ε1 hibahatáron belüli pontossággal kell megközelíteni valamely an mennyiséggel. B a követelményt annak a bizonyításával elégíti ki, hogy kimutatja egy olyan N = N1 egész szám létezését, amelynek megfelelő aN1 elemen túl minden an kielégíti az ε1 -követelményt. Erre A még igényesebb lesz, és új, kisebb ε = ε2 hibahatárt tűz ki. B megállja ezt a követelményt is, azáltal hogy egy új, (talán sokkal) nagyobb N = N2 egész számot talál. Ha B mindig meg tud felelni az A által állított követelménynek, akármilyen kicsire is tűzi ki A a hibahatárt, akkor előttünk áll az an → a jelölés által kifejezett helyzet. A határérték pontos fogalmának megértését erősen gátolja egy pszichológiai természetű akadály. Szemléletünk ugyanis a határérték „dinamikus” felfogását kínálná, ami szerint a határérték valamilyen „mozgási” folyamat eredménye lenne: az 1, 2, 3, . . ., n, . . .
352
egész számokon át haladva előre megfigyelnénk az an sorozat viselkedését. Úgy érezzük, hogy ezen az úton az an → a határátmenet megfigyelhető lenne. Azonban ennek a „természetes” felfogásnak egyáltalában nem lehet pontos, matematikai megfogalmazását adni. Ha pontos definícióhoz akarunk jutni, meg kell fordítani a lépések sorrendjét: ahelyett, hogy először tekintenénk az n független változót és csak azután az an függő változót, arra kell alapoznunk a definíciónkat, hogy mit kell tennünk, ha ténylegesen ki akarjuk próbálni az an → a állítást. Egy ilyen eljárásban először is egy tetszőlegesen kicsi hibahatárt kell választanunk a körül, és meg kell állapítanunk, vajon kielégíthető-e ez a feltétel elegendően nagy n független változót véve. Ha igen, akkor azokat a szavakat, hogy „tetszőlegesen kicsiny hibahatár”, meg hogy „elegendően nagy n” szimbolikusan ε-nak meg N-nek kereszteljük el, s a határérték pontos definíciójára jutunk. Tekintsük másik példaként az n 1 2 3 4 , , , ,..., ,... 2 3 4 5 n+1 sorozatot, ahol an = n/(n + 1). Azt állítom, hogy lim an = 1. Ha olyan intervallumot választunk, melynek felezőpontja az 1 pont és amelyre ε = 1/10, akkor (2) követelmény kielégíthető N = 10 választásával; mivel 01− = = an . n+2 n+2 n+1 n+1
Ilyen sorozatot, amelyben an+1 > an , monoton növekvő sorozatnak nevezünk Ugyanígy az olyan sorozatot, amelyben an > an+1 monoton csökkenő sorozatnak nevezzük. Monoton csökkenő sorozat pl. az 1, 1/2, 1/3, . . . sorozat. Ilyen sorozatok csak egy oldalról közelíthetnek határértékükhöz. Ezzel ellentétben vannak váltakozó sorozatok is, amilyen pl. a −1, +1/2, −1/3, +1/4, . . . sorozat. Ez a sorozat váltakozva, mindkét oldalról közelíti meg a 0 határértéket (l. 11. ábra, 85. o.). A monoton sorozat viselkedését könnyű meghatározni. Lehetséges, hogy a monoton sorozatnak egyáltalán nincs határértéke, a sorozat minden határon túl nő, amilyen pl. az 1, 2, 3, 4, . . . sorozat, ahol an = n, vagy a 2, 3, 5, 7, 11, 13, . . . sorozat, ahol an az n-edik prímszám, pn . Ebben az esetben a sorozat a végtelenhez tart. De ha egy monoton növekvő sorozat korlátos – azaz, ha minden tagja kisebb egy előre ismert B felső korlátnál –, akkor intuitíve világos, hogy a sorozatnak valamely a határértékhez kell tartani, amely kisebb, vagy legfeljebb akkora, mint B. A mondottakat mint a monoton sorozatok elvét fogalmazzuk meg: bármely felső korláttal rendelkező monoton növekvő sorozatnak konvergálnia kell valamely határértékhez.
166. ábra. Monoton korlátos sorozat (Hasonló állítás érvényes bármely alsó korláttal rendelkező monoton csökkenő sorozatra.) Figyelemre méltó, hogy az a határérték értékének nem kell előre ismertnek
356
vagy megadottnak lennie; a tétel azt állítja, hogy az előírt feltételek mellett a határérték létezik. Ez a tétel természetesen az irracionális számok bevezetésén nyugszik, e nélkül nem lenne igaz minden esetben; hiszen, amint a II. fejezetben láttuk, bármely irracionális √ szám (pl. 2) racionális tizedes törtek monoton növekvő sorozatának a határértéke, amely racionális tizedes törteket valamely végtelen tizedes tört n-edik számjegynél való megszakításával kapjuk. * Jóllehet a monoton sorozatok elve szemléletünk előtt nyilvánvaló igazság, tanulságos lesz, ha modern szokás szerinti, szigorú bizonyítását adjuk. Ehhez azt kell kimutatnunk, hogy az elv a logika szabályai szerint következik a valós szám és a határérték definíciójából. Tegyük fel, hogy az a1 , a2 , a3 , . . . számok monoton növekvő, korlátos sorozatot képeznek. Kifejezhetjük ennek a sorozatnak a tagjait végtelen tizedes tört alakjában: a1 =A1 ,p1 p2 p3 . . . , a2 =A2 ,q1 q2 q3 . . . , a3 =A3 , r1 r2 r3 . . . , ··· ··· ahol az Ai -k egész számok, a pi -k, qi -k stb. pedig 0-tól 9-ig terjedő számjegyek. Menjünk most végig az A1 , A2 , A3 , . . . egész számok oszlopán. Mivel az a1 , a2 , a3 , . . . sorozat korlátos, ezek az egész számok nem növekedhetnek minden határon túl, és mivel az a1 , a2 , a3 , . . . sorozat monoton növekvő, az egész számok A1 A2 , A3 , . . . sorozata egy maximális érték elérése után állandó marad. Nevezzük ezt a maximális értéket A-nak, és tételezzük fel, hogy az N0 -adik sorban értük el. Haladjunk most lefelé a második, p1 , q1 , r1 , . . . oszlopon, és fordítsuk figyelmünket az N0 -adik és az azt követő sorokban levő tagjaira. Ha x1 az a legnagyobb számjegy, amely az N0 -adik sor után előfordul, akkor x1 ezen első fellépte után állandóan megmarad. Ugyanis, ha a következőkben valahol csökkenhetne ez a számjegy a p1 , q1 , r1 , . . . oszlopban, az a1 , a2 , a3 , . . . sorozat nem lehetne monoton növekvő. Mondjuk, hogy ez az x1 számjegy az N1 -edik sorban lép fel először, ahol N1 = N0 . Tekintsük azután a harmadik oszlop p2 , q2 , r2 , . . . számjegyeit. Hasonló érveléssel kimutatható, hogy egy meghatározott N2 = N1 egész szám után a harmadik oszlop számjegyei állandóan valamely x2 számjeggyel lesznek egyenlők. Ismételve az eljárást a 4., 5., . . . oszlopban, x3 , x4 , x5 , . . . számjegyeket s a megfelelő N3 , N4 , N5 , . . . egész számokat
357
kapjuk. Könnyű belátni, hogy az a1 , a2 , a3 , . . . sorozat határértéke az a = A, x1 x2 x3 x4 . . . szám. Ugyanis, ha ε-t úgy választjuk, hogy = 10−m legyen, akkor minden n = Nm -re an egész része és a tizedesvessző utáni első m helyen álló számjegy azonos lesz a egész részével és első m tizedesével, s így az |a − an | különbség nem haladhatja meg a 10−m -et. Mivel ezt, m-et elég nagyra választva, bármely pozitív ε-ra be lehet bizonyítani, akármilyen kicsiny is ez az ε szám, a tétel bizonyítást nyert. Be lehet bizonyítani a tételt a valós számnak a II. fejezetben közölt bármelyik más definíciója alapján is; pl. az intervallumskatulyázáson vagy a Dedekind-szeleten alapuló definíció alkalmazásával. Ilyen bizonyításokat a legtöbb felsőbb analízis tankönyvben meg lehet találni. Használhattuk volna a monoton sorozatok elvét a II. fejezetben két pozitív végleten tizedes tört összegének és szorzatának a definiálására. Két a = A, a1 a2 a3 . . . b = B, b1 b2 b3 . . . végtelen tizedes törtet nem lehet közönséges módon, jobbról balra haladva összeadni vagy összeszorozni, mert nincs végük, ahonnan elindulhatnánk. (Próbálja meg az olvasó összeadni a 0, 333333 . . . és a 0, 989898 . . . végtelen tizedes törtet.) Azonban, ha xn azt a véges tizedes törtet jelöli, amelyet a és b kifejezésének az n-edik tizedes helyen való megszakításával nyert két véges tizedes törtnek az összeadásával kapunk, akkor az x1 , x2 , x3 , . . . sorozat monoton növekvő és korlátos lesz (lehet a felső korlát pl. A + B − 2). Ennek a sorozatnak tehát van határértéke, és bevezethetjük az a + b = lim xn definíciót. Hasonló eljárás szolgál az ab szorzat definiálására. Ezeket a szabályokat azután az aritmetika közönséges szabályainak a segítségével ki lehet bővíteni úgy, hogy azokat az eseteket is magukba foglalják, amikor a és b pozitív vagy negatív. Feladat: Mutassuk ki ezen a módon, hogy a fentebb említett két végtelen tizedes tört összege az 1, 323232 . . . = 131/99 valós szám. A határérték fogalom azért olyan fontos a matematikában, mert sok szám csak mint határérték van definiálva – gyakran éppen mint monoton korlátos sorozat határértéke. Ezért van az, hogy a racionális számtest, amelyben efféle határértékek nem léteznek, túl szűk a matematika céljaira.
358
3. Az Euler-féle e szám Az e szám Euler 1748-ban megjelent Introductio in Analysin Infinitorum című munkája óta éppen olyan alapvető fontosságú a matematikában, mint az Arkhimédeszféle π szám. Az e szám bevezetése kitűnő példája, hogyan lehet a monoton sorozatok elvét új valós számok definiálására használni. Vezessük be az első n egész szám szorzatának a jelölésére az n! jelölést: n! = 1 · 2 · 3 · 4 . . . n, és tekintsük azt az a1 , a2 , a3 , . . . sorozatot, melynek általános tagja an = 1 +
1 1 1 + + ... + . 1! 2! n!
(4)
Az an tagok monoton növekvő sorozatot képeznek, mivel an+1 úgy keletkezik an -ből, hogy hozzáadjuk az 1/(n+1)! pozitív növekményt. Továbbá an értékei felülről korlátosak: an < B = 3.
(5)
Ugyanis 1 1 1 1 1 1 1 1 = · · . . . · < · · . . . · = s−1 , s! 2 3 s 2 2 2 2 tehát 1 1 1 1 + 2 + 3 + . . . + n−1 = 2 2 2 2 n n 1 − 12 1 =1+ =1+2 1− < 3, 1 2 1− 2
an < 1 + 1 +
a geometriai sor első n tagjának az összegére a 15. oldalon megadott képletet felhasználva. Tehát a monoton sorozatok elve szerint an -nek határértékhez kell tartani, ha n tart a végtelenhez, és ezt a határértéket nevezzük e-nek. Írjuk fel e-t „végtelen sor” alakjában,
359
hogy kifejezzük vele ezt a tényt, hogy e = lim an : e=1+
1 1 1 1 + + + ... + + ... . 1! 2! 3! n!
(6)
Ez az „egyenlőség”, a végén a három ponttal, egyszerűen más kifejezési módja annak a két állításnak, hogy an = 1 +
1 1 1 + + ... + 1! 2! n!
és, hogy an → e,
ha
n → ∞.
A (6) sor lehetővé teszi e tetszőleges pontossággal való kiszámítását. Pl. (6) sor P = 2, 71828183 . . . . tagjainak 1/12!-sal bezárólag vett (kilenc számjegyig leírt) összege (Ellenőrizze az olvasó ezt az eredményt.) A „hiba”, azaz e így adott értéke és tényleges P értéke közötti eltérés könnyen megbecsülhető. Az (e − ) különbségre felírhatjuk az 1 1 1 + + ... < 13! 14! 13!
1 1 1 1 1 = + 2 + ... = · 1+ 1 13 13 13! 1 − 13 12 · 12!
kifejezést. Ez olyan kicsiny, hogy nincs hatással
P
kilencedik tizedesére. Tehát, megen-
gedve a fenti érték utolsó számjegyében az említett hibát, e = 2, 7182818, hét tizedes pontosságig. * Az e szám irracionális. Ezt indirekt úton bizonyítjuk be, feltételezve, hogy e = p/q, ahol p és q egész számok, azután ebből a feltételből ellentmondást vezetünk le. Mivel tudjuk, hogy 2 < e < 3, e nem lehet egész szám, és ezért q legalább 2 kell legyen. Szorozzuk meg (6) mindkét oldalát q! = 2 · 3 . . . q-val: e · q! = p · 2 · 3 · . . . · (q − 1)
(7)
= [q! + q! + 3 · 4 . . . q + 4 · 5 . . . q + . . . + (q − 1)q + q + 1]+ +
1 1 + + ... q + 1 (q + 1)(q + 2)
A bal oldalon nyilvánvalóan egy egész szám áll. A jobb oldalon a zárójelben levő tag szintén egész szám. A jobb oldal hátralevő része azonban 1/2-nél kisebb pozitív szám, és így nem lehet egész
360
szám. Ugyanis q = 2, tehát az 1/(q + 1) + . . . sor tagjai nem nagyobbak az 1/3 + 1/32 + 1/33 + . . . geometriai sor megfelelő tagjainál, ennek a geometriai sornak az összege pedig
1 3
·
1 1−1/3
= 1/2.
Tehát a (7)-ben ellentmondás van: a bal oldalon álló egész szám nem lehet egyenlő a jobb oldalon álló számmal, mivel az utóbbi szám, lévén egy egész szám és egy 1/2-nél kisebb pozitív szám összege, nem lehet egész szám.
4. A π szám
167. ábra. A kör megközelítése sokszögvonalakkal Jól ismert az általános iskolai matematikából, hogy az egységsugarú kör kerületének hosszúságát egyre növekvő oldalszámú szabályos sokszögek hosszúságából alkotott sorozat határértékeként lehet definiálni. Az így definiált körkerület hosszúságát 2π-vel jelöljük. Pontosabban, ha pn jelenti a körbe írt, qn pedig a kör körül írt szabályos n-szög kerületének a hosszúságát, akkor pn < 2π < qn . Továbbá n növekedtével a pn és a qn sorozat egyaránt monoton tart 2π-hez, és minden lépéssel kisebb lesz 2π-nek pn vagy qn általi megközelítésének a hibája. Az m − 1 egymásba skatulyázott négyzetgyököt tartalmazó r p 2m = 2
m
q √ 2 − 2 + 2 + ...
kifejezés segítségével, amelyet a 155. oldalon találtunk, kiszámíthatjuk 2π megközelítő értékét. Feladatok: 1) Keressük meg π közelítő értékét p4 , p8 , p16 esetén.
361
*2) Keressünk képletet q2m számára. *3) Alkalmazzuk ezt a képletet q4 , q8 és q16 megtalálására. p16 és q16 ismeretében adjuk meg, milyen korlátok közt kell feküdni π-nek.
Mi a π szám? A pn < 2π < qn egyenlőtlenségből tökéletes választ kaphatunk a kérdésre, 2π pontra mint magra intervallumskatulyázást építve fel. Ez a válasz mégis hagy maga után valami kívánnivalót, mert semmit sem mond π-nek mint valós számnak a természetéről: nem tudjuk, racionális vagy irracionális, algebrai vagy transzcendens szám-e? Amint azt a 175. oldalon említettük, π transzcendens szám, tehát irracionális. Ellentétben e-vel, π irracionalitásának bizonyítása meglehetősen nehéz, úgyhogy itt eltekintünk tőle. π irracionalitását először J. H. Lambert (1728–1777) bizonyította. Vannak viszont π-nek egyéb, könnyebben hozzáférhető tulajdonságai is, amelyeket e könyvben is ismertethetünk. Visszaemlékezve arra az állításunkra, hogy a matematika alapanyagát az egész számok képezik, kérdezhetjük, hogy vajon van-e π-nek valamilyen egyszerű módon kifejezhető köze az egész számokhoz. π tizedes törtekbe való kifejtése, jóllehet elvégezték már néhány száz tizedes pontosságig, semmiféle szabályszerűséget sem árul el. Ez nem meglepő, hiszen π-nek és 10-nek nincs semmi köze egymáshoz. De Euler és mások is, a XVIII. században, szép kifejezéseket találtak, amelyek végtelen sorok és szorzataik segítségével kapcsolatot létesítenek π és az egész számok között. Talán legegyszerűbb ilyen kifejezés a π 1 1 1 = 1 − + − + ... 4 3 5 7 képlet, amely π/4-et az sn = 1 −
1 1 1 + − . . . + (−1)n 3 5 2n + 1
részletösszegek határértékeként fejezi ki minden határon túl növekvő n-re. Ezt a képletet a VIII. fejezetben fogjuk levezetni. Másik végtelen sor π-re π2 1 1 1 1 1 1 = 2 + 2 + 2 + 2 + 2 + 2 + ... . 6 1 2 3 4 5 6 Egy további meglepő kifejezést fedezett fel π-re John Wallis (1616–1703) angol
362
matematikus. Formulája azt állítja, hogy
2n 2n 2 2 4 4 6 6 · · · · · · ... · 1 3 3 5 5 7 2n − 1 2n + 1
→
π , 2
ha n → ∞.
Írják ezt néha a rövidített 2 2 4 4 6 6 8 8 π = · · · · · · · ... 2 1 3 3 5 5 7 7 9 alakban is. A jobb oldalon álló kifejezést végtelen szorzatnak nevezik. Az utóbbi két formulának a levezetését meg lehet találni a differenciál- és integrálszámítás bármely nagyobb tankönyvében (l. 584. és 659. oldalt). *5. Lánctörtek Érdekes határátmenetek szerepelnek a lánctörtekkel kapcsolatban. Véges lánctört, mint amilyen pl. az 1
57 =3 17
1 2+ 1 1+
5
racionális számot állít elő. A 59. oldalon láttuk, hogy minden racionális szám felírható ilyen alakban az euklidészi algoritmus segítségével. Azonban irracionális számok esetében az algoritmus nem fejeződik be véges számú lépés után. Nem fejeződik be, hanem minden határon túl növekvő hosszúságú törtek sorozatához vezet, amelyek mindegyike egy-egy racionális számot állít elő. Speciálisan minden 2 fokszámú algebrai szám (l. 127. o.) √ kifejezhető ilyen módon. Tekintsük pl. az x = 2 − 1 számot, amely az x2 + 2x = 1,
vagy
x=
1 2+x
363
másodfokú egyenlet gyöke. Ha a jobb oldalon x-et újból 1/(2 + x) kifejezéssel helyettesítjük, az eredmény 1 x= 1 2+
2+x
lesz, azután 1 x= 1 2+ 1 2+
2+x
és így tovább, úgyhogy az n-edik lépés után az
1 x= 1 2+ 1 2+ ..
.+
1 2+x
n lépés
„végtelen lánctört”-et kapjuk. Ez az érdekes képlet sokkal meglepőbb összefüggést tár √ √ fel 2 és az egész számok között, mint 2 tizedes tört formában való kifejezése, amely semmiféle szabályosságot sem árul el a számjegyek egymásutánjában. Bármely x2 = ax + 1,
364
vagy
x=a+
1 x
alakú másodfokú egyenlet pozitív gyökére érvényes az 1 x=a+ 1 a+ 1 a+
. a + ..
lánctörtbe fejtés. Legyen pl. a = 1, akkor azt kapjuk, hogy √ 1 x = (1 + 5) = 1 + 2
1 1 1+ 1 1+
. 1 + ..
(l. 152. o.). Ezek a példák egy általános tétel speciális esetei. Az általános tétel azt állítja, hogy egész együtthatójú másodfokú egyenletek valós gyökei periodikus lánctörtekbe fejthetők, éppen úgy, mint ahogy a racionális számok szakaszos tizedes törtekbe. Euler nek sikerült csaknem egyformán egyszerű végtelen lánctörtbefejtést találni e és π számára. Az alábbiakban bizonyítás nélkül közöljük az Euler által megadott végtelen lánctörteket: 1 e=2+ 1 1+ 1 2+ 1 1+ 1 1+ 1 4+ 1 1+ 1 1+
. 6 + ..
365
1 e=2+ 1 1+ 2 2+ 3 3+ 4 4+
. 5 + ..
1
π = 4
12 1+ 32 2+ 52 2+ 72 2+ 92 2+ . 2 + ..
3. § Függvény határértéke folytonos megközelítéssel 1. Bevezetés. Általános definíció A 2. § 1. pontjában sikerült pontosan megfogalmaznunk azt az állítást, hogy „az an sorozat (azaz az n egész számmal mint változóval definiált an = F(n) függvény) határértéke a, ha n tart a végtelenhez”. Most ennek megfelelően definiáljuk azt az állítást, hogy „a folytonos x változó u = f(x) függvényének határértéke a, ha x tart x1 -hez”. Ennek a határértékfogalomnak szemléletes változatát használtuk az 1. § 5. pontjában az x független változó folytonos megközelítésénél f(x) függvény folytonosságának a vizsgálatára. Kezdjük megint speciális példával. Az f(x) =
x+x3 x
függvény x minden értékére
definiálva van, kivéve az x = 0 helyet, ahol a nevező eltűnik. Ha ezt az u = f(x) függvényt grafikusan ábrázoljuk a 0 környezetében fekvő x értékekre, szemmel látható
366
168. ábra. u =
x+x3 x
lesz, hogy ha x bármelyik oldalról „közeledik” 0-hoz, a megfelelő u = f(x) érték 1-hez „közeledik” mint határértékhez. Keressük meg az f(x) érték és a rögzített 1 szám közötti különbség explicit kifejezését, hogy az említett „közeledés”-nek pontos megfogalmazását adhassuk. Ez a különbség x + x3 − x x3 x + x3 −1= = . f(x) − 1 = x x x Ha megegyezünk abban, hogy csak 0-hoz közeli értékeket tekintünk és sohasem magát az x = 0 értéket (amelyre f(x) még definiálva sincsen), az egyenlet jobb oldalán álló kifejezés számlálóját is meg nevezőjét is eloszthatjuk x-szel, ami által az egyszerűbb f(x) − 1 = x2 formulát kapjuk. Nyilvánvaló, hogy ezt a különbséget tetszés szerinti kicsinnyé tehetjük, ha x-et 0 elegendően kicsiny környezetére korlátozzuk. Így pl. x = ±1/10-re f(x) − 1 = 1/100; x = ±1/100-ra f(x) − 1 = 1/10 000, és így tovább. Általánosabban, ha ε bármely, tetszőlegesen kicsiny pozitív szám, az f(x) és 1 közötti √ különbség kisebb lesz, mint ε, feltéve, hogy az x 0-tól való távolsága kisebb, mint δ = ε szám. Ugyanis ha |x|
0. Azonban J intervallum rögzített, és ha n elegendő nagy, a kicsiny In intervallumnak szükségképpen J intervallumban kell lennie, hiszen az In sorozat nullára zsugorodik. Ez azonban ellentmondásra vezet, mivel In választási módjából következik, hogy az f(x) függvény előjele mindegyik In két végpontjában ellenkező, úgyhogy f(x)-nek valahol J-ben negatív értéke kell, hogy legyen. Tehát f(α) > 0 és (ugyanígy) f(α) < 0 lehetetlensége bizonyítja, hogy f(α) = 0. *3. Weierstrass tétele szélső értékek létezéséről A folytonos függvényekre vonatkozó másik fontos és szemléletesen belátható tényt fogalmazott meg Karl Weierstrass (1815–1897), akinek talán mindenkinél nagyobb volt a szerepe abban, hogy a modern szigorúságra való törekvést bevezették a matematikai analízisbe. A tétel azt állítja, hogy ha egy f(x) függvény egy I, a 5 x 5 b intervallumban, az intervallum végpontjait is beleértve, folytonos, akkor léteznie kell az I intervallumban legalább egy pontnak, ahol f(x) legnagyobb M értékét, és egy másik pontnak, ahol legkisebb m értékét veszi fel. Szemléletesen szólva, ez annyit jelent, hogy az u = f(x) folytonos függvényt ábrázoló görbének kell legyen legalább egy legmagasabban fekvő és legalább egy legalacsonyabban fekvő pontja. A tétel tartalma annyira világos, hogy a bizonyítás szükségessége túlzott pedantériának látszhatna. Bár a matematika legnagyobb teljesítményeit anélkül érték el, hogy a szigorú bizonyítást megkövetelték volna, a fejlődés mai állapotában nem engedhető meg, hogy az analízis rendszeres felépítésénél a Weierstrass-tételt triviálisnak tekintsük. Azt, hogy szó sincsen logikai trivialitásról, már az a tény is mutatja, hogy a tétel nem érvényes pl. azon függvény esetében, amelyet az:
f(x) =
x
ha x irracionális,
1
ha racionális
2
előírás definiál a 0 5 x 5 1 intervallumban. Ez a függvény mindig 0 és 1 közötti értékeket vesz fel, mégpedig 0-hoz és 1-hez tetszőlegesen közeli értékeket, ha x-et 0-hoz vagy 1-hez
380
elegendően közel fekvő irracionális számnak vesszük fel. Azonban f(x) sohasem lehet egyenlő sem 0-val, sem 1-gyel, mivel racionális x-re f(x) = 12 , és irracionális x-re f(x) = x. Azért sohasem veszi fel sem a 0, sem az 1 értéket. *Weierstrass tételét a Bolzanóéhoz igen hasonló módon lehet bizonyítani. Felosztjuk I-t két zárt félintervallumra, I 0 -re és I 00 -re, s I 0 intervallumra fordítjuk a figyelmünket, mint amelyikben az f(x) legnagyobb értékét keresni kell, hacsak nincsen I 00 -ben egy olyan α pont, ahol f(α) minden I 0 -beli pontban vett f(x) értéknél nagyobb; ebben az esetben I 00 intervallumot választjuk ki. Nevezzük az így kiválasztott intervallumot I1 -nek. Most ugyanúgy járunk el I1 -gyel, mint az előbb I-vel, s így egy I2 intervallumot kapunk, és így tovább. Az eljárás egymásba skatulyázott intervallumok I1 , I2 , . . ., In , . . . sorozatát definiálja, az intervallumskatulyázás magva valamely z pont. Be fogjuk bizonyítani, hogy az f(x) által I intervallumban elért legnagyobb érték az f(z) = M, azaz hogy nem létezhet I-ben olyan s pont, amelyre f(s) > M lenne. Tegyük fel, hogy léteznék ilyen s pont amelyre f(s) = M + 2ε lenne, ahol ε valamely (talán nagyon kicsi) pozitív szám. Kijelölhetünk z mint felezőpont körül egy kicsiny K intervallumot úgy, hogy s kívül essék rajta és, hogy – ez f(x) folytonos volta miatt lehetséges – f(x) értékei K-ban ε-nál kevesebbel különbözzenek f(z) = M-től, s így K-ban bizonyosan áll az f(x) < M + ε egyenlőtlenség. Elegendően nagy n-re azonban In intervallum K intervallum belsejében fekszik, és In -et úgy definiáljuk, hogy f(x) egyetlen In -en kívüli x-re felvett értéke sem lehet nagyobb mindegyik In belsejében levő x helyen felvett f(x) értéknél. Mivel s In intervallumon kívül van, és f(s) > M + ε, továbbá mivel K-ban, és így In -ben is f(x) < M + ε, ellentmondásra jutottunk. Hasonlóan lehet bizonyítani egy legkisebb m érték létezését, de közvetlenül is következik a már bebizonyítottakból, mivel f(x) legkisebb értéke g(x) = −f(x) legnagyobb értéke. Hasonlóképpen lehet bizonyítani Weierstrass tételét két- vagy több változós függvények esetében. Ha kettő vagy több x, y, . . . független változónk van, az intervallum és két végpontja helyett egy zárt tartományt kell tekintenünk, pl. egy négyszöget az x, y síkban, beleértve a négyszöget határoló négyszögvonalat is. Feladat : Hol használtuk Bolzano és Weierstrass tételének a bizonyításában azt a tényt, hogy f(x)-ről feltételeztük, hogy az egész zárt a 5 x 5 b intervallumban folytonos, s nem csupán az a < x 5 b vagy a < x < b intervallumban?
Bolzano tételének és Weierstrass tételének a bizonyítása kifejezetten nem konstruktív jellegű. A bizonyítás nem szolgáltat módszert a zérushely, vagy a függvény legnagyobb, ill. legkisebb értékéhez tartozó hely véges számú lépésben, előírt pontossággal való tényleges megkeresésére. Csupán a kívánt értékek létezését, vagy még inkább nemlétezésük
381
abszurd voltát bizonyítjuk. Másik fontos példa ez az „intuicionisták” (l. 107. o.) által kifogásolt tételekre. Vannak közöttük, akik szerint az ilyen tételeket egyenesen el kellene távolítani a matematikából. De a matematikát tanulóknak sem kell komolyabban venni az intuicionisták tilalmait, mint ahogyan azt a kritikusok legnagyobb része vette. *4. Egy sorozatokra vonatkozó tétel. Zárt halmazok Legyen x1 , x2 , x3 , . . . különböző vagy azonos számok bármely végtelen sorozata, a számok tartozzanak mind az I, a 5 x 5 b zárt intervallumba. A sorozat lehet konvergens vagy divergens. Azonban bármelyik esetben, mindig ki lehet választani ilyen sorozatból egyes tagok elhagyásával egy olyan végtelen y1 , y2 , y3 , . . . részsorozatot, amely az I intervallumban levő y határértékhez tart. A tétel bizonyítására osszuk az I intervallumot
a+b 2
felezőpontjának a kijelölésével két
zárt intervallumra: I 0 -re és I 00 -re. I0 : a 5 x 5 I 00 :
a+b , 2
a+b 5 x 5 b. 2
Ezeknek legalább egyikében, amelyet nevezhetünk I1 -nek, az eredeti sorozat végtelen sok xn tagjának kell lenni. Válasszunk ki egyet, mondjuk xn1 -et, ezek közül a tagok közül, és nevezzük el y1 -nek. Azután alkalmazzuk ugyanezt az eljárást az I1 intervallumra. Mivel végtelen sok xn tag van I1 -ben, I1 két fele közül egyikben, amelyet I2 -vel jelölünk, végtlen sok tagnak kell lenni. Ezért bizonyosan találunk I2 -ben egy olyan xn tagot, amelyre n > n1 . Válasszunk ki ezek közül egyet, és nevezzük el y2 -nek. Ezt az eljárást folytatva, egymásba skatulyázott intervallumok I1 , I2 , I3 , . . . sorozatát, és az eredeti sorozat egy y1 , y2 , y3 , . . . részsorozatát kapjuk, mégpedig úgy, hogy yn minden n-re In -be tartozik. Ennek az intervallumskatulyázásnak a magva I-nek egy y pontja, és nyilvánvaló, hogy az y1 , y2 , y3 , . . . sorozat határértéke y, ami bizonyítandó volt. *Ezt a megfontolást a modern matematikában tipikus módon lehet általánosítani. Tekintsünk valamely X változót, amely egy általános S halmaz elemeit futja át. Legyen az S halmazban definiálva valamiféle „távolság”-fogalom. Pl. lehet S a sík vagy a tér pontjainak valamely halmaza. Azonban S-nek nem föltétlenül szükséges ponthalmaznak lenni, lehet pl. S a sík összes háromszö-
382
géből álló halmaz. Ha X és Y két háromszög, és A, B, C meg A 0 , B 0 , C 0 a két háromszög csúcsai, akkor a két háromszög „távolságát” d(X, Y) = AA 0 + BB 0 + CC 0 számmal definiálhatjuk, ahol AA 0 stb. az A és A 0 pontok közötti közönséges távolságot jelölik. Valahányszor létezik egy S halmazban ilyen „távolság”-fogalom, mindig definiálhatjuk az X1 , X2 , X3 , . . . elemek S egy X eleméhez tartó sorozatának a fogalmát. Azon, hogy az Xn sorozat X-hez konvergál azt értjük, hogy d(X, Xn ) → 0, ha n → ∞. Hogyha S elemeinek bármely x1 , x2 , x3 , . . . sorozatából mindig ki tudunk választani olyan részsorozatot, amely S valamely X eleméhez konvergál, akkor S halmazt zárt halmaznak vagy kompakt halmaznak nevezzük. Az X elemet, amelyhez egy halmaz elemeiből alkotott sorozat konvergál, a halmaz limeszelemének nevezzük. Az S halmaz tehát akkor zárt, ha az elemeiből alkotott konvergens sorozatok limeszelemei is az S halmazhoz tartoznak. Láttuk a megelőző bekezdésben, hogy az a 5 x 5 b zárt intervallum zárt halmaz ebben az értelemben. Tehát a zárt halmaz fogalma úgy tekinthető, mint a számegyenes zárt intervallumának az általánosítása. Jegyezzük meg, hogy a számegyenes egészében véve nem zárt halmaz, mivel sem az egész számok 1, 2, 3, 4, 5, . . . sorozata, sem bármely részsorozata nem konvergál, nem tart határértékhez. Nem zárt halmaz valamely nyílt intervallum – mint pl. 0 < x < 1 – sem. Ugyanis a nyílt intervallum nem tartalmazza a végpontjait, s pl. 0 < x < 1 nyílt intervallum esetében az 12 , 13 , 14 , . . . sorozat vagy bármely részsorozata 0 határértékhez tart, ami azonban nem pontja a nyílt intervallumnak. Ugyanígy be lehet látni, hogy a sík azon pontjainak halmaza, amely egy négyzet vagy négyszög belső pontjaiból áll, nem zárt halmaz, azonban zárttá tehető, ha a határán levő pontokat hozzávesszük. Kompakt továbbá azon háromszögeknek a halmaza, amelyeknek csúcsai adott kör belsejében vagy kerületén feküsznek. A folytonosság fogalmát is kiterjeszthetjük arra az esetre, amikor az X változó tetszőleges S halmazban vehet fel értékeket, ha az S halmazban definiálva van a határérték fogalma. Az u = F(X) függvényt, ahol u valós szám, akkor mondjuk az X elemen folytonosnak, ha az X1 , X2 , X3 , . . . elemek X-hez mint határértékhez tartó sorozatának megfelelő számok F(X1 ), F(X2 ), F(X3 ), . . . sorozata az F(X) határértékhez tart. (Lehetne megfelelő (ε, δ)-definíciót is adni.) Könnyű bebizonyítani, hogy Weierstrass tétele is érvényes bármely kompakt halmazon értelmezett folytonos függvényre: Ha u = F(X) valamely S zárt halmazon értelmezett tetszőleges folytonos függvény, akkor mindig létezik S-nek olyan eleme, amelyre F(X) legnagyobb értékét veszi fel, és olyan eleme, amelyre a legkisebbet. A bizonyítás egyszerű, ha az ember egyszer már megértette az előforduló általános fogalmakat,
383
azonban itt nem részletezzük tovább a dolgot. Látjuk majd a VII. fejezetben, hogy az általános Weierstrass-tétel nagy jelentőségű a maximumok és minimumok elméletében.
6. § Bolzano tételének néhány alkalmazása 1. Geometriai alkalmazások Bolzano egyszerű s mégis általános tételét sok olyan tény bizonyítására lehet használni, amelyek első látásra távolról sem egyszerűek és nyilvánvalóak. Kezdjük annak a tételnek a bizonyításával, hogy ha A és B két tetszőleges tartomány a síkban, akkor létezik a síkban olyan egyenes, amely egyszerre felezi A-t és B-t. „Tartomány” alatt a sík bármely részét értjük, amelyet egy egyszerű zárt görbe határol.
173. ábra. Két adott terület megfelezése egyszerre Kezdjük azzal, hogy választunk valamely rögzített P pontot a síkban, s P-ből mint kezdőpontból húzunk egy PR irányított félegyenest, melytől azután mérjük a szögeket. Tekintsünk bármely PS félegyenest, amely PR-rel x-szöget zár be: létezik a síkban ezzel a PS-sel azonos irányú, A tartományt felező irányított egyenes. Ugyanis, ha felveszünk egy olyan PS irányú l1 irányított egyenest, melynek teljesen egyik oldalán fekszik A, azután önmagával párhuzamosan mozgatjuk l1 egyenest míg abba az l2 helyzetbe jut, amelyben az egész A a másik oldalán fekszik, mint az előbb (l. 173. ábra), akkor az
384
a függvény, melyet az A tartománynak az egyenes jobb oldalára (a keleti oldal, ha az egyenesen a nyíl északra mutat) eső területe, mínusz a bal oldalára eső területe definiál, l1 helyzetben pozitív lesz, l2 helyzetben negatív. Mivel ez a függvény folytonos, Bolzano tétele szerint valamely közbenső lx helyzetben nulla kell legyen. Ebben a helyzetben felezi az egyenes A-t. x minden értékére, x = 0◦ -tól x = 360◦ -ig az A-t felező lx egyenes egyértelműen definiálva van. Legyen most az y = f(x) függvény definiálva mint B-nek lx jobb oldalára eső területe, mínusz B-nek lx bal oldalára eső területe. Tegyük fel, hogy az A-t felező l0 egyenes iránya PR, és hogy B-ből több van ennek az egyenesnek a jobb oldalán mint bal oldalán. Akkor erre az x = 0 irányra y pozitív. Növekedjék most x 180◦ -ig. Akkor az l180 egyenes, amely RP irányú, éppen úgy felezi A-t, mint l0 , csak ellenkezően irányított, ami által a jobb és a bal felcserélődnek. Tehát y értéke x = 180◦ -ra numerikusan ugyanaz, mint x = 0◦ -ra, de ellenkező előjelű, azaz negatív. Mivel y az x folytonos függvénye, miközben lx körbe fordul, létezik 0◦ és 180◦ között az x olyan α értéke, amelyre y nulla. Következésképpen l egyenes egyszerre felezi A-t és B-t. Ezzel a bizonyítást befejeztük. Jegyezzük meg, hogy bár bebizonyítottuk a kívánt tulajdonságú egyenes létezését, nem adtunk semmiféle határozott eljárást megszerkesztésére; megint látjuk a matematikai egzisztenciabizonyítások jellegzetességét, ami ezeket megkülönbözteti a szerkesztésektől.
174. ábra
385
Hasonló probléma a következő: legyen adva a síkban egyetlen A tartomány, vágjuk ezt két egymásra merőleges egyenessel négy egyenlő darabra. A bizonyításban az előbbi probléma azon lépéséből indulunk ki, amelyben definiáltuk lx -et bármely x-szögre, de a B tartományt elhagyjuk. E helyett az lx+90 egyenest vesszük, amelyik merőleges lx -re és szintén felezi A-t. Ha a 174. ábrán látható módon számozzuk meg A négy darabját, felírhatjuk, hogy A1 + A2 = A3 + A4 és A2 + A3 = A1 + A4 , amiből (a második egyenletet kivonva az elsőből) következik, hogy A1 − A3 = A3 − A1 , azaz A1 = A3 , tehát A2 = A4 . Így, ha ki tudjuk mutatni egy olyan x = α-szög létezését, hogy A1 (α) = A2 (α), akkor tételünket bebizonyítottuk, mivel ilyen szögre mind a négy terület egyenlő lesz. Ennek a bizonyítására definiáljuk azzal az y = f(x) függvényt úgy, hogy minden xszöghöz megrajzolva gondoljunk lx -et és az f(x) = A1 (x) − A2 (x)-et írjunk be.
386
Legyen x = 0◦ -ra f(0) = A1 (0) − A2 (0) pozitív. Ebben az esetben x = 90◦ -ra A1 (90) − A2 (90) =A2 (0) − A3 (0) =A2 (0) − A1 (0) negatív lesz. Tehát, mivel x folytonosan változik amint x 0◦ -tól 90◦ -ig nő, lesz valahol 0◦ és 90◦ között egy olyan α érték, amelyre f(α) = A1 (α) − A2 (α) = 0. Az lα és lα+90 egyenesek akkor négy egyenlő darabra osztják a tartományt. Érdekes, hogy ezek a problémák három és háromnál több dimenzióra is általánosíthatók. Három dimenzió esetében az első probléma így hangzik: legyen adva három tartomány a térben, keressünk síkot, mely mindhármat egyszerre felezi. Annak a bizonyítása, hogy ez mindig lehetséges, Bolzano tételén alapul. Háromnál több dimenzió esetében is igaz a tétel, de a bizonyítás bonyolultabb matematikai módszereket igényel. *2. Egy mechanikai probléma Ezt a fejezetet egy látszólag nehéz mechanikai probléma tárgyalásával zárjuk, amelyet könnyű megoldani a folytonosság fogalmán alapuló érveléssel. (A probléma H. Whitney ötlete.)
175. ábra Tegyük fel, hogy A állomásról B állomásra egyenes pályaszakaszon megy a vonat. Nem szükséges, hogy egyenletes sebességgel vagy hogy egyenletes gyorsulással haladjon. Mehet akárhogyan: gyorsíthat, lassíthat, megállhat, sőt még tolathat is egy ideig, mielőtt elérne B-be. De azt kikötjük, hogy előre tudjuk a vonat mozgását; azaz meg van adva az s = f(t) függvény, ahol s a vonat A állomástól való távolsága, t pedig az idő, az elindulás pillanatától mérve. Az egyik kocsi padlójára csuklósan rudat erősítünk úgy, hogy súrlódásmentesen mozoghasson előre vagy hátra, egész a padlóra fekvéséig. Feltesszük, hogy amint érintette a padlót, attól kezdve már fekve marad; ez a helyzet, ha
387
a rúdnak nincs rugalmassága. Lehet-e a rudat olyan helyzetbe hozni, hogy az elindulás pillanatában elengedve, pusztán a nehézségi erő és a vonat mozgása hatva rá, az egész A-tól B-ig tartó utazás alatt ne érintse a padlót? Roppant valószínűtlennek látszik, hogy a nehézségi erő és a tehetetlenség összjátéka megengedi bármely előre adott mozgási terv esetében ezt a kiegyensúlyozást, feltéve, hogy a rúd kezdeti helyzetét alkalmasan választottuk. Mégis azt állítjuk, hogy ilyen helyzetet mindig lehet választani. Bármilyen paradoxnak hat ez az állítás, könnyen bebizonyítható, ha az ember lényegében topologikus jellegét észreveszi. Nem kell a bizonyításhoz ismerni a dinamika törvényeit. Csupán a következő egyszerű fizikai feltételre van szükség: a rúd mozgása folytonos függvénye kezdeti helyzetének. Jellemezzük a rúd kezdeti helyzetét azzal az x kezdeti szöggel, amelyet a rúd a padlóval képez, jelentse y azt a szöget, ami az utazás végén van rúd és padló között, amikor a vonat elérte B pontot. Ha a rúd közben érintette a padlót, akkor vagy y = 0 vagy y = π lesz. Feltevésünk szerint adott x kezdőhelyzet mellett az y véghelyzetet teljesen meghatározza valamely folytonos y = g(x) függvény, amelynek az értéke y = 0, ha x = 0 és y = π, ha x = π (utóbbi egyenlőségek csak azt fejezik ki, hogy ha elinduláskor a padlón feküdt a rúd, végig fekve marad). Emlékeztessünk rá, hogy g(x), mint a 0 5 c 5 π intervallumban folytonos függvény, g(0) = 0 és g(π) = π között minden értéket felvesz; következésképpen minden ilyen y értékhez, pl. y =
π -hez, 2
tartozik x valamely speciális értéke úgy, hogy g(x) = y
legyen; speciálisan van olyan kezdeti helyzet, amelyikhez tartozó végső helyzetben a rúd merőleges a padlóra B-ben. (Megjegyzés: az érveléshez tartozik, hogy a vonat mozgását egyszer s mindenkorra rögzítettük.) Az érvelés természetesen teljesen teoretikus. Ha az utazás sokáig tart, vagy ha a vonat s = f(t) által kifejezett mozgási terve nagyon szabálytalan, akkor az a kezdeti x helyzet, amelyhez tartozó g(x) véghelyzet különbözik 0-tól vagy π-től, nagyon keskeny változási tartományba van beszorítva, amint azt mindenki tudja, aki megpróbált hosszabb ideig egyensúlyozni hegyére állított tűt sima lemezen. Mégis, a gyakorlati ember részére is hasznos lehet gondolatmenetünk, mert látható belőle, hogyan lehet a dinamikában egyszerű érveléssel, technikai mesterkedések nélkül, kvalitatív eredményeket elérni. Feladatok: 1) Mutassuk ki a 382. oldalon közölt tétel felhasználásával, hogy a fenti érvelés
388
általánosítható végtelen hosszú ideig tartó utazás esetére. 2) Általánosítsunk arra az esetre, amikor a vonat tetszőleges görbe mentén mozoghat a síkban, és a rúd tetszőleges irányba eshet le. [Útmutatás: Körlemezt nem lehet folytonosan leképezni kerületére olyan leképezéssel, amelyik a kerület minden pontját fixpontnak hagyja (l. 309. o.)]. 3) Bizonyítsuk be, hogy egyenletes sebességgel mozgó kocsi esetében, ha a kezdeti helyzet, amelyben a rudat szabadon engedjük, ε-szöggel tér el a függőlegestől, az az idő, amire a rúdnak szüksége van, hogy a padlóra essen, a végtelenhez tart, ha ε tart a nullához.
389
390
Kiegészítés a VI. fejezethez. További példák a határértékre és a folytonosságra 1. § Példák a határértékre 1. Általános megjegyzések Az an sorozat konvergens voltát sokszor olyan jellegű érveléssel lehet bizonyítani, mint a következő. Keresünk két másik, bn és cn sorozatot, melynek tagjai egyszerűbb szerkezetűek, mint az eredeti sorozaté, és minden n-re teljesül, hogy bn 5 an 5 cn .
(1)
Ha be tudjuk bizonyítani, hogy bn sorozat és cn sorozat azonos a határértékhez konvergál, ebből következik, hogy an is ugyanehhez az a határértékhez konvergál. Az állítás formai bizonyítását az olvasóra bízzuk. Nyilvánvaló, hogy az eljárás alkalmazása egyenlőtlenségek használatával jár. Nem árt azért, ha emlékezetbe idézzük az egyenlőtlenségekre vonatkozó aritmetikai műveletek néhány elemi szabályát. 1. Ha a > b, akkor a + c > b + c (az egyenlőtlenség mindkét oldalához hozzá lehet adni ugyanazt a tetszőleges számot). 2. Ha a > b és c pozitív szám, akkor ac > bc (az egyenlőtlenség megszorozható bármely pozitív számmal). 3. Ha a < b, akkor −b < −a (az egyenlőtlenség értelme megfordul, ha mindkét oldalát szorozzuk −1-gyel). Így pl. 2 < 3, de −3 < −2. 4. Ha a és b azonos előjelűek és ha a < b, akkor 1/a > 1/b. 5. |a + b| 5 |a| + |b|.
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526105230+02’00’
391
2. qn határértéke Ha q 1-nél nagyobb szám, a qn sorozat minden határon túl nő, mint pl. a 2, 22 , 23 , . . . sorozat q = 2 esetében. A sorozat a „végtelenhez tart” (l. 354. o.). A bizonyítás az általános esetben (1 + h)n = 1 + nh > nh
(2)
fontos egyenlőtlenségen alapul (l. 17. o.), ahol h tetszőleges pozitív szám. Legyen q = 1 + h, ahol h > 0; akkor qn = (1 + h)n > nh Ha k bármely, tetszőlegesen nagy pozitív szám, akkor minden n > k/h-ra következik, hogy qn > nh > k; tehát qn → ∞. Ha q = 1, akkor a qn sorozat minden tagja 1, tehát a sorozat határértéke 1. Ha q negatív, akkor qn váltakozva lesz pozitív és negatív előjelű, s ha q 5 −1 a sorozatnak nincs határértéke. Feladat: Bizonyítsuk be szigorúan az utolsó állítást.
Láttuk a 79. oldalon, hogy ha −1 < q < 1, akkor qn → 0. Ennek a ténynek itt másik, igen egyszerű bizonyítását adhatjuk. Tekintsük először azt az esetet, ha 0 < q < 1. Akkor a q, q2 , q3 , . . . számok monoton csökkenő sorozatot alkotnak, melynek alsó korlátja 0. Tehát, a 356. oldalon írottak szerint, a sorozatnak határértékhez kell tartani: qn → a. Az összefüggés mindkét oldalát szorozva q-val, azt kapjuk, hogy qn+1 → aq. Mármost qn+1 -nek ugyanaz kell, hogy legyen a határértéke mint qn -nek, hiszen mit sem számít, hogy a növekvő kitevőt n-nek vagy n + 1-nek nevezzük-e. Tehát, aq = a vagy a(q − 1) = 0. Mivel 1 − q 6= 0, ebből következik, hogy a = 0. Ha q = 0, a qn → 0 állítás triviális. Ha −1 < q < 0, akkor 0 < |q| < 1; tehát |qn | = |q|n → 0 az előbbi érvelés szerint. Ebből következik, hogy qn → 0 mindig, ha
392
|q| < 1. Ezzel befejeztük a bizonyítást. Feladatok: Bizonyítsuk be, hogy ha n → ∞, akkor: 2 n x 1) →0 1 + x2 n x →0 2) 1 + x2 3 n x 3) tart a végtelenhez, ha x > 2, 0-hoz, ha |x| < 2. 4 + x2
3.
√ n
p határértéke
Az an =
√ n
p sorozat, azaz a p,
√
p,
√ √ 3 p, 4 p, . . . sorozat határértéke bármely rögzített
p szám esetében 1: √ n (Az
p → 1,
ha n → ∞.
(3)
√ n p jelölés, mint mindig, a pozitív n-edik gyököt jelenti. Negatív p számnak ha n
páros, nincs valós n-edik gyöke.) A (3) összefüggés bizonyítására tételezzük fel először, hogy p > 1; akkor
√ n p is
nagyobb lesz mint 1. Így tehát √ n p = 1 + hn írható, ahol hn az n-től függő pozitív mennyiség. Akkor a (2) egyenlőtlenségből látjuk, hogy p = (1 + hn )n > nhn . Osztva n-nel: 0 < hn < p/n. Mivel bn = 0 és cn = p/n sorozat határértéke egyaránt 0, az (1)-ből következik, hogy hn is 0 határértékhez tart n növekedtével, s állításunkat p > 1 esetére igazoltuk. Íme, tipikus esete annak, hogyan kell két könnyebben kiszámítható határértékű sorozat közé
393
bezárva, kiszámítani az adott hn sorozat határértékét, ami jelen esetben hn → 0 által adott. Mellékesen egyúttal megbecsültük a
√ n p és 1 közötti h n különbséget is; ennek mindig
kisebbnek kell lennie, mint p/n. √ Ha 0 < p < 1, akkor n p < 1, és √ n
p=
1 1 + hn
írható, ahol hn ismét n-től függő pozitív szám. Következik, hogy p=
1 1 , < (1 + hn )n nhn
tehát 0 < hn
nkn , tehát √ kn
1.
Itt a szakadásos f(x) függvényt úgy állítottuk elő, mint a folytonos racionális függvények sorozatának határértékét. Másik érdekes, hasonló jellegű példa az fn (x) = x2 +
x2 x2 x2 + + . . . + 1 + x2 (1 + x2 )2 (1 + x2 )n
sorozat. Ha x = 0, akkor fn (x) minden értéke nulla, tehát f(0) = lim fn (0) = 0. Ha
395
1 = q kifejezés pozitív és kisebb mint 1; a geometriai sorra vonatkozó (1 + x2 ) eredményünk biztosítja fn (x) konvergens voltát, ha n → ∞. A határérték, azaz a x 6= 0, az
végtelen geometriai sor összege x2 = 1−q
x2
, 1
1−
1 + x2
s ez egyenlő 1+x2 -tel. Látjuk tehát, hogy fn (x) sorozat tart az f(x) = 1+x2 függvényhez, ha x 6= 0, és f(x) = 0-hoz, ha x = 0. A függvénynek megszüntethető szakadása van az x = 0 helyen. *5. Határérték kiszámítása iterációval Gyakran előfordul sorozatoknál, hogy az an+1 -edik tagot ugyanazzal az eljárással kapjuk az an -edik tagból, mint az an -edik tagot az an−1 -edikből; ugyanaz az eljárás, végtelenszer megismételve, hozza létre egyetlen kezdő tagból kiindulva az egész sorozatot. Ilyen esetben beszélünk „iterációról”. Pl. az √ 1, 1 + 1,
r q q √ √ 1 + 2, 1 + 1 + 2, . . .
sorozat ilyen iterációs törvény szerint képződik; az első után mindegyik tag úgy áll elő, hogy négyzetgyököt vonunk 1 plusz a közvetlenül megelőző tagból. Tehát az a1 = 1,
an+1 =
p 1 + an
képlet definiálja az egész sorozatot. Keressük meg a határértékét. Ha n > 1, an nyilvánvalóan nagyobb mint 1. Továbbá an monoton növekvő sorozat, mivel a2n+1 − a2n = (1 + an ) − (1 + an−1 ) = an − an−1 . Tehát valahányszor an > an−1 , következik, hogy an+1 > an . Azonban tudjuk. hogy √ a2 − a1 = 2 − 1 > 0, amiből következik matematikai indukcióval, hogy an+1 > an minden n-re, azaz a sorozat monoton növekvő. Továbbá korlátos is a sorozat; ugyanis a
396
fenti eredmények szerint an+1 =
1 + an+1 1 1 + an < =1+ < 2. an+1 an+1 an+1
A monoton sorozatok elve szerint következik, hogy an → a, ha n → ∞, ahol a valamely 1 és 2 közötti szám. Könnyű belátni, hogy a az x2 = 1 + x másodfokú egyenlet pozitív gyöke. Ugyanis, ha n → ∞, a2n+1 = 1 + an egyenletből a2 = 1 + a egyenlet lesz. Megoldva √ az egyenletet azt kapjuk, hogy a pozitív gyök a = (1 + 5)/2. Tehát ezt a másodfokú egyenletet megoldhatjuk iterációs eljárással, amely a gyök értékét kívánt pontossággal megadja, ha elég hosszan folytatjuk az eljárást. Sok más algebrai egyenletet is megoldhatunk hasonló módon iterációval. Pl. az x3 − 3x + 1 = 0 harmadfokú egyenlet x=
1 3 − x2
alakba írható. Válasszunk a1 -nek bármely értéket, legyen mondjuk a1 = 0, és definíció szerint an+1 =
1 , 3 − a2n
úgyhogy a2 = 1/3 = 0, 3333 . . ., a3 = 9/26 = 0, 3461 . . ., a4 = 676/1947 = 0, 3472 . . . stb. sorozatot kapjuk. Be lehet bizonyítani, hogy ilyen módon kapott an sorozat konvergens, és határértéke a = 0, 3473 . . ., ami az adott harmadfokú egyenlet megoldása. Ehhez hasonló iterációs eljárások igen fontosak a tiszta matematikában, ahol „egzisztenciabizonyításokat” képviselnek, de igen fontosak a matematika alkalmazásaiban is, ahol sokféle problémának közelítő megoldását teszik lehetővé. Feladatok határérték kiszámítására. A következőkben mindig legyen n → ∞. √ √ 1) Bizonyítsuk be, hogy n + 1 − n → 0. (Útmutatás: Írjuk a különbséget √ √ √ n+1− n √ √ √ · ( n + 1 + n) n+1+ n alakban.) 2) Keressük meg
√
n2 + a −
√
n2 + b határértékét.
397
3) Keressük meg 4) 5) 6) 7) 8) 9)
√
n2 + an + b − n határértékét. 1 Keressük meg √ √ határértékét. n+1+ n √ Bizonyítsuk be, hogy n n + 1 határértéke 1. √ Mi n an + bn határértéke, ha a > b > 0? √ Mi n an + bn + cn határértéke, ha a > b > c > 0? √ Mi n an bn + an cn + bn cn határértéke, ha a> b > c > 0? 1 n 1 n Később (541. o.) látjuk majd, hogy e = lim 1 + . Mennyi akkor lim 1 + 2 ? n n
2. § Példa a folytonosságra A függvény folytonosságának precíz igazolásához explicit módon kell bizonyítani a 375. oldalon közölt definíció érvényességét. Ez sokszor hosszadalmas eljárás, de szerencsére, mint a VIII. fejezetben látni fogjuk, a folytonosság a differenciálhatóság következménye, az utóbbi pedig szisztematikusan megállapítható minden elemi függvény esetében, és így a folytonosság fárasztó esetenkénti bizonyítását mellőzhetjük, amint azt általában szokásos. De vizsgáljunk meg még egy példát az általános definíció megvilágítására: az 1 f(x) = függvényt. Korlátozhatjuk x-et az |x| 5 M rögzített intervallumra, ahol 1 + x2 M tetszőlegesen választott szám. Felírva, hogy 1 x2 − x21 1 − = = 1 + x21 1 + x2 (1 + x2 )(1 + x21 ) (x + x1 ) = (x − x1 ) , (1 + x2 )(1 + x21 )
f(x1 ) − f(x) =
azt találjuk, hogy ha |x| 5 M és |x1 | 5 M, akkor |f(x1 ) − f(x)| 5 |x − x1 | · |x + x1 | 5 |x − x1 | · 2M. Nyilvánvaló tehát, hogy a bal oldalon álló különbség kisebbé tehető bármely pozitív ε számnál, valahányszor |x − x1 | < δ =
ε . 2M
Megjegyzendő, a becslés elég nagylelkű. Nagy x és x1 értékekre, amint könnyen igazolható, sokkal nagyobb δ elegendő.
398
VII. fejezet. Szélső értékek Bevezetés Az egyenesszakasz a legrövidebb összeköttetés két végpontja között. A legnagyobb gömbi kör íve a gömbfelület két pontját összekötő legrövidebb gömbfelületi görbe. Azonos hosszúságú síkgörbék közül a kör zár be legnagyobb területet. Azonos felszínű zárt felületek által bezárt térfogatok között a gömb térfogata a legnagyobb. Ilyenféle maximum és minimum tulajdonságokat jól ismertek a görögök, ha az eredményeket sokszor anélkül mondották is ki, hogy a valódi bizonyítást megkísérelték volna. Az egyik legjelentősebb görög felfedezést Héronnak tulajdonítják, aki az i. sz. I. században élt, Alexandriában. Régen tudták már akkor, hogy egy P pontból kiinduló fénysugár, amely az L síktükröt R pontban éri, olyan Q pont irányában verődik vissza, hogy PR és QR egyenlő szöget zárnak be a tükörrel. Héron fedezte fel, hogy ha R 0 a tükör bármely más pontja, PR 0 + R 0 Q távolságösszeg nagyobb lesz, mint a PR + RQ távolság. Ez a tétel – amelyet azonnal be fogunk bizonyítani – a fény P és Q pont közötti tényleges PQR útját, mint a tükör közvetítésével P-ből Q-ba vezető lehetséges legrövidebb utat tünteti ki. Ez a felfedezés tekinthető a geometriai optikának nevezett elmélet csírájának. Természetes, hogy a matematikusokat érdekelték az ilyen jellegű kérdések. De az élet mindennapi problémái között is állandóan jelen vannak a maximum-minimumproblémák a „legjobb” és „legrosszabb” kérdésének formájában. Nagyon sok gyakorlati szempontból fontos probléma jelentkezik ebben az alakban. Pl. milyen alakú legyen a hajó, hogy legkisebb legyen vele szemben a víz ellenállása? Adott anyagmennyiségből készült milyen hengeres tartónak lesz legnagyob a térfogata? A szélső értékek általános elmélete a XVII. században indult el, s a természettudomány egyik nagy rendszerező és egységesítő elve lett belőle. Fermat első lépéseit a differenciálszámítás területén az a kívánság vezette, hogy általános módszert találjon
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526112158+02’00’
399
maximum-minimumkérdések tárgyalására. A következő évszázadban nagymértékben növelte ezeknek a módszereknek a birodalmát a „variáció-számítás” felfedezése. Egyre inkább nyilvánvalóvá lett, hogy a természet fizikai törvényei minimumelvek formájában fejezhetők ki legadekvátabb módon, ezek képviselik a speciális problémák többé-kevésbé teljes megoldásának természetes útját. A jelenkori matematika egyik legfigyelemreméltóbb elmélete, a stacionárius folyamatok elmélete, amelyben az analízis és a topológia kapcsolódik, a szélső érték fogalmának az általánosításából keletkezett. A jelen fejezetben meglehetősen elemi szinten fogjuk tárgyalni az egész problémakört.
1. § Elemi geometriai feladatok 1. Háromszög maximális területe, ha a háromszög két oldala adott Legyen adva két szakasz, a és b. Keressünk maximális területű háromszöget, melynek a és b két oldala. A megoldás egyszerű derékszögű háromszög, a és b a két befogó. Ugyanis tekintsünk bármely háromszöget, melynek két oldala a és b, amint az a 176. ábrán látható. Ha h az a 176. ábra
alaphoz tartozó magasság, a háromszög területe A = 21 ah. Mármost 12 ah nyilván-
valóan akkor maximális, ha h legnagyobb, és ez akkor következik be, ha h egybeesik b-vel; azaz derékszögű háromszög esetében. A maximális terület tehát 21 ab. 2. Héron tétele. A fénysugarak szélső érték tulajdonsága Legyen adva egy L egyenes és két pont, P és Q, L ugyanazon oldalán. L melyik R pontjára nézve lesz a PR + RQ távolságösszeg P-ből L-en át Q-ba vezető legrövidebb út? Ez Héron fénysugárproblémája. (Ha L folyópart lenne, s valakinek P-ből Q-ba kellene menni a lehető leggyorsabban, közben egy vödör vizet hozva L-ből, ugyanezt a problémát kellene megoldania.) A megoldás megkeresésére tükrözzük P-t L egyenesre vonatkozóan, mint valami tükörben, ami által P 0 pontot kapjuk, és L egyenes a PP 0 szakasz felező merőlegese.
400
177. ábra. Héron tétele P 0 Q egyenes a kívánt R pontban metszi L-et. Könnyű bebizonyítani, hogy PR+RQ kisebb, mint L bármely más R 0 pontjával képezett PR 0 + R 0 Q. Ugyanis PR = P 0 R és PR 0 = P 0 R 0 ; tehát PR + RQ = P 0 R + RQ = P 0 Q és PR 0 + R 0 Q = P 0 R 0 + R 0 Q. Azonban P 0 R 0 + R 0 Q nagyobb, mint P 0 Q (mivel a háromszög bármely két oldalának az összege nagyobb mint a harmadik oldal), tehát PR 0 + R 0 Q nagyobb, mint PR + RQ, ami bizonyítandó volt. A következőkben feltételezzük, hogy sem P sem Q nincs rajta L egyenesen. Látjuk a 177. ábrából, hogy 3^ = 2^ és 2^ = 1^, úgy, hogy 1^ = 3^. Más szóval R az a pont, amelyre PR és QR egyenlő szöget zár be L-lel. Ebből következik, hogy az L-en visszavert fénysugár (amelyről kísérlet alapján tudjuk, hogy egyenlő beesési és visszaverődési szöget zár be) valóban a legrövidebb utat fútja be P-ből L-en keresztül Q-ba, mint azt a bevezetésben állítottuk. A probléma általánosítható több L, M, . . . egyenes esetére. Legyen pl. két L és M egyenes és két pont, P és Q adva, a 178. ábrán látható elrendezésben. Keressük meg a legrövidebb utat, amely P-ből L-hez, onnan M-hez, végül Q-ba vezet. Legyen O 0 pont Q pont M egyenesre vonatkozó tükörképe, Q 00 pedig Q 0 pont L-re vonatkozó tükörképe. Húzzuk meg a PQ 00 egyenest, amely R pontban metszi L-et és RQ 0 egyenest, amely M-et S pontban metszi. R és S a két keresett pont, amelyekkel képzett PR + RS + SQ távolságösszeg a legrövidebb P-ből L-en és M-en keresztül Q-ba vezető út. Ennek a ténynek a bizonyítása igen hasonló a megelőző problémáéhoz, s feladatként az olvasóra
401
178. ábra. Tükrözés két tükörben
179. ábra
402
180. ábra. Adott alapú és területű háromszög legkisebb kerülete bízzuk. Ha L és M tükör lenne, P-ből kiinduló, L-en és M-en Q pontba visszaverődő fénysugár L-et R-ben, M-et S-ben találná, tehát megint a legrövidebb úton haladna a fény. Kereshetnénk, mi lesz a legrövidebb út, ha P-ből M-hez, onnan L-hez, végül innen Q-ba megyünk. Így az előbbi PRSQ pályához hasonló módon meghatározott PRSQ pályát kapnánk (l. 179. ábra). Lehet a két pálya egyenlő, vagy lehet az egyik nagyobb, mint a másik. *Feladat: Bizonyítsuk be, hogy az első pálya mindig kisebb, mint a második, valahányszor O és R a PQ egyenes azonos oldalán feküsznek. Mikor lesz a két pálya egyenlő hosszúságú?
3. A Héron-tétel alkalmazása háromszög-feladatokra Az alábbi két feladat könnyen megoldható Héron tétele segítségével. a) Legyen adva a háromszög A területe és c = PQ oldala. Keressük meg az ezáltal meghatározott háromszögek között azt, amelyikben a másik két oldal: a és b összege a legkisebb. A háromszög c oldalának és A területének az előírása ekvivalens azzal, ha a c oldalt és a c oldalhoz tartozó h magasságot adjuk meg, ugyanis A = 12 hc. Azért a 180. ábra szerint az a probléma, hogy egy olyan R pontot kell találni, amely a PQ egyenestől az adott h távolságban van, és az R által meghatározott a + b összeg minimum. Az első feltételből következik, hogy R-nek a PQ-val párhuzamos h távolságban levő egyenesen kell lennie. Ekkor a megoldás következik Héron tételének azon speciális esetéből, amikor P és
403
181. ábra. Az ellipszis érintési tulajdonsága Q egyenlő távolságra vannak L-től: a keresett PRQ háromszög egyenlő szárú háromszög. b) Legyen adva a háromszög c oldala és a másik két oldal, a + b összege. Keressük meg az ezáltal meghatározott háromszögek közül azt, amelyiknek legnagyobb a területe. Ez a probléma éppen megfordítottja az a)-nak. A megoldás ismét egyenlő szárú háromszög, amelyre a = b. Éppen most láttuk, hogy ebben a háromszögben az a + b legkisebb értéke adott területnél van, bármely más c alapú és ugyanekkora területű háromszögre a + b értéke nagyobb. Nyilvánvaló továbbá a)-ból, hogy bármely c alapú és az egyenlő szárúénál nagyobb területű háromszögre is nagyobb a + b értéke. Tehát minden más háromszögnek, amelyben ugyanekkora az a + b oldalszög és a c oldal, kisebb kell legyen a területe, úgyhogy adott c és a + b mellett az egyenlő szárú háromszögnek legkisebb a területe. 4. Az ellipszis és hiperbola érintési tulajdonságai. Megfelelő szélső érték tulajdonságok Héron problémája összefügg néhány fontos geometriai tétellel. Bebizonyítottuk, hogy ha R az L egyenes azon pontja, amelyre PR + RQ minimum, akkor PR és RQ egyenlő szöget zár be L-lel. Nevezzük ezt a minimális távolságösszeget 2a-nak. Jelölje p és q a sík bármely pontjának P-től és Q-tól való távolságát, és tekintsük a sík mindazon pontjainak geometriai helyét, amely pontokra p + q = 2a. Ez a geometriai hely az ellipszis, melynek P és Q a fókuszai és az L egyenes R pontján megy át. Továbbá L-nek R pontban érintenie kell az ellipszist. Ha ugyanis L az ellipszist még egy R-től különböző
404
182. ábra. |PR − QR| = maximum pontban metszené, lenne L-nek olyan szakasza, amely az ellipszis belsejében feküdne; p + q ennek a szakasznak minden pontjára kisebb mint 2a, mivel könnyű belátni, hogy az ellipszisen belül p + q kisebb, mint 2a, az ellipszisen kívül pedig nagyobb. Tudjuk azonban, hogy L egyenesen p + q = 2a, így ez lehetetlen. L-nek tehát érintenie kell az ellipszist R pontban. De azt is tudjuk, hogy PR ugyanakkora szöget zár be L-lel, mint RQ; ezzel egyúttal bebizonyítottuk a következő fontos tételt: az ellipszis érintője egyenlő szöget zár be az érintési pontot a két fókusszal összekötő két egyenessel. Közeli rokona az előzőnek a következő probléma: Legyen adva L egyenes és két oldalán két pont, P és Q (l. 182. ábra). Keressünk L egyenesen olyan R pontot, amelyre a |p − q| mennyiség, azaz P és Q pont R-től való távolságából képzett különbség abszolút értéke, maximum. (Feltesszük, hogy L nem felező merőlegese a PQ szakasznak; mert akkor p − q nulla lenne L minden R pontjára, s a problémának nem lenne értelme.) A megoldás érdekében tükrözzük P-t L egyenesre, a P pont P 0 tükörképe ugyanazon oldalán lesz, mint Q. L minden R 0 pontjára p = R 0 P = R 0 P 0 , q = R 0 Q. Mivel R 0 , Q és P 0 egy háromszög három csúcsának tekinthetők, |p − q| = |R 0 P 0 − R 0 Q| mennyiség sohasem nagyobb, mint P 0 Q, mert a háromszög két oldalának különbsége sohasem nagyobb, mint a harmadik oldal. Ha R 0 , P 0 és Q kollineárisak, |p − q| egyenlő lesz P 0 Q-val, amint az az ábrából látható. Tehát a keresett R pont L-nek a P 0 és a Q ponton áthaladó egyenessel való metszéspontja. Mint az előbbi esetben, itt is könnyen beláthatjuk, hogy az RP és
405
183. ábra. A hiperbola érintési tulajdonsága L, valamint az RQ és L által bezárt két szög egyenlő, mivel RPR 0 és RP 0 R 0 háromszögek kongruensek. A probléma összefügg a hiperbola érintési tulajdonságával, éppen úgy, mint a megelőző az ellipszisével. Ha a |PR − QR| különbségmaximum értéke 2a, tekinthetjük a sík mindazon pontjainak geometriai helyét, amelyekre p − q abszolút értéke 2a. Ez a geometriai hely hiperbola, mely R ponton halad át, és két fókusza P és Q. Mint könnyen kimutatható, a p − q abszolút érték a hiperbola két ága közötti tartományban kisebb mint 2a, s nagyobb mint 2a a hiperbola bármelyik ágának azon oldalán, amelyiken valamelyik fókusz is fekszik. Ebből – lényegében hasonló érveléssel mint az ellipszisnél – következik, hogy L-nek érintenie kell a hiperbolát R pontban. Az, hogy L a hiperbola melyik ágát érinti attól függ, hogy P van-e közelebb L-hez vagy Q. Ha P van közelebb, L a P köré hajló ágat érinti, s ugyanez áll Q-ra (l. 183. ábra). Ha P és Q egyforma távolságra van L-től, akkor L a hiperbola egyik ágát sem érinti, hanem egyike lesz a görbe két aszimptotájának. Ez az eredmény plauzibilis, ha meggondoljuk, hogy ebben az esetben a fenti szerkesztés egyetlen (véges) R pontot sem szolgáltat, mivel P 0 Q egyenes párhuzamos lesz L-lel. Ugyanúgy mint az előbb, ez az érvelés bizonyítja azt a jól ismert tételt, hogy a hiperbola érintője felezi az érintési pont és a két fókusz által meghatározott szöget.
406
Különösnek látszhat, hogy ha P és Q pontok L egyenes ugyanazon oldalán vannak, akkor minimumproblémát kell megoldanunk, ha meg az egyenes két különböző oldalán, akkor maximumproblémát. De rögtön látható, hogy ez így természetes. Az első problémában mindkét távolság, p és q, s így összegük is, minden határon túl nő, ha L mentében bármelyik irányba minden határon túl haladunk. Lehetetlen lenne tehát maximumot találni p + q számára, a minimumprobléma az egyetlen lehetőség. Egészen más a második eset, mikor P és Q az L különböző oldalán van. Itt, a zavar elkerülése végett, különbséget kell tenni p − q különbség, negatívja q − p és |p − q| abszolút érték között; az utóbbi az, aminek maximumnak kell lenni. A helyzetet legjobban úgy lehet megérteni, ha R pontot L egyenesen különböző R1 , R2 , R3 , . . . helyzetekbe mozgatjuk. Van egy pont, amelyre a p − q különbség nulla: a PQ szakasz felező merőlegesének és az L egyenesnek a metszéspontja. Ebben a pontban lesz azért |p − q| abszolút érték minimum. De ennek a pontnak egyik oldalán p nagyobb, mint q, a másikon pedig kisebb; ezért a p − q mennyiség a pont egyik oldalán pozitív, és negatív a másikon. Következésképpen maga p − q se nem maximum, se nem minimum abban a pontban, amelyikben |p − q| = 0. Azonban az a pont, amelyben |p − q| maximum, tényleg szélső érték helye (p − q)-nak. Ha p > q, (p − q)-nak maximuma van ezen a helyen; ha q > p, (q − p)-nek van maximuma, s ezért (p − q)-nak minimuma. Azt, hogy maximuma vagy minimuma van (p − q)-nak, a két adott Q és P pont L egyeneshez viszonyított helyzete dönti el. Láttuk, hogy a maximumproblémának nincs megoldása, ha P és Q egyenlő távolságra van L-től, mivel akkor a P 0 Q egyenes a 182. ábrán párhuzamos L-lel. Megfelel ez annak a ténynek, hogy |p − q| mennyiség határértékhez tart, ha R pont L egyenes mentén valamelyik irányban tart a végtelenhez. Ez a határérték egyenlő PQ szakasz L-re való s vetületével (feladatként igazolja az olvasó ezt az állítást). Ha P és Q azonos távolságra van L-től, akkor |p − q| mindig kisebb lesz, mint ez a határérték, s nincs maximum, ugyanis akármilyen messze is van R pont az L egyenesen, mindig találhatunk egy még messzebbit, amelyre |p − q| nagyobb, de még mindig nem egyenlő s-sel.
407
184. ábra. Két görbe egymástól való távolságának szélső értékei *5. Adott görbék extrém távolságai Határozzuk meg először egy P pontnak adott görbétől való legrövidebb és leghosszabb távolságát. Egyszerűség kedvéért tegyük fel, hogy az adott C görbe egyszerű zárt görbe, melynek mindenütt van érintője, mint ahogy az pl. a 184. ábrán látható. (A görbe érintőjének a fogalmát itt a szemlélet alapján fogadjuk el, a következő fejezetben analizáljuk majd.) A válasz igen egyszerű: a C görbe olyan R pontjára van a PR távolságnak legkisebb vagy legnagyobb értéke, amely R pontban a C görbéhez húzott érintő merőleges PR egyenesre; más szóval PR merőleges C görbére. A bizonyítás a következő: A kör, melynek középpontja P és R ponton halad át, szükségképpen érinti a görbét. Ugyanis, ha R a távolságminimum pontja, C-nek teljesen a körön kívül kell feküdnie, s így nem metszheti azt R pontban, míg ha R a távolságmaximum pontja, a C-nek teljesen a kör belsejében kell feküdni, s így megint csak nem metszheti azt R pontban. (Következik ez abból a nyilvánvaló tényből, hogy bármely pontnak P-től való távolsága kisebb, mint RP, ha a pont a körön belül van, és nagyobb, mint RP, ha a pont a körön kívül van.) Tehát a kör és a C görbe érintik egymást, s közös érintőjük van R pontban. Mármost PR a kör sugara, s így merőleges a kör R pontbeli érintőjére, s ezért R pontban C görbére is. Mellékesen, egy ilyen zárt C görbe átmérőjének, azaz leghosszabb húrjának, mindkét
408
185. ábra. PR + QR legnagyobb és legkisebb értéke végpontjában merőlegesnek kell lennie C-re. A bizonyítást feladatként az olvasóra bízzuk. Fogalmazzuk meg a három dimenzióra érvényes hasonló állítást, és bizonyítsuk be. Feladat: Bizonyítsuk be, hogy két egymást nem metsző zárt görbét összekötő legrövidebb és leghosszabb szakasz végpontjainál mindkét görbére merőleges.
Ezek alapján általánosíthatjuk a megelőző pontban tárgyalt, távolságok összegére és különbségére vonatkozó problémát. Tekintsünk az L egyenes helyett egy C egyszerű zárt görbét, amelynek minden pontjában van érintője, és legyen adva két pont, P és Q, amelyek nincsenek rajta a C görbén. A C azon pontjait kívánjuk jellemezni, amelyekre p+q összeg és p−q különbség szélső értékét veszi fel. Itt p a C görbe bármely pontjának P ponttól, q pedig C görbe bármely pontjának Q ponttól való távolságát jelenti. Most nem lehet egyszerű tükrözésen alapuló szerkesztést alkalmazni, mint abban az esetben, amikor C egyenes volt. De a probléma megoldására alkalmazhatjuk az ellipszis és a hiperbola tulajdonságait. Mivel C zárt görbe, s így nem terjed a végtelenbe, itt már értelme van a maximumproblémának éppen úgy, mint a minimumproblémának, ugyanis
409
186. ábra. PR − QR legkisebb értéke bizonyos, hogy a p + q és p − q mennyiségeknek van legnagyobb és legkisebb értékük valamely görbe bármely véges szakaszára, kiváltképpen pedig zárt görbére (l. 7. §). Tételezzük fel p + q összes esetében, hogy R a C görbének az a pontja, amelyre p + q értéke maximum, és jelölje 2a ebben az R pontban p + q értékét. Tekintsük azt az ellipszist, melynek P és Q a fókuszai és azon pontoknak a mértani helye, amelyekre p+q = 2a. Ennek az ellipszisnek R pontban kell érintenie C-t (a bizonyítást gyakorlatként az olvasóra bízzuk). Láttuk azonban, hogy PR és QR egyenesek egyenlő szöget zárnak be az ellipszis R-beli érintőjével; mivel az ellipszis érinti C görbét az R pontban, PR és QR egyeneseknek egyenlő szöget kell bezárniuk R pontban C görbével is. Ha p + q minimum R-re, ugyanígy láthatjuk be, hogy R pontban PR és QR egyenlő szöget képez C görbével. Így kimondhatjuk a következő tételt: Ha adva van egy C zárt görbe és két pont, P és Q, C ugyanazon oldalán, továbbá ha R olyan pont C-n, amelyre a p + q összeg legnagyobb vagy legkisebb értékét veszi fel, akkor ebben az R pontban PR egyenes ugyanakkora szöget zár be C görbével (azaz a C görbe R pontbeli érintőjével), mint QR egyenes. Ha P a C görbén belül van és Q rajta kívül, akkor a tétel csak p + q legnagyobb értékére érvényes, legkisebb értékére nem, mivel ebben az esetben az ellipszis egyenessé fajul el. Teljesen hasonló eljárással, az ellipszis helyett a hiperbola tulajdonságait használva,
410
bizonyítsa be az olvasó a következő tételt: Legyen adva egy C zárt görbe és két pont, P és Q, C két különböző oldalán. Ha R olyan pont C-n, amelyre p − q legnagyobb vagy legkisebb értékét veszi fel, PR egyenes ugyanakkora szöget zár be C-vel, mint QR egyenes. Újból hangsúlyozzuk, hogy a probléma más zárt C görbére, mint végtelen egyenesre, amennyiben utóbbi problémában |p − q| abszolút érték maximumát kerestük, míg most létezik p − q maximuma is (akárcsak minimuma).
2. § Szélső érték problémák egyik általános alapelve 1. Az elv A fenti problémák speciális esetei egy általános kérdésnek, amelyet legalkalmasabban analitikus nyelven fogalmazhatunk meg. Jelölje a p + q szélső értékének megkereséséből álló problémában x, y az R pont koordinátáit, x1 , y1 a rögzített P pontét, x2 , y2 a Q-ét, akkor p=
p (x − x1 )2 + (y − y1 )2 ,
q=
p (x − x2 )2 + (y − y2 )2
és a probléma az, hogy meg kell keresni f(x, y) = p + q függvény szélső értékeit. Ez a függvény a síkban mindenütt folytonos, de az a pont, melynek a koordinátái x, y, az adott C görbére van korlátozva. Ezt a görbét valamely g(x, y) egyenlet definiálja: pl. x2 + y2 − 1 = 0, ha a görbe az egység sugarú kör. Meg kell tehát találni f(x, y) szélső értékeit, ha x-et és y-t a g(x, y) feltétel korlátozza. A következőkben problémánknak ezt az általános típusát tárgyaljuk. Tekintsük a megoldás jellemzésére azt a görbesereget, melynek görbéit az f(x, y) = c egyenletek adják meg, ahol a c állandó bármely értéket felvehet, de értéke a sereg egyes görbéinek a pontjaiban azonos. Tegyük fel, hogy a sík minden pontján az f(x, y) = c görbeseregnek egy és csak egy görbéje halad át, legalább is akkor, ha a C görbe szomszédságára szorítkozunk. Akkor, amint c változik, az f(x, y) = c görbe hiánytalanul kisepri a sík egy részét, és eközben ebben a síkrészben egyetlen pontot sem érint kétszer.
411
187. ábra. A függvény valamely görbére vonatkoztatott szélső értéke (Az x2 − y2 = c, x + y = c és x = c görbék például ilyen tulajdonságúak.) A sereg egy görbéje át fog haladni speciálisan azon az R1 ponton is, ahol f(x, y) legnagyobb értékét veszi fel C-n, egy másik görbe pedig azon az R2 ponton, ahol f(x, y) legkisebb értékét veszi fel. Nevezzük a legnagyobb értéket a-nak, a legkisebbet b-nek. Az f(x, y) = a görbe egyik oldalán f(x, y) értéke kisebb lesz, mint a, a másik oldalán pedig nagyobb. Mivel C-n f(x, y) = a, C-nek teljesen az f(x, y) = a görbe egyik oldalán kell feküdnie; tehát érintenie kell ezt a görbét R1 pontban. Hasonlóképpen, R2 pontban érintenie kell C-nek f(x, y) = b görbét. Így kimondhatjuk a következő általános tételt: Ha a C görbén levő R pontban valamely f(x, y) függvénynek a szélső értéke van, akkor az f(x, y) = a görbe érinti C-t R pontban.
412
2. Példák
188. ábra. Konfokális ellipszisek
189. ábra. Konfokális hiperbolák
Könnyen belátható, hogy az előző pont eredményei speciális esetei ennek az általános tételnek. Ha p + q szélső értékét keressük, az f(x, y) függvény egyenlő p + q-val és az f(x, y) = c görbék konfokális ellipszisek, P-vel és Q-val mint fókusszal. Amint az általános tételből látható, azok az ellipszisek, melyek C azon pontjain haladnak át, ahol f(x, y) szélső értéket vesz fel, érintik C-t ezekben a pontokban. Abban az esetben, mikor p − q szélső értékét keressük, az f(x, y) függvény p − q, az f(x, y) = c görbék konfokális hiperbolák, P-vel és Q-val mint közös fókusszal, és azok a hiperbolák, melyek C-nek f(x, y) szélső értékeihez tartozó pontjain haladnak át, érintik C-t ezekben a pontokban. Másik példa: Legyen adva PQ szakasz és a szakaszt nem metsző L egyenes. L melyik pontjából látszik PQ a legnagyobb szög alatt? A maximalizálandó függvény itt az a ϑ szög, amelyet PQ szakasz két végpontja határoz meg, L egyenes egy-egy pontját véve a szög csúcsának. Az a szög, amely alatt PQ a sík tetszőleges R pontjából látszik, R pont koordinátáinak valamilyen ϑ = f(x, y) függvénye. Tudjuk az elemi geometriából, hogy a ϑ = f(x, y) = c görbékből álló görbesereg P és Q ponton átmenő körök serege, mivel egy-egy körben a PQ húrhoz tartozó íven nyugvó kerületi szögek egyenlők, a körkerület PQ azonos oldalán levő pontjaiból PQ azonos szög alatt látszik. Látható a 190. ábrából, hogy ezek közül a körök közül általában kettő érinti az L egyenest, a két kör középpontja PQ két különböző oldalán van. A két érintési
413
190. ábra. L egyenes azon pontja, ahonnan PQ szakasz legnagyobbnak látszik pont egyike adja az abszolút maximumot ϑ számára, a másik pedig „relatív” maximumot határoz meg (azaz ϑ értéke kisebb lesz ennek a pontnak valamely környezetében, mint magában a pontban). Az az érintési pont szolgáltatja a két maximum közül a nagyobbat, az abszolút maximumot, amely az L és PQ meghosszabbítása által képzett hegyesszöghöz tartozik, a relatív maximumot szolgáltató érintési pont pedig az, amelyik a mondott két egyenes által alkotott tompaszöghöz tartozik. (Az a pont, amelyben PQ szakasz meghosszabbítása metszi L egyenest, adja ϑ legkisebb értékét, nullát.) A probléma általánosításaként helyettesíthetjük L-et valamely C görbével, és kereshetjük C azon R pontját, amelyből egy adott (C-t nem metsző) PQ szakasz legnagyobb vagy legkisebb szög alatt látszik. Itt megint a P, Q, R pontokon áthaladó körnek kell érinteni C-t R pontban.
3. § Stacionárius pontok és a differenciálszámítás 1. Szélső értékek és stacionárius pontok Eddigi meggondolásainkban nem használtuk a differenciálszámítást. Valóban elemi módszereink sokkal egyszerűbbek és közvetlenebbek voltak azoknál, amelyeket a dif-
414
ferenciálszámításban használunk. A természettudományos gondolkozásban általában jobb a kérdések individuális vonatkozásait tekinteni, s nem bízni túlságosan általános módszerekben, de az individuális próbálkozásokat mindig olyan elvnek kell vezetnie, amelyik megvilágítja a használt speciális eljárás értelmét. Éppen ez a differenciálszámítás szerepe szélső érték problémákban. A modern törekvés az általánosságra, csak egyik oldala a dolognak, a matematika életrevalósága ugyanis leghatározottabban a problémák és az alkalmazott módszerek egyéni, individuális színétől és ízétől függ. Történetét tekintve, a differenciálszámítás kialakulására és fejlődésére igen nagy hatással voltak individuális maximum–minimumproblémák. A szélső értékek és a differenciálszámítás között ugyanis az alábbiakban vázolt összefüggés van. A VIII. fejezetben részletesen tanulmányozzuk majd egy f(x) függvény f 0 (x) deriváltjának fogalmát és geometriai jelentését. Egyelőre röviden annyit jegyezzünk meg, hogy az f 0 (x) derivált az y = f(x) görbéhez (x, y) pontban húzott érintő iránytangense. Világosan látszik a geometriai ábrázolásból, hogy egy y = f(x) sima1 görbe maximumában vagy minimumában a görbéhez húzott érintőnek vízszintesnek kell lennie, azaz az iránytangensének itt egyenlőnek kell lenni nullával. Így f(x) szélső értékeire az f 0 (x) = 0 feltételt kapjuk. Vizsgáljuk meg a 191. ábrán látható görbét, hogy lássuk, mit is jelent f 0 (x) eltűnése. A, B, C, D, E betűkkel jelölt öt pontban vízszintes az ehhez a görbéhez húzott érintő; legyen ezekben a pontokban f(x) értéke sorra a, b, c, d, e. f(x) maximuma a rajzolt intervallumban D-nél van, minimuma A-nál. B pont is maximum abban az értelemben, hogy B közvetlen környezetében f(x) értéke mindenütt kisebb b-nél, de már pl. a D pont közelében levő pontoknál f(x) nagyobb, mint b. Éppen ezért nevezzük B-t f(x) relatív maximumának, D-t pedig abszolút maximumának. Hasonló értelemben mondjuk, hogy C relatív, A pedig abszolút minimum. Végül E-nél f(x)-nek se maximuma, se minimuma nincs, jóllehet f 0 (x) = 0 itt is. Látjuk tehát, hogy f 0 (x) eltűnése szükséges, de nem elegendő feltétele annak, hogy egy f(x) sima függvénynek szélső értéke legyen; más szóval mindenütt, ahol a függvénynek relatív vagy abszolút szélső értéke van, minden szélső pontban f 0 (x) = 0, de nem kell minden pontnak szükségképpen szélső pontnak lenni, ahol f 0 (x) = 0. Azokat a pontokat, ahol a függvény deriváltja eltűnik, akár szélső pontok, akár nem, stacionárius pontoknak nevezzük. Részletesebb analízissel 1
„Sima” görbének nevezzük az olyan görbét, amelynek minden pontjában van érintője, tehát nincsenek pl. csúcsai.
415
191. ábra. A függvény stacionárius pontjai többé-kevésbé bonyolult feltételeket kaphatunk f(x) magasabb deriváltjaira, amelyek tökéletesen jellemzik a maximumot, minimumot és egyéb stacionárius pontokat. 2. Több változós függvények maximuma és minimuma. Nyeregpontok Vannak olyan maximum-minimumproblémák, amelyek nem fejezhetők ki egyváltozós függvények segítségével. A legegyszerűbb ilyen eset akkor adódik, ha meg kell keresni egy z = f(x, y) kétváltozós függvény szélső értékeit. Ábrázolhatjuk f(x, y)-t egy felület x, y sík felett vett z magasságértékeivel, képzelhetjük pl. a felületet hegyvidéki tájnak. f(x, y) maximuma hegycsúcsnak felel meg, minimuma egy katlan fenekének vagy egy tónak. Mindkét esetben, feltéve, hogy a felület sima, vízszintes lesz a felülethez simuló érintősík helyzete. Vannak azonban más pontok is hegycsúcsokon és völgykatlanok fenekén kívül, ahol az érintősík vízszintes. Ilyen pontok pl. a hágók legmagasabb pontjai. Vizsgáljuk meg ezeket a pontokat közelebbről. Tekintsük egy hegylánc két A és B csúcsát, amint az a 192. ábrán látható, s két C és Dvel jelölt pontot a hegylánc két oldalán, s tegyük fel, hogy C pontból D pontba akarunk jutni. Tekintsük először azokat az utakat, amelyeket valamely C és D ponton átmenő
416
sík vág ki a felületből. Minden ilyen úton lesz egy legmagasabb pont. A sík helyzetét változtatva változnak az utak, s lesz egy olyan út, amelynek legmagasabb pontja az utak legmagasabb pontjai közül legalacsonyabban van. Ennek az útnak legmagasabb pontját nevezik hágónak, matematikai nyelven pedig nyeregpont nak. Jelöljük ezt a pontot E-vel. Nyilvánvaló, hogy E se nem maximum, se nem minimum, hiszen tetszés szerint találhatunk E közelében pontokat, amelyek magasabban vagy alacsonyabban feküsznek mint E. Tekinthetünk a síkok által kimetszett utak helyett tetszőleges utakat a felületen, az E nyeregpontnak ez a jellemzése nem változik.
192. ábra. Hágó
193. ábra. ... és a megfelelő szintvonalak Hasonlóképpen ha A csúcsról akarunk menni B csúcsra, bármelyik útnak lesz egy legalacsonyabb pontja; ha megint csak síkmetszeteket tekintünk, lesz megint egy AB út, melynek legalacsonyabb pontja legmagasabban fekszik, s ennek az útnak a minimuma megint a fent talált E pont lesz. Ez az E nyeregpont így egyszerre maximum és minimum tulajdonságú, azaz maxi-minimum vagy mini-maximum. Az érintősík vízszintes E-ben, ugyanis, mivel E az AB út minimumpontja, AB érintőegyenesének E-ben vízszintesnek kell lennie, és hasonlóképpen, mivel E a CD maximumpontja, CD E-beli érintőegyenesének is vízszintesnek kell lennie. Az érintősíknak, amely e két egyenes által meghatározott sík, szintén vízszintesnek kell tehát lennie. Így három különböző típusú pontot találtunk, melyeknek vízszintes érintősík felel meg: maximum-, minimum- és nyeregpont. Ennek a három különböző ponttípusnak f(x, y) különböző típusú stacionárius értékei felelnek meg. f(x, y) függvény másik ábrázolási módja a szintvonalakkal történő ábrázolás, ahogyan a térképeken használják a magasság megadására (l. 347. o.). A szintvonal az x, y sík olyan görbéje, amely mentén az f(x, y) értéke állandó; így a szintvonalak rendszere azonos az f(x, y) = c görbesereggel. A sík valamely közönséges pontján egy és csak egy szintvonal halad át; maximumot vagy minimumot zárt szintvonalak vesznek körül; a
417
nyeregpontban pedig több szintvonal metszi egymást. A 193. ábrán megrajzoltuk a 192. ábrán látható táj szintvonalait, a rajzból azonnal látszik E pont maximum-minimum tulajdonsága: minden útnak, amely A-t és B-t összeköti, és nem halad át E-n, olyan tartományban kell haladnia, ahol f(x, y) < f(E), s a 192. ábra AEB útjának E pontban minimuma van. Ugyanígy azt is látjuk, hogy f(x, y) értéke E-ben a legkisebb maximum a C-t D-vel összekötő utak számára. 3. Minimax pontok és a topológia A stacionárius pontok általános elmélete és a topológia fogalmai szoros kapcsolatban vannak egymással. Itt csupán röviden utalhatunk erre, egy egyszerű példával kapcsolatban.
194. ábra. Stacionárius pontok kétszeresen összefüggő tartományban Tekintsük B gyűrű alakú, két C és C 0 görbe által határolt sziget hegyvidékét. Ha a tengerszint feletti magasságokat ismét olyan u = f(x, y) függvénnyel ábrázoljuk, amely C és C 0 mentén f(x, y) = 0, B belsejében pedig f(x, y) > 0, akkor kell lennie legalább egy hágónak a szigeten, amit a 194. ábrán a szintvonalak kereszteződésével tüntettünk fel. Könnyen belátható ez szemléletesen, ha az ember C-ből C 0 -be próbál jutni olyan úton, amelyik nem megy a szükségesnél magasabbra. Minden C-ből C 0 -be vezető úton kell lennie egy legmagasabban fekvő pontnak, és ha azt az utat választjuk, amelynek a legmagasabban fekvő pontja a legalacsonyabb, akkor ennek az útnak a legmagasabb pontja lesz az u = f(x, y) felület nyeregpontja. (Van egy triviális kivétel: mikor egy egész kör mentében érinti a vízszintes sík a gyűrűsziget hegyláncát.) Általánosságban, p görbe által határolt tartományban legalább p − 1 minimax típusú stacionárius pontnak kell
418
lennie. Hasonló összefüggéseket fedezett fel Marston Morse a többdimenziós terekre is, ahol nagyobb változata van a stacionárius ponttípusoknak és a topológiai lehetőségeknek. Ezek az összefüggések képezik a stacionárius pontok modern elméletének alapját, amelyet főképpen Marston Morse dolgozott ki. 4. A pont távolsága egy felülettől
196. ábra 195. ábra Egy P pont és egy zárt görbe közötti távolságnak (legalább) két szélső értéke van, egy maximuma és egy minimuma. Ha ezt az eredményt három dimenzióra akarjuk kiterjeszteni, semmi új sem történik mindaddig, amíg a gömbbel topologikusan ekvivalens C felületeket tekintünk, pl. egy ellipszoidot. De új jelenségbe ütközünk, ha a felület nagyobb nemszámú, pl. tórusz. Továbbra is van P-nek legrövidebb és leghosszabb távolsága C tórusztól, s mindkét szakasz merőleges C-re. Vannak azonban másféle szélső pontok is, olyanok, amelyek minimumok maximumát vagy maximumok minimumát eredményezik. Ezeknek a megkeresésére rajzoljunk a tóruszon egy L „délkört”, amint az a 195. ábrán látható, és keressük meg L-en a P-hez legközelebb levő Q pontot. Mozgassuk azután L-et, s figyeljük meg azt a két helyzetet, amikor a PQ távolság: a) minimum, ekkor Q egyszerűen a C felület P ponthoz legközelebb levő pontja; b) maximum, s ekkor egy másik stacionárius pontot kapunk. Éppen így megkereshettük volna L-en a P-től legtávolabbi pontot is, s azután azt az L-et amelynél ez a maximális távolság: c) maximum, ami megadja C P-től legtávolabbi pontját; s amelynél d) minimum. Így négy
419
különböző stacionárius értéket kapunk a távolságra. *Feladat: Ismételjük meg a gondolatmenetet a C felület egy másik típusú, L 0 egy pontra össze nem húzható zárt görbéjére, melyet a 196. ábrán láthatunk.
4. § A Schwarz-féle háromszögprobléma 1. Schwarz bizonyítása
197. ábra. Az ABC háromszög talpponti háromszöge, az egyenlő szögeket kétszeresen húzott körívek tüntetik fel Hermann Amandus Schwarz (1843–1921), a berlini egyetem kitűnő matematikusa, sokban hozzájárult a modern függvényelmélet és az analízis gazdagodásához, de emellett sohasem restellte azt sem, hogy elemi dolgokról írjon. Egyik közleménye pl. a következő egyszerű problémáról szól: Legyen adva egy hegyes szögű háromszög, írjunk bele lehető legkisebb kerületű másik háromszöget. (Beírt háromszögön azt a háromszöget értjük, melynek három csúcsa az eredeti háromszög egy-egy oldalán van.) Látni fogjuk, hogy pontosan egy ilyen háromszög van, s hogy ennek a háromszögnek a csúcsai az eredeti háromszög magasságainak talppontjai. Ezt a háromszöget talpponti háromszögnek nevezzük. Schwarz a talpponti háromszög minimum tulajdonságát a tükrözés módszerével bizonyította, a következő elemi geometriai tétel segítségével: a talpponti háromszög
420
198. ábra. Schwarz-féle bizonyítása annak, hogy a talpponti háromszög a legkisebb kerületű mindhárom P, Q, R csúcsánál levő két-két oldala egyenlő szöget zár be az eredeti háromszög oldalával (l. 197. ábra); ez a szög egyenlő az eredeti háromszög szemközti csúcsánál levő szöggel. Pl. ARQ és BRP szög egyenlő C szöggel stb. Ennek a segédtételnek a bizonyítására jegyezzük meg, hogy OPBR négyszög húrnégyszög, mivel OPB^ és ORB^ derékszög. Következésképpen PBO^ = PRO^, mivel az OPBR húrnégyszög köré írt körének ugyanazon PO ívén nyugosznak. Mármost PBO^ és C^ pótszögek, mivel CBQ háromszög derékszögű háromszög, továbbá PRO^ pedig PRB^ pótszöge, s így az utóbbi egyenlő C^-gel. Ugyanígy lehet, bebizonyítani, QORA négyszög segítségével, hogy QRA^ = C^ stb.
421
Ennek az eredménynek az alapján kimondhatjuk a talpponti háromszög következő tükrözési tulajdonságát: RQ oldal AC egyenesre vonatkozó tükörképe PQ folytatása, és megfordítva, mivel AQR^ = CQP^; s ugyanez érvényes a többi oldalakra. Most már bebizonyíthatjuk a talpponti háromszög minimum tulajdonságát. Tekintsünk az ABC háromszögben a talpponti háromszögön kívül valamely tetszőleges más UVW háromszöget. Tükrözzük az egész alakzatot először az ABC háromszög AC oldalára, azután tükrözzük az így kapott új háromszöget az új AB oldalra, azután ezt BC oldalra, majd megint AC oldalra, végül AB oldalra. Ezen a módon összesen hat egybevágó háromszöget kapunk, mindegyikben benne a maga talpponti háromszögével és a másik beírt háromszöggel. Az utolsó háromszög BC oldala párhuzamos az eredeti BC oldallal. Ugyanis az első tükrözésben BC az óramutató járásával megegyező irányban fordult el 2C szöggel, a másodikban az óramutató járásával megegyező irányban 2B szöggel; a harmadik tükrözés nem hatott rá, a negyedikben 2C szöggel fordult el az óramutató járásával ellentétes irányban, és az ötödikben 2B-vel az óramutató járásával ellentétes irányban. Így az egész szög, amivel BC elfordult, nulla. A talpponti háromszög tükrözési tulajdonsága következtében PP 0 szakasz kétszerese a talpponti háromszög kerületének, ugyanis PP 0 hat darabból áll, s ez a hat darab rendre egyenlő a talpponti háromszög első, második és harmadik oldalával, mindegyiket kétszer véve egymás után. Hasonlóképpen az U-tól U 0 -höz vezető törött vonal is kétszerese a másik beírt háromszög kerületének. Ez a törött vonal nem rövidebb az UU 0 szakasznál. Mivel UU 0 párhuzamos PP 0 -vel, U-tól U 0 -höz menő törött vonal nem lehet rövidebb mint PP 0 , tehát a háromszögbe írt háromszögek közül a talpponti háromszög kerülete a legkisebb, ami bizonyítandó volt. Így egyszerre bizonyítottuk be, hogy létezik minimum, s hogy a minimumot a talpponti háromszög képviseli. Azonnal látni fogjuk, hogy nincs még egy háromszög, amelynek a kerülete egyenlő lenne a talpponti háromszögével. 2. Másik bizonyítás A Schwarz-féle problémának talán legegyszerűbb megoldását a következőkben közöljük. A megoldás azon a korábban bizonyított tételen alapul, hogy két pont, Q és P, valamely L egyenestől való távolságának az összege L egyenes azon R pontjában a legkisebb, amely R pontból húzott PR és QR egyenes egyenlő szöget zár be L-lel, feltéve, hogy P
422
és Q pont L azonos oldalán van, és egyik sincs rajta L-en. Tegyük fel, hogy az ABC háromszögbe beírt PQR háromszög adja a minimumprobléma megoldását. Akkor R pontnak AB oldal azon pontjának kell lennie, ahol p + q minimum, tehát ARQ szögnek egyenlőnek kell lennie BRP szöggel; ugyanígy AQR^ = CQP^, BPR^ = CPQ^. Tehát a minimumháromszög, ha létezik, rendelkezik a Schwarz-féle bizonyításban használt egyenlő-szög tulajdonsággal. Azt kell még kimutatni, hogy a talpponti háromszög az egyedüli háromszög, amelyiknek megvan ez a tulajdonsága. Továbbá, mivel abban a tételben, amelyen ez a bizonyítás nyugszik, feltételeztük, hogy P és Q nincsenek az AB egyenesen, a bizonyítás nem érvényes abban az esetben, ha a P, Q, R pontok valamelyike az eredeti háromszög egyik csúcsával esik egybe (ebben az esetben a minimum-háromszög a megfelelő magasság kétszeresévé fajul el); a bizonyítás teljességéhez még azt is ki kell mutatni, hogy a talpponti háromszög kerülete rövidebb, mint bármelyik magasság kétszerese.
199. ábra 200. ábra Intézzük el először a bizonyítás első felét. Ha a beírt háromszögnek megvan a fent említett egyenlő-szög tulajdonsága, akkor P, Q és R-nél levő szögeknek rendre egyenlőknek kell lenniök A^-gel, B^-gel és C^-gel. Tegyük fel ugyanis, hogy pl. ARQ^ = C^ + δ. Akkor, mivel a háromszög szögeinek összege 180◦ , a Q-nál levő szög B − δ, a P-nél levő szög pedig A − δ kell legyen ahhoz, hogy ARQ és BRP háromszögben a szögek összege 180◦ -kal legyen egyenlő. Azonban akkor CPQ háromszögben a szögek összege A−δ + B − δ + C = 180◦ − 2δ; holott ennek az összegnek 180◦ -nak kell lennie. Tehát δ egyenlő nullával. Láttuk már, hogy a talpponti háromszögnek megvan ez az egyenlő-szög tulajdonsága. Minden más háromszögnek, amely ugyanilyen tulajdonságú, párhuzamosak az oldalai a talpponti háromszög megfelelő oldalaival, más szóval a két háromszög hasonló lenne és azonos orientációjú. Bizonyítsa be az olvasó, hogy adott háromszögbe
423
nem írható be ilyen második háromszög (l. 200. ábra).
201. ábra Végül igazoljuk, hogy a talpponti háromszög kerülete kisebb, mint bármelyik magasság kétszerese, feltéve hogy az eredeti háromszög szögei mind hegyesszögek. Hosszabbítsuk meg QP és QR oldalakat és bocsássunk merőlegest B-ből QP-re, QR-re és PR-re, ami által az L, M és N pontot kapjuk. QL a QB magasság QP egyenesre való vetülete, QM pedig QB magasság QR egyenesre való vetülete. Következésképpen QL + QM < 2QB. Mármost QL + QM egyenlő a talpponti háromszög kerületével, amit jelöljünk p-vel. Ugyanis MRB és NRB háromszög egybevágó, mivel MRB és NRB szög egyenlő, az M-nél és N-nél levő szög pedig derékszög. Tehát RM = RN; így QM = QR + RN. Ugyanígy látjuk, hogy PN = PL, tehát QL = QP + PN. Azért felírhatjuk, hogy QL + QM =QP+QR+PN+NR =QP+QR+PR = p. Azonban bebizonyítottuk, hogy 2QB > QL + QM. Tehát p kisebb, mint a QB magasság kétszerese; pontosan ugyanezzel az érveléssel lehet bizonyítani, hogy p a másik két magasság kétszeresénél is kisebb, s így a talpponti háromszög minimum tulajdonságát teljes egészében bebizonyítottuk. Mellékesen, a fenti szerkesztés alapján közvetlenül ki lehet számítani p-t. Tudjuk, hogy PQC és RQA szög egyenlő B-vel, tehát PQB = RQB = 90◦ − B, úgyhogy cos(PQB) = sin B. Ebből, az elemi trigonometria szerint következik, hogy QM = QL = QB sin B és p = 2QB sin B. Ugyanígy lehet bizonyítani, hogy p = 2PA sin A = 2RC sin C. Tud-
424
juk a trigonometriából, hogy RC = a sin B = b sin A stb., amiből következik, hogy p =2a sin B sin C =2b sin C sin A =2c sin A sin B. Végül, mivel a = 2r sin A, b = 2r sin B, c = 2r sin C, ahol r a háromszög köré írt kör sugara, a következő szimmetrikus kifejezést kapjuk p-re: p = 4r sin A sin B sin C. 3. Tompaszögű háromszög
202. ábra. A tompaszögű háromszög talpponti háromszöge Mindkét megelőző bizonyításban kikötöttük, hogy a háromszög mindhárom szöge, A, B és C, hegyesszög legyen. Ha egyik szög, legyen mondjuk C, tompaszög, akkor P és Q pont a háromszögön kívül esik, amint az a 202. ábrán látható. Azért, szigorúan szólva, nem lehet többé azt mondani, hogy a talpponti háromszög az adott háromszögbe beírt háromszög, hacsak a beírt háromszögön azt nem értjük, amelynek csúcsai az eredeti háromszög oldalain vagy az oldalak meghosszabbításain feküsznek. A beírt háromszög azonban most semmiképpen sem adja a legrövidebb kerületet, mivel PR > CR és QR > CR; tehát p = PR + QR + PQ > 2CR. Láttuk a legutóbbi bizonyítás első felében, hogy ha a legkisebb kerületet nem a talpponti háromszög adja meg, akkor egyik magasság kétszerese kell legyen. Következésképpen tompaszögű háromszög esetében a legkisebb kerületű „beírt háromszög” a legrövidebb magasság kétszerese, noha ez nem igazi háromszög. De lehet olyan valódi háromszöget találni, amelynek a kerülete tetszőlegesen kevéssel tér el a magasság kétszeresétől. A határesetet képviselő derékszögű háromszögnél a két megoldás – legkisebb magasság kétszerese, talpponti háromszög kerülete – egybeesik. Nem foglalkozhatunk itt azzal az érdekes kérdéssel, van-e tompaszögű háromszög
425
esetében a talpponti háromszögnek valamiféle szélső tulajdonsága. Csupán azt említsük meg, hogy ebben az esetben nincs ugyan a talpponti háromszög oldalösszegének, (p + q + r)-nek minimum tulajdonsága, de a p + q − r kifejezésnek, ahol r a beírt háromszög tompaszöggel szemközti oldalát jelöli, minimax típusú stacionárius értéke van. 4. Háromszögek fénysugarakból
203. ábra. Zárt fényút háromszögletű tükörben Legyen ABC háromszög egy tükörfalú szoba: a fény egyetlen lehetséges háromszögű útját a talpponti háromszög jelöli ki. Más zárt sokszög alakú utak nem kizártak, mint az a 203. ábrán is látszik, de a talpponti háromszög az egyetlen ilyen lehetséges háromoldalú sokszög.
204. ábra
426
205. ábra
206. ábra
207. ábra
Három kör között lehetséges fényháromszögek tipusai A problémát általánosíthatjuk, keresvén egy vagy több sima görbe által határolt tetszőleges tartomány lehetséges „fényháromszögeit”. Azaz olyan háromszögeket keresünk, melyeknek csúcsai valahol a határoló görbéken vannak, s egy-egy csúcsukban találkozó két oldaluk két egyenlő szöget alkot a görbével. Láttuk az 1. §-ban, hogy a szögek egyenlősége egyaránt feltétele annak, hogy a két oldal összege maximum legyen vagy minimum, úgyhogy a körülményeknek megfelelően különböző típusú fényháromszögeket kaphatunk. De tekinthetjük (amint azt Marston Morse javasolta a szerzőknek) három sima zárt görbe külsejét is. Egy ABC fényháromszöget az a tény jellemez, hogy hosszúsága stacionárius érték; ez az érték lehet mindhárom A, B, C pontra vonatkozóan minimum, lehet minimum két, pl. A és B pont viszonylatában, és maximum a harmadik C pontra vonatkoztatva, lehet minimum az egyik pontra vonatkoztatva, és maximum a másik két pont viszonylatában, végül lehet mindhárom pontra vonatkoztatva maximum. Összesen legalább 23 = 8 fényháromszög létezik, mert a három pont mindegyikére, egymástól függetlenül, lehetséges vagy egy maximum, vagy egy minimum. *5. Néhány megjegyzés tükrözési problémákról és ergodikus mozgásról A dinamikában és az optikában elsőrendű fontosságú probléma, hogyan lehet egy részecske, illetve a fénysugár pályáját korlátlan hosszúságú időtartamra leírni. Ha valamilyen fizikai berendezés a részecskét vagy a sugarat a tér valamely határolt részére kényszeríti,
427
különösen fontos azt megtudni, hogy vajon a határesetben a pálya megközelítően egyenletes eloszlásban tölti-e ki a rendelkezésre álló teret. Ha igen, a pályát ergodikusnak nevezzük. Annak a feltételezése, hogy ergodikus pálya létezik, alapvető a modern dinamika és az atomelmélet statisztikus módszereiben. Azonban igen kevés valóban meggyőző példát ismerünk, ahol az „ergod hipotézist” szigorú matematikai módon sikerült igazolni. A legegyszerűbb példák egy C síkgörbén belül történő mozgásra vonatkoznak, ahol a C falról feltesszük, hogy tökéletes tükörként viselkedik: az egyébként szabad részecskét ugyanakkora szög alatt veri vissza, mint amekkora alatt beleütközik. Pl. egy négyszögletes doboz (idealizált biliárdasztal tökéletes visszaverődéssel és tömegponttal biliárdgolyóként) általában ergodikus pályához vezet, az örökké mozgó idealizált biliárdgolyó minden ponthoz tetszőlegesen közel jut, kivéve néhány szinguláris kezdeti helyzetet és irányt. A bizonyítást mellőzzük, bár elvben nem nehéz. Különösen fontos az F1 és F2 fókuszú elliptikus asztal esete. Az ellipszis érintője egyenlő szöget zár be az érintési pontot a két fókusszal összekötő két egyenessel, így minden fókuszon átmenő pálya visszaverődve a másik fókuszon megy át, és így tovább. Nem nehéz belátni, hogy akármi volt is a kezdő irány, n visszaverődés után növekvő n-nel a pálya egyre inkább tart az ellipszis F1 F2 nagytengelyéhez. Ha a kezdő sugár nem halad át a fókuszon, akkor két eset lehetséges. Vagy a fókuszok között halad át, ekkor a visszavert sugarak is a fókuszok között haladnak át, és mind egy olyan hiperbolának az érintői lesznek, amelynek F1 és F2 a két fókusza. Ha a kezdő sugár nem választja el F1 -et és F2 -t, akkor ugyanez érvényes a visszavert sugarakra is, és mind egy olyan ellipszis érintői lesznek, melynek F1 és F2 a két fókusza. Így az ellipszis egészére nézve sohasem lesz a mozgás ergodikus. *Feladatok: 1) Bizonyítsuk be, hogy ha a kezdő sugár az ellipszis egyik fókuszán halad át, az n-edik visszaverődés után n növekedtével a pálya a nagytengelyhez tart. 2) Bizonyítsuk be, hogy ha a kezdő sugár a két fókusz között halad át, a visszavert sugarak is mind itt haladnak át, és érintenek valamely F1 és F2 fókuszú hiperbolát. Hasonlóképpen, ha a kezdő sugár nem megy át a fókuszok között, nem mennek át a visszavert sugarak sem, és mind valamely F1 , F2 fókuszú ellipszist érintenek. (Útmutatás: Azt kell kimutatni, hogy a sugár visszaverődés előtt és után egyenlő szöget zár be RF1 illetve RF2 egyenessel, s azután be kell bizonyítani, hogy a konfokális kúpszeletek érintői éppen ilyen módon jellemezhetők.)
428
5. § Steiner-féle probléma 1. A probléma megoldása
208. ábra. Három pont távolságösszegének legkisebb értéke Igen egyszerű, de tanulságos problémát tárgyalt Jacob Steiner, a geometria híres képviselője a XIX. századeleji berlini egyetemen. Kössünk össze három falut, A-t, B-t és C-t legkisebb összhosszúságú utak rendszerével. Matematikailag szólva, legyen adva három pont, A, B, C a síkban, keressünk a síkban egy negyedik, P pontot úgy, hogy az a + b + c összeg minimum legyen, ahol a, b, c sorban a P pont A, B, C ponttól való távolságát jelöli. A probléma megoldása: Ha az ABC háromszög mindegyik szöge kisebb 120◦ -nál, akkor P az a pont, amelyből nézve mind a három oldal, AB is, BC is, CA is egyaránt 120◦ -os látószög alatt látszik. Ha pedig az ABC háromszög egyik szöge, pl. a C-nél levő, egyenlő 120◦ -kal vagy nagyobb 120◦ -nál, akkor a P pont a C csúccsal esik egybe. Szélső értékekre vonatkozó eddigi eredményeink alapján könnyű megkapni ezt a megoldást. Tegyük fel, hogy P a keresett minimumpont. Két lehetőség között lehet választani: P vagy egybeesik A, B, C csúcs egyikével, vagy különbözik mindegyik csúcstól. Az első esetben nyilvánvaló, hogy P az ABC háromszög legnagyobb, C szögénél levő csúcsa, mert CA+CB összeg kisebb, mint bármely más, az ABC háromszög két oldalából képzett összeg. Így állításunk teljes bizonyításhoz csak a második esetet kell elemezni.
429
209. ábra Legyen K a c sugárral C körül rajzolt kör. Akkor P azon pont kell legyen K körön, amelyre PA + PB minimum. Ha A és B kívül vannak K körön, mint pl. a 209. ábrán, akkor az 1. §-ban talált eredmény szerint PA-nak ugyanakkora szöget kell képeznie K körrel, és így a K körre merőleges sugárral is, mint PB. Mivel ugyanez érvényes a P pont és az A körül a sugárral rajzolt körre is, következik, hogy a PA, PB, PC által képzett három szög egyenlő, így 120◦ , amint állítottuk. Az érvelés azon a feltevésen alapult, hogy A és B a K körön kívül vannak, ezt még igazolni kell. Mármost ha A és B pont közül legalább az egyik, mondjuk A, a K körön vagy a K kör belsejében lenne, akkor, mivel P-ről feltettük, hogy sem A-val, sem B-vel nem azonos, a + b = AB lenne. Azonban AC 5 c, mivel A nincs a K körön kívül. Tehát a + b + c = AB + AC, ami azt jelenti, hogy akkor kapnánk a legrövidebb távolságösszeget, ha P egybeesnék A-val, feltevésünkkel ellentétben. Ezáltal igazoltuk, hogy A és B egyaránt K körön kívül van. Ugyanígy bizonyítjuk a megfelelő tényt a másik két kombinációra: B, C az A középpontú a sugarú körre vonatkoztatva, és A, C a B középpontú b sugarú körre vonatkoztatva.
430
2. A két lehetőség elemzése
210. ábra
211. ábra Annak az eldöntésére, hogy P pontra a két lehetőség közül melyik érvényes ténylegesen, meg kell vizsgálnunk a P pont szerkesztését. P-t úgy keressük meg, hogy megrajzoljuk azt a két kört, amelyiken a háromszög egy-egy oldala – mondjuk AC és BC – mint húr 120◦ –120◦ -os ívet határoz meg. Jelöljük ezt a két kört K1 -gyel és K2 -vel. AC két ívre osztja K1 -et, a kisebbik ív minden pontjából 120◦ -os látószög alatt látszik AC. Ugyanez igaz BC-re és K2 -re vonatkozóan is. A két rövidebb ív metszéspontja, feltéve, hogy létezik ilyen metszéspont, adja a keresett P pontot, mert nem csak AC és BC látszik 120◦ –120◦ látószög alatt P-ből, hanem AB is, hiszen a három szög összegének 360◦ -nak kell lennie.
431
212. ábra A 210. ábrából nyilvánvaló, hogy ha az ABC háromszög egyetlen szöge sem nagyobb 120◦ -nál, akkor a két rövidebb ív a háromszögön belül metszi egymást. Másrészt, ha az ABC háromszög egyik szöge, mondjuk C, nagyobb 120◦ -nál, akkor K1 és K2 két rövidebb íve nem metszi egymást, amint az a 211. ábrán látható. Ebben az esetben nincsen olyan P pont, ahonnan mind a három oldal 120◦ -os látószög alatt látszana. Tehát a P minimumpontnak egyik csúccsal kell egybeesnie, mivel láttuk, hogy ez az egyedül lehetséges alternatíva, s ennek a csúcsnak a tompaszögnél levő csúcsnak kell lennie. Azt már láttuk, hogy ha a háromszög mindegyik szöge kisebb 120◦ -nál, szerkeszthető olyan P pont, ahonnan mindhárom oldal 120◦ -os szög alatt látszik. De a bizonyítás befejezéséhez hiányzik még annak a megmutatása, hogy a + b + c valóban kisebb lesz ebben az esetben, mint akkor, ha P valamelyik csúccsal esik egybe. Eddig mi még csak azt láttuk, hogy P-vel minimumot kapunk, ha a legkisebb összhosszúságot nem úgy érjük el, hogy P valamelyik csúccsal esik egybe. Ezek szerint meg kell még mutatnunk, hogy a + b + c kisebb, mint bármely két oldal összege, mondjuk mint AB + AC. Hosszabbítsuk meg BP-t és vetítsük A pontot erre az egyenesre, ami által D pontot kapjuk (212. ábra). Mivel APD^ = 60◦ , a PD vetület hosszúsága 12 a. Mármost BD az AB vetülete a B és P ponton átmenő egyenesre, következésképpen BD < AB. Azonban BD = b + 12 a, tehát b + 12 a < AB. Pontosan ugyanígy, A-t PC meghosszabbítására vetítve, látjuk, hogy c + 12 a < AC. Összeadva, a + b + c < AB + AC egyenlőtlenséget kapjuk. Mivel tudjuk
432
már, hogy ha a minimumpont nem a csúcsok egyike, akkor P kell legyen, következik, hogy valóban P az a pont, amelyben a + b + c minimum. 3. Egy komplementer probléma
213. ábra. a + b − c = minimum A matematika formális módszerei néha messze meghaladják az eredetileg kitűzött célt. Például ha a C-nél levő szög nagyobb 120◦ -nál, a geometriai szerkesztéssel P megoldás helyett (ami ebben az esetben maga C pont) egy másik P 0 pontot kapunk, ahonnan az ABC háromszög leghosszabb AB oldala 120◦ -os szög alatt látszik, két rövidebb oldala pedig 60◦ -os szög alatt. Bizonyos, hogy P 0 nem oldja meg minimumproblémánkat, de gyaníthatjuk, hogy van valami köze hozzá. Valóban, P 0 minimalizálja az a + b − c kifejezést. A bizonyítás mindenben megfelel a fentebb (a + b + c)-re adottal, s az 1. § 5. pontján alapul. Az olvasóra bízzuk feladatképpen. Ezt az eredményt kombinálva az előbbivel, a következő tételt kapjuk: Ha ABC háromszög minden szöge kisebb 120◦ -nál, valamely pont A, B, C-től vett a, b, c távolságainak az összege akkor a legkisebb, ha arról a P pontról van szó, ahonnan a háromszög mindhárom oldala 120◦ -os szög alatt látszik, a+b−c pedig akkor a legkisebb, ha P pont a C csúccsal esik egybe. Ha az ABC háromszög egyik szöge, mondjuk C, nagyobb mint 120◦ , a + b + c a C pontból a legkisebb, a + b − c pedig abból a pontból, ahonnan a háromszög két rövidebb oldala 60◦ –60◦ -os szög alatt, leghosszabb oldala pedig 120◦ -os szög alatt látszik. Így a két minimumprobléma közül az egyiket mindig a körszerkesztés oldja meg, a másikat egyik csúcs. C^ = 120◦ esetében a két probléma két megoldása – és egyáltalán a két probléma megoldása – egybeesik, mivel a szerkesztéssel kapott pont ebben az esetben éppen C csúcs.
433
4. Megjegyzések és feladatok
214. ábra. Steiner megoldásának másik bizonyítása Ha UVW egyenlő oldalú háromszögön belül fekvő P pontból három merőlegest bocsátunk a háromszög három oldalára, melyeket a 214. ábrán PA, PB, PC-vel jelölünk, akkor A, B, C és P a fent elemzett ábrát szolgáltatják. Ezt a megjegyzést fel lehet használni Steiner problémájának a megoldására, A, B, C pontokból kiindulva, meghatározva U, V, W pontokat. Feladatok: 1) Keressük meg ezen az alapon a megoldást, azt a tényt alkalmazva, hogy egyenlő oldalú háromszögön belül levő bármely pontból a háromszög oldalaira bocsátott merőleges szakaszok összege állandó és egyenlő a magassággal. 2) Tárgyaljuk a komplementer problémát, az 1)-ben alkalmazottnak megfelelő tény alapján abban az esetben, ha P az UVW háromszögön kívül van. Tanulmányozhatunk hasonló problémát három dimenzióban is: legyen adva négy pont: A, B, C és D; keressünk olyan ötödik pontot, hogy a + b + c + d minimum legyen. * Feladat: Vizsgáljuk meg ezt és a komplementer problémát az 1. §-ban közölt módszerrel, vagy a szabályos tetraéder segítségével.
434
215. ábra. Négy pont távolságösszegének legkisebb értéke 5. Általánosítás úthálózat-probléma esetére Steiner problémájában három rögzített pont van adva, A, B, C. Természetes módon kínálkozik a probléma általánosítása n adott pontra, legyen az n pont A1 , A2 , . . ., An ; keressük a sík azon P pontját, amelyre vonatkozóan az a1 + a2 + . . . + an távolságösszeg minimum, ahol ai a PAi távolság. (Négy pontra, melyek a 215. ábrán látható módon vannak elrendezve, P az A1 A2 A3 A4 négyszög két átlójának a metszéspontja; az olvasó bizonyítsa be ezt feladatképpen.) Ez a probléma, amelyet már Steiner is tárgyalt, nem vezet különösen érdekes eredményekre. Egyike azoknak a felületes általánosításoknak, melyekkel nem ritkán találkozunk a matematikai irodalomban. Ahhoz, hogy a Steinerprobléma valóban jelentős kibővítését kapjuk, el kell hagyni az egyetlen P pont keresésére vonatkozó feltételt. Ehelyett, a legrövidebb összhosszúságú „úthálózat”-ot kell keresnünk. Matematikailag szólva: legyen adva n pont, A1 , . . ., An , keressük az egyenes szakaszok olyan legrövidebb összhosszúságú összefüggő rendszerét, amelyben bármely két adott pontot össze lehet kötni a rendszer szakaszaiból álló sokszögvonallal.
218. ábra
217. ábra 216. ábra 3-nál több pontot összekötő legrövidebb háló
435
220. ábra 219. ábra 4 pontot összekötő két legrövidebb háló A megoldás jellege természetesen az adott pontok elrendezésétől függ. Az olvasó haszonnal tanulmányozhatja a tárgykört a Steiner-probléma megoldása alapján. Itt megelégszünk a 216–218. ábrán bemutatott tipikus esetek megoldásának a közlésével. Az első esetben a megoldás öt szakaszból áll, melyek két pontban futnak össze, a két pontban találkozó három-három szakasz 120◦ -os szöget zár be egymással. A második esetben a szakaszok hármanként három különböző pontban metszik egymást. Ha a pontok másként vannak elrendezve, előfordulhat, hogy ilyen alakzatok nem lehetségesek. A többszörös metszéspontok közül egy vagy több elfajulhat, és helyettesíthető az adott pontok közül egyikkel vagy többel, mint pl. a harmadik esetben. n adott pont esetében legfeljebb n − 2 többszörös metszéspont lesz, s ezek mindegyikében három-három szakasz találkozik 120◦ -os szög alatt. A probléma megoldása nincs mindig egyértelműen meghatározva. Pl. ha négy pont A, B, C, D van adva, amelyek négyzetet alkotnak, a 219–220. ábrán látható két ekvivalens megoldás létezik. Ha az A1 , A2 , . . ., An pontok egyszerű sokszög csúcsai, amelyben a szögek kellőképpen nagyok, akkor maga a sokszögvonal adja a minimumot.
6. § Szélső pontok és egyenlőtlenségek A felsőbb matematikának egyik jellemző vonása, hogy igen gyakran dolgozik egyenlőtlenségekkel. A maximumproblémák megoldása, legalábbis elvben, mindig egyenlőtlenségre vezet, amely azt a tényt fejezi ki, hogy a tekintett változó mennyiség kisebb, vagy legfeljebb akkora, mint a megoldás által szolgáltatott maximális érték. Sok esetben az ilyen
436
egyenlőtlenségek önmagukban véve is érdekesek. Tekintsük példaként az aritmetikai és geometriai közepek közötti fontos egyenlőtlenséget. 1. A két pozitív mennyiség aritmetikai és geometriai közepe Kezdjük egy egyszerű maximumproblémával, amely igen gyakran előfordul a tiszta matematikában és alkalmazásaiban egyaránt. A geometria nyelvén ez a következőképpen szól: Előírt kerületű derékszögű négyszögek közül melyiknek legnagyobb a területe? Sejthetjük, hogy a megoldás a négyzet. Így igazolhatjuk: Legyen a derékszögű négyszög előírt kerülete 2a. Akkor két szomszéd oldal x és y hosszúságának rögzített összege x + y, a változó xy területet pedig a lehető legnagyobbá kell tenni. Mármost x és y „aritmetikai közepe” egyszerűen m=
x+y . 2
d=
x−y . 2
Vezessük be a
mennyiséget, úgy hogy x = m + d,
y = m − d,
eszerint tehát xy = (m + d)(m − d) = m2 − d2 =
(x + y)2 − d2 . 4
Mivel d2 nagyobb nullánál, kivéve, ha d = 0, közvetlenül kapjuk a √ x+y xy 5 2
(1)
egyenlőtlenséget, ahol az egyenlőségjel akkor érvényes, ha d = 0 és x = y = m. √ Mivel x + y rögzített, következik, hogy xy is az, és így xy terület is akkor maximum, ha x = y. A g=
√ xy
kifejezést, a négyzetgyök pozitív értékét véve, x és y pozitív mennyiség „geometriai közepé”-nek nevezzük; az (1) egyenlőtlenség az aritmetikai és a geometriai közepek közötti alapvető összefüggést fejezi ki.
437
Közvetlenül következik az (1) egyenlőtlenség abból a tényből is, hogy a √ √ √ ( x − y)2 = x + y − 2 xy kifejezés szükségképpen nem negatív, mivel négyzet, és csak x = y esetére nulla.
221. ábra. Maximális xy adott x + y esetén Geometriai úton is levezethető az egyenlőtlenség, ha a síkon az x + y = 2m rögzített egyenest és az xy = c görbék seregét tekintjük, ahol c ezen görbék (hiperbolák) mindegyikére állandó, s változik görbéről görbére. Amint az a 221. ábrából nyilvánvaló, azok közül a görbék közül, melyeknek van közös pontja az egyenessel, a legnagyobb c értékű hiperbola érinteni fogja az egyenest x = y = m pontban; így erre a hiperbolára c = m2 . Tehát
xy 5
x+y 2
2 .
Meg kell jegyezni, hogy bármely f(x, y) 5 g(x, y) egyenlőtlenség olvasható mind a kétféleképpen, s így egyformán eredményez maximum és minimum tulajdonságot. Pl. (1) azt a tényt is kifejezi, hogy adott területű négyszögek közül a négyzetnek van legkisebb kerülete.
438
2. Általánosítás n változó esetére Két pozitív mennyiség aritmetikai és geometriai közepe közötti (1) összefüggés kiterjeszthető bármely n számú, x1 , x2 , . . ., xn pozitív mennyiségre. Az m=
x1 + x2 + . . . + xn n
mennyiséget aritmetikai középnek, a g=
√ n x1 x2 . . . xn
mennyiséget pedig, ahol az n-edik gyök pozitív értékét vesszük, geometriai középnek nevezzük. Az általános tétel azt állítja, hogy g5m és, hogy g = m csak akkor igaz, ha az összes xi egyenlő. Ennek az általános eredménynek sok különféle szellemes bizonyítását gondolták már ki. Legegyszerűbb, ha visszavezetjük az 1. pontban használt érvelésre a következő maximumproblémával: osszunk adott pozitív C mennyiséget n pozitív részre, C = x1 + . . . + xn , úgy, hogy a P = x1 x2 . . . xn szorzat a lehető legnagyobb legyen. Abból a nyilvánvaló, de majd csak a 7. §-ban elemezendő feltevésből indulunk ki, hogy P-nek van maximuma és ezt az x1 = a1 , . . . , xn = an értékek szolgáltatják. Csupán azt kell bebizonyítanunk, hogy a1 = a2 = . . . = an , mivel ebben az esetben g = m. Tegyük fel, hogy ez nem igaz, pl., hogy a1 6= a2 . Tekintsük az alábbi n mennyiséget: x1 = s, x2 = s, x3 = a3 , . . . , xn = an ahol s=
a1 + a2 . 2
Más szóval helyettesítsük az ai mennyiségeket más mennyiségek rendszerével úgy, hogy
439
az első kettőt egyenlővé tesszük egymással, de a mennyiségek C összege változatlan marad. Írhatjuk, hogy a1 = s + d,
a2 = s − d,
ahol d=
a1 − a2 . 2
Az új szorzat P 0 = s2 · a3 . . . an , míg a régi szorzat P = (s + d) · (s − d) · a3 . . . an = (s2 − d2 ) · a3 . . . an , tehát nyilvánvaló, hogy hacsak nem d = 0, P < P 0, ellentétben azzal a feltevésünkkel, hogy P a maximum. Tehát d = 0 és a1 = a2 . Ugyanígy bizonyíthatjuk be, hogy a1 = ai , ahol ai az a-k bármelyike; következésképpen minden a egyenlő. Mivel g = m akkor igaz, ha minden xi egyenlő, és mivel láttuk, hogy csak ez szolgáltatja g számára a maximum értéket, következik, hogy minden más esetben g < m, amint azt a tétel állítja. 3. A legkisebb négyzetek elve n szám: x1 , . . ., xn aritmetikai közepének fontos minimum tulajdonsága van. A jelen pontban nem kell mind az n számnak pozitívnak lennie. Legyen u egy ismeretlen mennyiség, amelyet valamilyen mérőműszerrel a lehető legpontosabban akarunk meghatározni. Ebből a célból n számú leolvasást végzünk, amelyek különféle kísérleti hibaforrások miatt kissé különböző x1 , . . ., xn értékekre vezetnek. Melyik u értéket kell akkor legmegbízhatóbbként elfogadni? Ennek az „igaz” vagy „optimális” értéknek az m =
x1 +...+xn n
aritmetikai közepet szokás tekinteni. Ennek a feltevésnek valódi igazolására részletesen tárgyalni kellene a valószínűségszámítást. De enélkül is felhívhatjuk a figyelmet m minimum tulajdonságára, amely magyarázza a választást. Az u − x1 , . . . , u − xn
440
különbségek ugyanis, ha u a mért mennyiség bármely lehetséges értéke, ennek az értéknek a különböző leolvasásoktól való eltérései, amelyek részben pozitívak, részben negatívak, és u optimális értékének leginkább azt az értéket választhatjuk, amelyre az összeltérés valamilyen értelemben véve a lehető legkisebb. Szokásos Gauss nyomán nem magukat az eltéréseket, hanem azok (u − xi )2 négyzeteit tekinteni a pontatlanság megfelelő mértékének, u lehetséges értékei közül pedig azt választani optimális értékként, amelyre az eltérések négyzetének (u − x1 )2 + (u − x2 )2 + . . . + (u − xn )2 összege a lehető legkisebb. u-nak ez az optimális értéke éppen az m aritmetikai közép. Ez a tény a kiindulópontja Gauss fontos „legkisebb négyzetek módszeré”-nek. A dűlt betűvel szedett állítást igen elegáns módon igazolhatjuk. Írjuk fel (u − xi ) = (m − xi ) + (u − m) alakban az eltéréseket, akkor (u − xi )2 = (m − xi )2 + (u − m)2 + 2(m − xi )(u − m). Adjuk össze mind az i = 1, 2, . . ., n-re felírt egyenleteket. Az utolsó tagokból 2(u − m)(nm − x1 − . . . − xn ) értéket kapunk, amely m definiciója miatt 0; következésképpen (u − x1 )2 + . . . + (u − xn )2 = (m − x1 )2 + . . . + (m − xn )2 + n(m − u)2 . Ebből látjuk, hogy (u − x1 )2 + . . . + (u − xn )2 = (m − x1 )2 + . . . + (m − xn )2 és, hogy az egyenlőségjel kizárólag u = m esetére érvényes, ami bizonyítandó volt. A legkisebb négyzetek általános módszere ezt az eredményt tekinti vezérelvnek bonyolultabb esetekben, amikor nem teljesen összeegyeztethető mérésekből kell eldönteni, mi a legvalószínűbb eredmény. Tegyük fel pl., hogy megmértük egy elméleti egyenes n
441
pontjának xi , yi koordinátáit, és a megmért pontok nem feküsznek pontosan rajta egy egyenesen. Hogyan húzzuk meg azt az egyenest, amelyik legjobban illik a megfigyelt n ponthoz? Fentebb talált eredményünk alapján a következő eljárást választhatjuk, bár igaz, hogy ez más, éppen ennyire megokolható eljárással is helyettesíthető. Legyen y = ax + b az egyenes egyenlete, úgyhogy a probléma a és b együtthatók meghatározása. Az xi , yi pontnak az egyenestől való távolságát y irányban yi − (axi + b) = yi − axi − b adja meg, ahol aszerint kell a pozitív vagy negatív előjelet venni, hogy a pont az egyenes felett vagy alatt helyezkedik el. Ennek a távolságnak a négyzete (yi − axi − b)2 , és a módszer egyszerűen abban áll, hogy a és b értékét úgy határozzuk meg, hogy az (y1 − ax1 − b)2 + . . . + (yn − axn − b)2 kifejezés lehető legkisebb értékű legyen. Ez a minimumprobléma két ismeretlent tartalmaz, a-t és b-t. A megoldás részletes tárgyalását, noha egyszerű, itt nem közöljük.
7. § Szélső pont létezése. Dirichlet-féle elv 1. Általános megjegyzések Az eddigiekben tárgyalt szélső érték problémák némelyikénél közvetlenül láttuk, hogy a megoldás minden más „versenytársánál” jobb eredményt ad. Hatásos példa volt erre a Schwarz-féle megoldás a háromszögprobléma esetében, ahol azonnal láthattuk, hogy egyetlen beírt háromszögnek sincs rövidebb kerülete mint a talppontti háromszögnek. További példák az olyan minimum- vagy maximumproblémák, ahol a megoldás egy explicit egyenlőségtől függ, mint amilyen pl. az aritmetikai és geometriai közepek közötti egyenlőtlenség. Azonban a tárgyalt problémák egy részénél másképpen jártunk el. Abból a feltevésből indultunk ki, hogy már találtunk megoldást; akkor azután elemeztük ezt a feltevést és olyan következtetésekre jutottunk, amelyek végül is lehetővé tették a megoldás leírását és megszerkesztését. Ez volt a helyzet pl. a Steiner-probléma megoldásában és a Schwarz-féle probléma második tárgyalásában. A két módszer logikailag különböző. Az első talán tökéletesebbnek látszik, mivel többé-kevésbé konstruktív bizonyítását adja a megoldásnak. A második módszer, amint azt a háromszögprobléma esetében láttuk, igen gyakran egyszerűbb. Azonban nem olyan közvetlen, és mindenekelőtt feltételes
442
struktúrájú, ugyanis abból a feltevésből indul ki, hogy a probléma megoldása létezik. A megoldásnak az a feltétele, hogy ezt a feltevést elfogadjuk vagy igazoljuk. E nélkül a feltevés nélkül a második módszer csak annyit mond, hogy ha a megoldás létezik, akkor ilyen meg ilyen jellegűnek kell lennie.2 A megoldás létezésének premisszája látszólag nyilvánvaló, azért a matematikusok a XIX. század második feléig nem törődtek az itt szereplő logikai szemponttal, és szélső érték problémák megoldásának a létezését magától értetődőnek tekintették. A XIX. század néhány nagy matematikusa – Gauss, Dirichlet, Riemann – ezt a feltevést minden aggály nélkül használta, mély és más úton alig elérhető tételek levezetésére a matematikai fizikában és a függvénytanban. A válság akkor következett be, amikor 1849-ben Riemann közzétette a komplex-változós függvénytan megalapozásáról szóló doktori értekezését. Ez a tömör dolgozat, amely egyébként a modern matematika legnagyobb úttörő munkái közé tartozik, annyira nem ortodox módon közelítette meg tárgyát, hogy a matematikusok többsége legszívesebben tudomást sem vett volna róla. Akkoriban Weierstrass volt a berlini egyetem legkiválóbb matematikusa, a szigorú függvénytan felépítésének elismert mestere. Tetszett neki Riemann dolgozata, de kétkedéssel fogadta, és hamar észrevett egy olyan logikai hiányosságot, amelynek a kiküszöbölésével a dolgozat szerzője nem bajlódott. Weierstrass megsemmisítő kritikája, ha magát Riemannt nem is zavarta, egy időre elméletének csaknem teljes elhanyagolását eredményezte. Riemann meteorszerű pályájának pár év múlva hirtelen véget vetett a tüdőbaj. Gondolatainak azonban mindig akadt néhány lelkes követője, és ötven évvel doktori értekezésének megjelenése után sikerült végre Hilbert nek utat törni azoknak a kérdéseknek teljes megválaszolása felé, melyeket Riemann dolgozata elintézetlenül hagyott. Az a fejlődés pedig, amit a matematika és matematikai fizika ezen a területen elért, a modern matematikai analízis történetének egyik legnagyobb diadala lett. Riemann dolgozatában a kritizálható pont egy minimum létezésének a kérdése. Riemann elméletének nagy részét arra alapította, amit ő Dirichlet-féle elvnek nevezett (Dirichlet Riemann tanára volt Göttingában, erről az elvről előadott, de sohasem írt le 2
A következő téves érvelés illusztrálja, hogy szükség van az extrémum létezésének a logikai bizonyítására: azt állítjuk, hogy 1 a legnagyobb egész szám. Ugyanis jelöljük a legnagyobb egész számot x-szel. Ha x > 1, akkor x2 > x, tehát x nem lehet a legnagyobb egész szám. Következésképpen x-nek egyenlőnek kell lennie 1-gyel. Ez az ellentmondás, amin ez a téves érvelés nyugszik, természetesen azon a hallgatólagos feltevésen alapul, hogy létezik legnagyobb egész szám.
443
róla semmit). Tegyük fel pl., hogy a sík vagy bármely más felület egy részét vékony ónlemezzel fedjük, és az ónlemez két pontját galvánelem pólusaival kötve össze, egyenáramot bocsátunk át rajta. Semmi kétség afelől, hogy a fizikai kísérlet meghatározott eredményre vezet. De mit mondjunk a megfelelő matematikai problémáról, amelyik elsőrendű fontosságú a függvénytanban és a matematika más területén is? Az elektromosságtan szerint a fizikai jelenséget mint „egy parciális differenciálegyenlet peremértékfeladatát” írják le. Ebben a matematikai alakjában érdekel minket; a probléma fizikai jelenséggel feltételezett ekvivalenciája plauzibilissá teszi a megoldást, azonban semmiképpen sem jelenti matematikai bizonyítását. Riemann két lépésben intézte el a matematikai kérdést. Először megmutatta, hogy a probléma minimumproblémával ekvivalens: egy mennyiség, amely az elektromos áram energiáját fejezi ki, a ténylegesen fellépő árameloszlásban minimum azokhoz a többi árameloszlasokhoz képest, amelyek az előírt feltételek között még lehetségesek. A következő lépésben azután „Dirichlet-féle elvként” mondotta ki, hogy ilyen minimumproblémának van megoldása. Riemann a legcsekélyebb kísérletet sem tette második állítása bizonyítására, és éppen ez volt az a pont, amit Weierstrass megtámadott. A minimum létezése nemcsak, hogy nem volt evidens, hanem, amint később kiderült, kiváltképpen kényes kérdés volt, amelyre az akkori idők matematikája még nem is volt felkészülve, és amelyet csak sok évtized intenzív kutatásának az árán sikerült végül megoldani. 2. Példák Az alábbiakban két példával illusztráljuk, miféle természetű nehézségről van itt szó. 1. Egy L egyenesen két pontot jelölünk ki, A-t és B-t, egymástól d távolságra, és keressük azt a legrövidebb sokszög vonalat, amely A-ból L-re merőleges irányban kiindulva Bben végződik. Mivel minden lehetséges út között AB egyenes szakasz a legrövidebb összeköttetés A és B pont között, bizonyosak lehetünk, hogy a versenyben engedélyezett minden út hosszabb lesz d-nél, mivel az egyetlen d hosszúságú út AB szakasz, amely megsérti az A-ban érvényes irányra kikötött megszorítást, és így a probléma keretei között nem megengedhető. Tekintsük másrészről a 222. ábrán feltüntetett AOB megengedhető utat. Ha O-t A-hoz elegendően közel fekvő O 0 ponttal helyettesítjük, kaphatunk olyan megengedhető pályát, amelyik tetszőlegesen kicsiny értékkel tér el d-től; tehát ha létezik
444
legrövidebb megengedhető út, nem lehet hosszabb d-nél, és így pontosan d hosszúságú kell legyen. De az egyetlen d hosszúságú pálya, amint láttuk, nem megengedhető. Így nem létezhet legrövidebb megengedhető út, és az állított minimumproblémának nincs megoldása.
222. ábra
223. ábra
2. Legyen C, amint az a 223. ábrán látható, egy kör és legyen S a kör középpontja felett egységnyi távolságban levő pont. Tekintsük mindazoknak a felületeknek az osztályát, amelyeket C határol, s keresztülmennek S ponton, és C felett nincs két pontjuk, melynek C síkjára való vetülete egybeesne. Melyik felületnek lesz ezek közül legkisebb területe? Bármilyen természetesnek látszik a probléma, nincs megoldása: nincs minimális felszínű megengedhető felület. Ha nem tűztük volna ki azt a feltételt, hogy a felület haladjon át az S ponton, a megoldást nyilvánvalóan a C kör által határolt sík körlemez szolgáltatná. Jelöljük ennek a területét A-val. Bármely más C által határolt felület felszínmértékének nagyobbnak kell lennie A-nál. Található azonban olyan megengedhető felület, amely tetszőlegesen kicsiny értékkel haladja túl A-t. Vegyük ebből a célból azt az egységnyi magasságú kúpfelületet, amelyik olyan karcsú, hogy palástjának területe bármely előre megadott értéknél kisebb. Helyezzük ezt a kúpot csúcsával S pontban a körlemezre, és tekintsük azt a felületet, amelyet a kúp palástjának területe és a körlemeznek a kúp alapján kívül eső területe alkot. Világos, hogy ez a felület, amelyik csak a körlemez középpontja közelében tér el a síktól, minden előre megadottnál kisebb értékkel nagyobb A-nál. Mivel ezt az előre megadott értéket tetszőlegesen kicsinynek választhatjuk, újból az következik, hogy a minimum, ha létezik, nem lehet más, mint a körlemez A területe. De a C kör által határolt felületek között egyedül a körlemeznek ekkora a területe,
445
és mivel a körlemez nem halad át S ponton, megsérti a megengedhetőség feltételét. Következésképpen a problémának nincs megoldása. Mellőzhetjük a Weierstrass által adott ravaszabb problémákat. Elég jól látjuk a fenti kettőből is, hogy a minimum létezése nem trivialis része a matematikai bizonyításnak. Mondjuk el a dolgot általánosabb és absztrakt formában. Tekintsük objektumok, pl. görbék vagy felületek meghatározott osztályát, és rendeljünk hozzá minden egyes objektumhoz függvényként valamilyen számot, pl. hosszúságot vagy felszínt. Ha az osztályban csupán véges számú objektum van, nyilvánvaló, hogy az objektumoknak megfelelő számok között kell egy legnagyobbnak és egy legkisebbnek lenni. Azonban, ha az osztály végtelen sok objektumot tartalmaz, akkor nem föltétlenül kell legnagyobb vagy legkisebb számnak létezni, még akkor sem, ha mindezek a számok rögzített korlátok között maradnak. Ezek a számok általában a számegyenes valamely végtelen halmazát képezik. Tegyük fel pl. egyszerűség kedvéért, hogy az összes szám pozitív. Akkor a halmaznak van „legnagyobb alsó korlátja”, azaz olyan α pont, amelynél kisebb szám nincsen a halmazban, s amely maga vagy eleme a halmaznak, vagy tetszőleges pontossággal megközelíthető a halmaz elemei által. Ha α a halmazhoz tartozik, akkor a halmaz legkisebb eleme; egyébként pedig a halmaznak egész egyszerűen nincsen legkisebb eleme. Pl. az 1, 1/2, 1/3, . . . számok halmazának nincsen legkisebb eleme, mivel az alsó határ: a 0, nem tartozik a halmazhoz. Ezek a példák absztrakt módon illusztrálják az egzisztencia-problémákkal kapcsolatos logikai nehézségeket. A minimumprobléma matematikai megoldása nem teljes addig, amíg explicite vagy implicite nem bizonyitottuk, hogy a problémához rendelt számértékek halmazában van legkisebb elem. 3. Elemi szélső érték problémák Elemi problémák esetében a megoldás létezésének a kérdése csupán a szereplő alapfogalmak figyelmes elemzését kívánja meg. Említettük a VI. fejezet 5. §-ában a zárt halmaz általános fogalmát; azt állítottuk, hogy zárt halmazon értelmezett folytonos függvénynek mindig van a halmazon egy legnagyobb és egy legkisebb értéke. Az előzőkben tárgyalt elemi problémák mindegyikében úgy lehet tekinteni az összehasonlító értékeket, mint egy egyváltozós vagy többváltozós függvény értékeit egy olyan tartományban, amely vagy zárt vagy a probléma lényeges megváltoztatása nélkül zárttá tehető. Ilyen esetben
446
bizonyos a maximum és a minimum létezése. Steiner problémájában pl. a kérdéses mennyiség három távolság összege, és ez a mozgatható pont helyzetének folytonos függvénye. Mivel a szabadon mozgatható pont változási tartománya az egész sík, semmit sem veszítünk, ha az ábrát egy nagy körbe zárjuk, és ennek a körnek belső és határoló pontjaira szorítkozunk. Ugyanis mihelyt a szabadon mozgó pont elég messze van a három adott ponttól, ezen pontoktól való távolságainak az összege bizonyosan nagyobb lesz, mint AB + AC, amely érték egyike a függvény megengedhető értékeinek. Ha tehát van minimum a nagy körre korlátozott valamely pontra, akkor ez minimum lesz az eredeti probléma számára is. Azt azonban könnyű megmutatni, hogy a kör belsejéből és a körből álló tartomány zárt halmaz, így tehát Steiner problémájában létezik minimum.
224. ábra. Görbék, melyek között nincsen leghosszabb, sem legrövidebb távolság Az alábbi példán látható annak a feltevésnek a fontossága, hogy a független változó változási tartománya zárt halmaz. Ha adva van két zárt görbe, C1 és C2 , akkor mindig létezik C1 -en illetve C2 -n olyan P1 illetve P2 pont, amelyek a lehető legkisebb, és két olyan Q1 , Q2 pont, amelyek a lehető legnagyobb távolságra vannak egymástól. Ugyanis C1 valamely A1 pontja és C2 valamely A2 pontja közötti távolság a tekintett A1 , A2 pontpárokból álló zárt halmazon értelmezett folytonos függvény. Azonban, ha a két görbe nem korlátos, hanem végtelenbe terjed, akkor előfordulhat, hogy a problémának nincs megoldása. Pl. a 224. ábrán látható esetben sem legkisebb, sem legnagyobb távolság nincs a görbék között; a távolság alsó határa 0, felső határa végtelen, és a távolság egyiket sem éri el. Van olyan eset, hogy minimum létezik, de maximum nem. Pl. a hiperbola két ágának (17. ábra, 95. o.) csak minimális távolsága van egymástól, A és A 0 -nél, mivel nyilvánvalóan nincs a hiperbolának két, egymástól maximális távolságban
447
levő pontja. Ezt a viselkedésbeli különbséget könnyen megmagyarázhatjuk mesterségesen korlátozva a változók változási tartományát. Válasszunk egy R tetszőleges pozitív számot, és korlátozzuk x-et az |x| 5 R feltétellel. Akkor mindkét utóbb említett esetben létezik maximum is, minimum is. Az első esetben a kiszabott korlát biztosítja a maximális és minimális távolság létezését, mindkettő a korláton lévén. Ha R-et növeljük, azok a pontok, amelyekre a szélső értékeket kapjuk, újból a korláton lesznek. A második esetben a minimumtávolság a tartomány belsejében van, akárhogyan is választjuk meg R-et, a két minimumpont távolsága nem változik. 4. A bonyolultabb esetek nehézségeiről Egy, kettő, vagy akárhány véges számú független változót tartalmazó elemi probléma esetében az egzisztenciakérdés sohasem okoz komoly nehézséget. De a Dirichlet-féle elv, vagy akár egyszerűbb hasonló problémák esetében is, egészen más a helyzet. Ennek vagy az az oka, hogy a független változó változási tartománya nem zárt, vagy pedig az, hogy a függvény nem folytonos. A 2. pont első példájában olyan AO 0 B utak sorozatát tekintettük, ahol O 0 pont A ponthoz tartott. A sorozat mindegyik útja kielégítette a megengedhetőség feltételét. Azonban az AO 0 B utak az AB szakaszhoz tartottak, s ez nem esett többé a megengedhetőség feltétele alá. A megengedhető utak halmaza ebben a tekintetben a 0 < x 5 1 intervallumhoz hasonlít, amelyre nem érvényes Weierstrass szélső érték tétele (l. 380. o.). A második példában hasonló helyzetet láttunk: ha a kúp egyre karcsúbb lesz, a megfelelő megengedhető felületek sorozata ahhoz a felülethez tart, amely a körlemezből s a reá merőleges S-ig érő egyenesből áll. Ez a határoló geometriai képződmény azonban nincsen a megengedhető felületek között, a megengedhető felületek halmaza megint nem zárt halmaz. Nem folytonos függés példájaként tekintsük egy görbe hosszúságát. Ez többé nem véges számú számváltozó függvénye, hiszen egy egész görbét nem lehet véges számú „koordinátával” jellemezni, és nem folytonos függvénye a görbének. Hogy ezt belássuk, tekintsük két, egymástól d távolságra levő A és B pontot összekötő zegzugos Pn sokszögvonalat, amely AB szakasszal együtt n egyenlő oldalú háromszöget képez, amint az a 225. ábrán látható. Nyilvánvaló az ábrából, hogy Pn összhosszúsága pontosan
448
225. ábra. Szakasz közelítése a szakasznál kétszer hosszabb sokszögvonalakkal 2d lesz n minden értékére. Tekintsük most a P1 , P2 , . . . sokszögvonalak sorozatát. Az egyes háromszögek magassága csökken, amint a számuk nő, és nyilvánvaló, hogy Pn sokszögvonal AB egyeneshez tart, amikor a határon a sokszögvonal „fogai” eltűnnek. Pn hosszúsága mindig 2d, független az n index értékétől, míg a határoló görbe, azaz az egyenes szakasz hosszúsága csupán d. Tehát a hosszúság nem folytonos függvénye a görbének. Ezek a példák meggyőzhetnek arról, hogy bonyolultabb szerkezetű minimumproblémák esetében – a megoldás létezését illetően – valóban óvatosság szükséges.
8. § Az izoperimetrikus probléma Előírt hosszúságú zárt görbék által körülzárt idomok területe közül a kör területe a legnagyobb. Ez egyike azoknak a „nyilvánvaló” matematikai tényeknek, amelyeket csupán modern módszerekkel sikerült szigorúan bizonyítani. Steiner különféle szellemes bizonyításokat talált erre a tételre, a következőkben ezekből közlünk egyet.
449
226. ábra
227. ábra
Induljunk ki abból a feltevésből, hogy létezik megoldás. Ezt elfogadva, tegyük fel, hogy C a keresett görbe, amely az előírt L hosszúság mellett maximális területet zár körül. Könnyű kimutatni, hogy C-nek konvex görbének kell lennie, azaz C bármely két pontját összekötő egyenes szakasznak teljesen C belsejében vagy C-n kell feküdnie. Ugyanis ha C nem lenne konvex, amint az pl. a 226. ábrán látható, akkor húzható lenne egy olyan szakasz, mint az ábrán a C görbe O és P pontja közötti OP szakasz, amely teljesen C görbén kívül fekszik. Az OQP ív OP egyenesre vonatkozó OQ 0 P tükörképe az eredeti görbe ORP ívével együtt olyan L hosszúságú görbét képez, amely nagyobb területet zár körül, mint az eredeti C görbe, hiszen magába foglalja a járulékos I és II területeket is. Ez ellentmond annak a feltevésnek, hogy C zárja körül előírt L hosszúság mellett a legnagyobb területet. Tehát C-nek konvex görbének kell lennie.
228. ábra
229. ábra
Válasszunk most két pontot, A-t és B-t; amelyek a megoldást képviselő C görbét két
450
egyenlő ívhosszúságú részre osztják. Akkor az AB egyenesnek C területét két egyenlő részre kell osztania, mivel egyébként a nagyobbik területet AB egyenesre tükrözve (227. ábra) olyan másik L hosszúságú görbét kapnánk, amelyik nagyobb területet zárna körül mint C. Ebből következik, hogy C megoldásgörbe felének meg kell oldania a következő problémát: határozzuk meg azt az L/2 ívhosszúságú ívet, melynek A, B végpontjai egy egyenesen vannak, és az egyenessel maximális területet zár körül. Kimutatjuk, hogy ennek az új problémának a megoldása félkör, úgyhogy az izoperimetrikus problémát megoldó teljes C görbének körnek kell lenni. Legyen AOB az új probléma megoldása. Elegendő azt bebizonyítani, hogy minden beírt szög, mint pl. a 228. ábrán az AOB^, derékszög, ugyanis ebből következik, hogy AOB félkör. Tegyük fel az ellenkezőjét, ti. azt, hogy AOB szög nem 90◦ . Akkor a 228. ábra egy másik, 229. ábrával cserélhető ki, amelyben a vonalkázott területek és az AOB ív hosszúsága nem változott, míg a háromszögletű terület megnőtt azáltal, hogy AOB^-et 90◦ -kal tettük egyenlővé, vagy legalábbis 90◦ -hoz közelebb esővé. Így a 229. ábra nagyobb területet ad, mint az eredeti (l. 400. o.). Azonban abból a feltevésből indultunk ki, hogy a 228. ábra oldja meg a problémát, úgyhogy a 229. ábra nem eredményezhet nagyobb értéket. Ebből az ellentmondásból láthatjuk, hogy AOB^-nek derékszögnek kell lennie, bárhol vesszük is fel az O pontot, s ez befejezi a bizonyítást. A kör izoperimetrikus tulajdonsága kifejezhető egyenlőtlenség alakjában is. Ha L a kör kerülete, területe L2 /4π, így bármely zárt görbe A területe és L ívhosszúsága között érvényes az A 5 L2 /4π izoperimetrikus egyenlőtlenség, az egyenlőségjel csak a kör esetében érvényes. *Nyilvánvaló a 7. §-ban mondottakból, hogy Steiner bizonyításának csupán feltételes érvénye van: „ha létezik adott L ívhosszúsag mellett maximális területű görbe, akkor annak körnek kell lennie.” A hipotetikus premissza igazolására teljesen más természetű, új érvelés szükséges. Bizonyítsunk be előbb egy elemi tételt páros 2n oldalszámú Pn zárt sokszögekre vonatkozóan: azonos hosszúságú 2n oldalú zárt sokszögvonalak közül a szabályos 2n-szög területe a legnagyobb. A bizonyítás Steiner fenti érvelését követi, némi módosítással. Az egzisztencia kérdése itt nem okoz nehézséget, mivel a 2n-szög, hosszúságát és területét beleértve, folytonosan függ csúcsainak 4n számú koordinátájától, és így a függvény értelmezési tartományának az általánosság megszorítása nélkül a 4n
451
dimenziós tér egy zárt ponthalmazát tekinthetjük. Ennek megfelelően a probléma sokszögekre megfogalmazott alakjában nyugodtan kiindulhatunk abból a feltevésből, hogy megoldásként létezik valamely P sokszög, és elemezhetjük ezen az alapon P tulajdonságait. Pontosan ugyanúgy, mint Steiner bizonyításában, következik ebből, hogy P-nek konvexnek kell lennie. Azután bebizonyítjuk, hogy P-nek mind a 2n oldala azonos hosszúságú kell legyen. Tegyük fel ugyanis, hogy két szomszédos oldal, AB és BC különböző hosszúságú; akkor levághatnánk P-ből ABC háromszöget és AB 0 C egyenlő szárú háromszöggel helyettesíthetnénk, amelyben AB 0 + B 0 C = AB + BC, és amelynek nagyobb a területe (l. 1. §). Így egy azonos kerületű és nagyobb területű P 0 poligont kapnánk, ellentétben azzal a feltevésünkkel, hogy P az optimális 2n oldalú sokszög. Ezért P minden oldalának egyenlő hosszúságúnak kell lenni, és ezután már csak annak a bizonyítása van hátra, hogy P szabályos sokszög; amihez elegendő azt tudni, hogy P minden csúcsa körön fekszik. A gondolatmenet ismét Steiner mintáját követi. Először azt mutatjuk meg, hogy bármely két szemközti, pl. az első és (n + 1)-edik, csúcsot összekötő átló két egyenlő részre osztja a területet. Azután bebizonyítjuk, hogy a két fél közül az egyiknek minden csúcsa félkörön fekszik. A részletek levezetését, amelyek mindenben a fenti Steiner-féle mintát követik, feladatként az olvasóra bízzuk.
230. ábra Ezek után az izoperimetrikus probléma létezése a probléma megoldásával együtt határátmenettel bizonyítható, ha az oldalak száma a végtelenhez tart és az 230. ábra optimális szabályos sokszög körhöz.
452
Steiner érvelése egyáltalában nem alkalmas arra, hogy három dimenzióban bizonyítsuk a gömb megfelelő izoperimetrikus tulajdonságát. Steiner közölt ugyan egy kissé különböző és sokkal bonyolultabb eljárást, amelyik egyaránt beválik három és két dimenzióban, de mivel nem adaptálható olyan könnyen egzisztenciabizonyítására, mint a kétdimenziós Steiner-féle bizonyítás, nem közöljük. A gömb esetében valóban sokkal nehezebb bizonyítani az izoperimetrikus tulajdonságot, mint a körnél; teljes és szigorú bizonyítását sokkal későbben adta meg egyik értékes dolgozatában H. A. Schwarz. A háromdimenziós izoperimetrikus probléma 36πV 2 5 A3 egyenlőtlenséggel fejezhető ki, amely tetszőleges háromdimenziós zárt test A felszíne és V térfogata között áll fenn. Az egyenlőség egyedül a gömb esetében érvényes.
*9. § Szélső érték feladatok kerületi feltételekkel. Összefüggés Steiner problémája és az izoperimetrikus probléma között Érdekes eredményeket kapunk szélső érték problémáknál, ha a változók tartományát kerületi feltételekkel korlátozzuk. Weierstrass tétele, ami szerint a folytonos függvény zárt tartományban felvesz egy legnagyobb és egy legkisebb értéket, nem zárja ki annak a lehetőségét, hogy a függvény a szélső értékeket a tartomány határán vegye fel. Egyszerű, csaknem triviális példa az u = x függvény. Ha x nincs korlátozva, és −∞-től a +∞ig változhat, akkor a független változó B tartománya az egész számegyenes; érthető tehát, hogy az u = x függvénynek sehol sincs sem legkisebb, sem legnagyobb értéke. Azonban ha B tartományt korlátozzuk, pl. 0 5 x 5 1 zárt intervallumra, akkor létezik a függvénynek legnagyobb értéke, 1, amit az intervallum jobb oldali végpontjában, és legkisebb értéke, 0, amit a baloldali végpontban ér el. Azonban ezek a szélső értékek nem ábrázolhatók tető- ill. mélyponttal a függvény görbéjén; nem szélső pontok egy teljes kétoldalú környezetre vonatkoztatva. Az intervallum tágításával együtt változnak, mivel az intervallum végpontjaiban maradnak. A függvény valódi tető- vagy mélypontjaiban az extremális jelleg mindig annak a pontnak egy teljes környezetére vonatkozik, amelyben a függvény szélső értéket ért el; ezt nem változtatja meg a határ csekély változása. Az
453
ilyen szélső érték még akkor is megmarad, ha a független változó szabadon változik a B tartományban, legalábbis egy elegendően kis környezetben. Az ilyen „szabad” és a határon felvett szélső értékek közötti különbségtétel sok esetben, látszólag teljesen különböző összefüggésben, hasznos felvilágosítást adhat. Egyváltozós függvények esetére természetesen a különbség semmi egyéb, mint a monoton és nem monoton függvények közötti különbség, s így nem vezet különösebben érdekes megfigyelésekhez. De sok fontos példát ismerünk olyan szélső értékekre, amelyeket több változós függvények vesznek fel értelmezési tartományuk határán. Ez lehet a helyzet pl. a Schwarz-féle háromszög-problémában. Ott a három független változó változási tartománya azon pontok összes hármasából áll, amely pontok az ABC háromszög három oldalán helyezkednek el minden egyes ponthármas esetében. A probléma megoldásában két lehetőség között kellett választani: az első lehetőséget akkor kaptuk, ha mind a három függetlenül változó pont, P, Q, R a háromszög megfelelő oldalán mint egyenes szakaszon belül feküdt, ebben az esetben a minimumot a talpponti háromszög adta. A második esetben a minimumot abban a határhelyzetben kaptuk, ahol P, Q, R pontok közül kettő egybeesett a nekik megfelelő oldalak közös végpontjával, ebben az esetben a minimális beírt „háromszög” az ezen csúcshoz tartozó magasság kétszerese. Így tehát a megoldás jellege erősen különbözik aszerint, hogy a két lehetőség közül melyik valósul meg. Steiner három falu problémájában P pont változási tartománya az egész sík, a három adott pont pedig: A, B, C úgy tekinthető, mint a változási tartomány határpontja. Megint két lehetőség van, amely két teljesen különböző típusú megoldást eredményez: a minimumot vagy ABC háromszög belsejében kapjuk, ez a három egyenlő szög esete, vagy valamelyik C határpontban. Hasonló alternatíva érvényes a komplementer problémában is. Utolsó példaként tekinthetjük a korlátozó kerületi feltételekkel módosított izoperimetrikus problémát. Meglepő összefüggésre fogunk így akadni az izoperimetrikus probléma és Steiner problémája között, és ugyanakkor egy új típusú szélső érték probléma talán legegyszerűbb esetét fedezzük fel. Az eredeti izoperimetrikus problémában a független változó, azaz az adott ívhosszúságú zárt görbe, tetszőleges módon eltérhetett a köralaktól, és összehasonlítás szempontjából minden ilyen deformált görbét megengedtünk,
454
úgy hogy itt valódi szabad minimummal állunk szemben. Tekintsük most a következő módosított problémát: Legyen adva három pont: P, Q, R. Minden lehetséges C görbe haladjon át ezen a három adott ponton, vagy tartalmazza ezeket a pontokat, belsejébe bezárva. Legyen a görbe által körülzárt A terület előírt, tegyük a görbe L ívhosszúságát minimummá. Ez a feladat valódi kerületi feltételt képvisel.
231. ábra
232. ábra
234. ábra
233. ábra
235. ábra
A Steiner-probléma megoldásához tartó izoperimetrikus alakzatok Nyilvánvaló, hogy ha A-t elegendően nagynak adjuk meg, a három pont, P, Q, R egyáltalában nem számít a problémában. Valahányszor a PQR háromszög köré írt kör területe kisebb vagy akkora mint A, a megoldás egyszerűen a három pontot magába foglaló A területű kör lesz. De mi történik, ha A kisebb? A következőkben közöljük a választ, azonban a kissé hosszadalmas bizonyítást mellőzzük, noha nem haladná meg felkészültségünket. Jellemezzük a megoldásokat az A értékek valamely nullához tartó sorozatára. Mihelyt A a háromszög köré írt kör területénél kisebb lesz, az eredeti izoperimetrikus kör három ívre esik szét, mindhárom körvínek azonos lesz a sugara, az alakzat pedig konvex körívháromszög lesz, melynek P, Q, R a csúcsai (232. ábra). Ez
455
a háromszög a megoldás; méretei meghatározhatók A adott értékéből. Ha A tovább csökken, a háromszög oldalait alkotó körívek sugara növekszik, a körívek egyre inkább közelednek az egyeneshez, végül amikor A pontosan PQR területével lesz egyenlővé, a megoldást maga a hároszög adja. Ha most A még tovább csökken, akkor a megoldás ismét három azonos sugarú körívből fog állani, amelyek P, Q, R csúcsú háromszöget képeznek. Ebben az esetben azonban a háromszög konkáv, és az ívek PQR háromszög belsejében feküsznek (233. ábra). Amint A tovább csökken, elérkezik az a pillanat, amikor valamely A értéknél két konkáv ív érinti egymást az egyik, mondjuk az R csúcsban. Ha A tovább csökken, nem lehet többé olyan típusú körív-háromszöget szerkeszteni mint eddig. Új jelenséggel találkozunk: a megoldás még mindig körív-háromszög, azonban R 0 csúcsa elvált a megfelelő R csúcstól, és a megoldás most PQR 0 körív-háromszögből plusz RR 0 egyenesből áll, az utóbbit kétszer számítva (mert R 0 -től R-ig halad és vissza). Ez az egyenesszakasz érinti az R 0 -ben egymást érintő két körívet. Ha A még tovább csökken, a leválási folyamat a másik két csúcsnál is beáll. Megoldásként olyan idomot kapunk, amely három egyenlő sugarú, egymást érintő körívből álló egyenlő oldalú P 0 Q 0 R 0 körívháromszögből, valamint három kétszer számítandó P 0 P, Q 0 Q, R 0 R egyenesszakaszból tevődik össze (234. ábra). Végül ha A nullára zsugorodik, akkor a körív-háromszög egyetlen ponttá redukálódik, és visszajutunk a Steiner-féle probléma megoldására; az utóbbi így a módosított izoperimetrikus probléma határeseteként adódik. Ha P, Q, R tompaszögű háromszöget képez, amelynek egyik szöge nagyobb 120◦ -nál, akkor a zsugorodás folyamata a Steiner-probléma ezen esetnek megfelelő megoldására vezet; ekkor ugyanis a körívek a tompaszögnél levő csúcsra zsugorodnak össze. Az általánosított Steiner-probléma (l. 216–218. ábra. 357. o.) megoldása hasonló természetű határátmenetekkel kapható meg.
10. § Variációszámítás 1. Bevezetés Az izoperimetrikus probléma csak egyik, talán legrégibb, példája a problémák egyik nagy és fontos osztályának, amelyre 1696-ban hívta fel a figyelmet Johann Bernoulli. A kor egyik nagy természettudományos folyóiratában, az Acta Eruditorumban a
456
236. ábra. Ciklois következő, ún. „brachistochrone”-problémát tűzte ki: Képzeljünk el egy tömegpontot, amely súrlódásmentesen csúszik az A pontot az alacsonyabban fekvő B ponttal összekötő valamilyen görbe mentén. Tegyük fel, hogy a pontra kizárólag a nehézségi erő hat, milyen görbe mentén ér le a legrövidebb idő alatt? Könnyű belátni, hogy a csúszó részecske különböző pályakon különböző idő alatt ér le. Semmiképpen sem az egyenes biztosítja a leggyorsabb leérkezést, aminthogy nem is a körív vagy valamilyen más elemi görbe a felelet. Bernoulli azzal dicsekedett, hogy csodálatos megoldást talált, de nem közölte azt azonnal, hogy a kor legnagyobb matematikusai kipróbálhassák ügyességüket ezen az új típusú matematikai kérdésen. Kihívása kiváltképpen bátyja, Jakob ellen irányult. Régi, elkeseredett viszály dúlt a két testvér között, s Johann a bátyját nyilvánosan képtelennek minősítette a probléma megoldására. A matematikusok azonnal felismerték a brachistochrone-probléma teljesen újszerű jellegét. A differenciálszámítás segítségével eladdig tárgyalt problémákban a minimalizálandó mennyiség mindig csak egy vagy több numerikus változótól függött; ebben a problémában a kérdéses mennyiség, a mozgás ideje, az egész görbétől függ, ez az a lényeges különbség, amely kiemeli a problémát a differenciálszámítás, vagy bármely más akkor ismert módszer hatásköréből. A probléma újdonsága – úgy látszik, a kör izoperimetrikus problémájának azonos jellegét nem ismerték fel – még jobban megbűvölte a kortárs matematikusokat, amikor kiderült, hogy a megoldás az éppen akkoriban felfedezett új görbe, a ciklois. (Emlékeztessünk a ciklois definíciójára: az a görbe, amelyet egy egyenesen csúszás nélkül gördülő kör valamely meghatározott kerületi pontja ír le, lásd 236. ábra.) Tudták erről a görbéről, hogy érdekes mechanikai problémákkal függ össze, mindenekelőtt az ingaóra szerkesztésével. Huygens fedezte fel, hogy egy vertikális cikloison a gravitáció
457
237. ábra. Fénytörés hatása alatt súrlódás nélkül mozgó ideális tömegpont esetében a lengésidő független az ingamozgás amplitúdójától. Kör alakú pályán, amilyen a közönséges inga pályája, ez a függetlenség csak megközelítőleg igaz, s éppen ez volt az ingák precíziós órákban való alkalmazásának legfőbb akadálya. Éppen ezért a cikloist a „tautochrone” névvel tisztelték meg; most megkapta mellé az új „brachistochrone” címet. 2. Variációszámítás. Fermat elve az optikában A két Bernoulli fivér és mások különféle megoldásokat adtak a brachistochroneproblémára. Az alábbiakban a legeredetibbet beszéljük meg, amely a megtámadott idősebb Bernoulli fivértől, Jakobtól származik. Az első megoldások a speciális problémához alkalmazkodtak, és többé-kevésbé speciális jellegűek voltak. De Euler és Lagrange (1736–1813) rövidesen általánosabb módszereket dolgoztak ki a szélső érték problémák megoldására, melyekben a független elem nem egyetlen numerikus változó vagy véges számú numerikus változó volt, hanem egy egész görbe vagy függvény, sőt a függvények egész rendszere. Az ilyen problémák megoldására szolgáló új módszert variációszámításnak nevezték el. Lehetetlen itt leírni a matematika eme ágának technikai vonásait, vagy a specifikus problémák mélyebb tárgyalásába bocsátkozni. A variációszámításnak sok fizikai alkalmazása van. Rég megfigyelték, hogy a természet jelenségei igen gyakran valamilyen maximum- vagy minimumelv szerint mennek végbe. Az alexandriai Héron – amint láttuk – felismerte, hogy a fénysugarak síktükörben való visszaverődése minimum elv
458
segítségével írható le. Jól tudjuk, hogy egyik homogén közegből a másikba átlépő fénysugár a két közeg határán megtörik. Legyen adva, mint az a 237. ábrán látható, két közeg. A felső I. közegben legyen a fény sebessége v, az alsó II. közegben w. A felső közegben levő P pontból az alsó közegben levő R pontba haladó fénysugár haladjon a PQR pálya mentén. Snell (1591–1626) kísérleti úton azt a törvényt fedezte fel, hogy a fénysugár pályája két egyenesszakaszból, PQ-ból és QR-ből áll, amelyek a határfelület normálisával α illetve α 0 szöget zárnak be, és a szögek nagyságát a sin α/ sin α 0 = v/w feltétel határozza meg. Fermat a differenciálszámítás segítségével bebizonyította ennek a pályának azt a tulajdonságát, hogy mentében az az idő, melyre a fénynek szüksége van, hogy P-ből R-be jusson, minimum, azaz kisebb, mint amekkora bármely más pálya mentében lenne. Így Héron fényvisszaverődési törvényét ezerhatszáz év múlva kiegészítették a fénytörés hasonló jellegű és éppen olyan fontos törvényével. Fermat úgy általánosította ezt a törvényt, hogy a közegek közötti görbe felületű diszkontinuitásokra is érvényes legyen, mint pl. a lencséknél használt gömbfelületekre. Ebben az esetben is érvényes az az állítás, hogy a fény olyan utat követ, amelyen a terjedés ideje minimum azokhoz az időkhöz képest, amelyre ugyanazon két pont közötti bármely más pálya megtételéhez lenne szüksége. Végül Fermat tárgyalta az olyan tetszőleges optikai rendszer esetét, ahol a fénysebesség pontról pontra az előírt módon változik, mint pl. a légkörben. A folytonos inhomogén közeget vékony rétegekre osztotta, amelyek mindegyikében megközelítően állandó a fény sebessége, és ezt az egész rendszert képzeletben egy másikkal cserélte ki, amelyikben a fény sebessége minden rétegben ténylegesen állandó. Akkor újból alkalmazhatta elvét, rétegről rétegre haladva. Azután a rétegek vastagságát nulla felé közelítve, megkapta a geometriai optika általános Fermat-féle elvét : inhomogén közegben két pont között terjedő fénysugár pályája a két pontot összekötő összes lehetséges pálya közül az, amelyik mentében az ahhoz szükséges idő, hogy a fény az egyik pontból a másikba jusson, a legrövidebb. Az elv nemcsak elméleti, gyakorlati szempontból is óriási jelentőségű volt a geometriai optikában. A lencserendszerek számítása ugyanis úgy történik, hogy erre az elvre alkalmazzuk a variációszámítás technikáját. A minimumelveknek uralkodó szerep jutott a fizika egyéb ágaiban is. Megfigyelték, hogy mechanikai rendszerek stabilis egyensúlyi helyzetében a rendszer „potenciális
459
energiája” minimum. Példaként tekintsük a hajlékony, két végén felfüggesztett homogén láncot, amely a gravitáció hatásának van alávetve. A lánc olyan alakot vesz fel, amely alakban potenciális energiája minimum. Ebben az esetben a potenciális energiát a súlypont valamely rögzített tengely feletti magassága szabja meg. A görbét, amelyben a lánc függ, láncgörbének nevezik, felületesen tekintve, parabolához hasonlít. Nemcsak az egyensúly, a mozgás törvényei is maximum- és minimumelvek uralma alatt állanak. Ezekről az elvekről először Euler alkotott magának tiszta képet, de a kor filozofikus és misztikus hajlamú spekulátorai, mint pl. Maupertuis (1698–1759), képtelenek voltak a matematikai állítást elválasztani az olyan semmitmondó frázisoktól, mint hogy „Isten szándéka, hogy a fizikai jelenségeket a legnagyobb tökéletesség elve szerint kormányozza”. Euler fizikai variációs elvét azután a nagy ír matematikus, W. R. Hamilton (1805–1865) fedezte fel újra, s bővítette ki. Ebben a kibővített alakjában a mechanika, az elektrodinamika, az optika leghatásosabb eszközei közé tartozik, s számos mérnöki alkalmazása van. A fizika legújabb ágai – a relativitáselmélet és a kvantumelmélet – tökéletes példái a variációszámítás erejének. 3. Bernoulli módszere a brachistochrone-probléma megoldására
238. ábra A brachistochrone-probléma megoldására kidolgozott egyik módszer, melyet Jakob Bernoulli -nak köszönhetünk, viszonylag kevés technikai tudás birtokában is megérthető. Induljunk ki abból a mechanikából ismert tényből, hogy ha egy A helyzetben nyugalomban levő tömegpont tetszőleges C görbe mentén esik, sebessége valamely √ P pontban h-val lesz arányos, ahol h az A pont P pont feletti vertikális irányban
460
√ mért távolsága; azaz v = c h, ahol c állandó. Helyettesítsük most az adott problémát egy kissé különbözővel. Szeleteljük fel a teret sok vékony horizontális rétegre, legyen mindegyik réteg vastagsága d, és tételezzük fel átmenetileg, hogy a mozgó részecske sebessége nem folytonosan változik, hanem rétegről rétegre, kis ugrásokkal, úgy hogy √ √ az A-val szomszédos első rétegben a sebessége c d, a második rétegben c 2d, az √ √ n-edikben c nd = c h, ahol h az A pont P pont feletti vertikális magassága (l. a 238. ábrát). Ha ezt a problémát tekintjük, akkor ténylegesen csak véges számú változóval van dolgunk. A pályának minden egyes rétegben egyenes szakasznak kell lennie; semmiféle egzisztencia-probléma nem jelentkezik, a megoldásnak sokszögvonalnak kell lennie, és az egyedüli kérdés az, miként határozzuk meg ennek a sokszögvonalnak a szögpontjait. Az egyszerű fénytörés törvényére érvényes minimumelv szerint minden két egymás után következő rétegben a mozgás P-ből Q-n keresztül R-be úgy megy végbe, hogy – rögzített P és R mellett – Q a lehetséges legrövidebb idő alatt történő mozgást szolgáltassa. Ezért érvényes a következő „refrakciós törvény”: sin α sin α 0 √ =p . nd (n + 1)d Ennek az elvnek ismételt alkalmazása sin α sin α sin α1 √ = √ 2 = ... = √ n d 2d nd
(1)
egyenlőségekhez vezet, ahol αn az n-edik rétegben levő sokszögoldal és a vertikális által bezárt szöget jelenti. Mármost Bernoulli elképzelte, hogy a rétegek d vastagsága egyre vékonyodva a nullához tart, úgyhogy a közelítő probléma megoldásaként most nyert sokszögvonal tart az eredeti probléma megoldásához. A határátmenet nem hat az (1) egyenletekre, azért Bernoulli arra a következtetésre jutott, hogy a megoldást a következő tulajdonságú C görbének kell szolgáltatnia: ha α jelöli a C görbe tetszőleges P pontjában a görbe érintője és a vertikális által bezárt szöget, és h a P pont A ponton keresztülmenő horizontális √ egyenestől számított vertikális távolsága, akkor sin α/ h érték a C görbe minden P pontjában állandó. Igen egyszerűen kimutatható, hogy ez a tulajdonság a cikloisra jellemző.
461
Bernoulli „bizonyítása” tipikus példája az olyan szellemes és észszerű matematikai érvelésnek, amely azonban egyáltalában nem szigorú. Az érvelés számos hallgatólagosan elfogadott feltevést használ, s ezeknek a bizonyítása sokkal bonyolultabb és hosszadalmasabb lenne, mint maga az egész okoskodás. A bizonyítás feltételezte pl. azt a két tényt, hogy létezik egy C megoldás, és hogy a közelítőprobléma megoldása megközelíti a tényleges megoldást. Az ilyen típusú heurisztikus megfontolások belső értéke kétségkívül tárgyalásra méltó lenne, de túlságosan messze vezetne célunktól. 4. Geodetikus vonalak a gömbön. Geodetikus vonalak és maximinimumok
239. ábra. Geodetikus vonalak a gömbön A fejezet bevezetésében említettük azt a problémát, hogyan kell meghatározni a legrövidebb ívet, amely egy felület két pontját összeköti. Gömbön, amint az az elemi geometriából tudjuk, ezek a „geodetikus vonalak” a legnagyobb gömbi körök ívei. Legyen P és Q két (nem átellenesen szemközti) pont a gömbön, és c legyen a P és Q ponton áthaladó legnagyobb gömbi kör rövidebb íve. Mi lesz akkor ugyanennek a legnagyobb gömbi körnek a hosszabbik c 0 íve? Ez az ív bizonyosan nem a P-t és Q-t legrövidebben összekötő hosszúság, de nem a maximális hosszúságú P-t és Q-t összekötő görbe sem, hiszen P és Q között tetszőlegesen hosszú görbe húzható. A felelet az, hogy c 0 egy maxi-
462
minimumprobléma megoldása. Tekintsünk egy S pontot valamely P-t és Q-t elválasztó rögzített legnagyobb gömbi körön; mi lesz a legrövidebb, S ponton áthaladó összeköttetés a gömbön P és Q között? Természetesen a minimumot olyan görbe szolgáltatja, amely PS és QS legnagyobb gömbi körök két rövidebbik ívéből áll. Keressünk most S pont számára olyan helyzetet, amelyre ez a legkisebb PSQ távolság a lehető legnagyobb lesz. A megoldás a következő: S-nek olyannak kell lennie, hogy PSQ a PQ legnagyobb gömbi kör hosszabbik c 0 ívével essék egybe. Módosíthatjuk a problémát úgy, hogy először a gömb n előírt S1 , S2 , . . ., Sn pontján keresztül haladva keressük meg a P-ből Q-ba vezető legrövidebb hosszúságú pályát, és azután megkíséreljük az S1 , . . ., Sn pontokat úgy meghatározni, hogy ez a minimum hosszúság a lehető legnagyobb legyen. A megoldást a P-t és a Q-t összekötő legnagyobb gömbi kör mentében futó pálya adja, azonban ez a pálya annyiszor kerüli meg a gömböt, hogy a P-vel és Q-val átellenesen szemközti pontokon éppen n-szer halad át. A maximum-minimumproblémak fenti példája a variációszámítás kérdéseinek egy egész nagy osztályára jellemző, az ilyen típusú problémákat sikeresen tanulmányozták azokkal a módszerekkel, amelyeket Morse és mások dolgoztak ki.
11. § Minimumproblémák kísérleti megoldása. Szappanbuborékkísérletek 1. Bevezetés Rendszerint igen nehéz, gyakran egyenesen lehetetlen variációszámítási problémákat explicit képletekkel vagy egyszerű elemeket használó geometriai szerkesztésekkel megoldani. Ehelyett gyakran meg kell elégednünk a megoldás adott körülmények közötti létezésének a bizonyításával, és ezután kell vizsgálnunk a megoldás tulajdonságait. Sok esetben, amikor az egzisztencia-bizonyítás többé-kevésbé nehéznek igérkezik, biztatást jelent annak a felismerése, hogy a matematikai feltételek megfelelő fizikai eszközök segítségével megvalósíthatók, pontosabban, hogy a matematikai probléma fizikai jelenség interpretációjának tekinthető. A fizikai jelenség létezése azután a matematikai probléma megoldását reprezentálja. Természetesen ez csupán a plauzibilitás céljait szolgálhatja, nem a matematikai bizonyításét, hiszen nyitva marad az a kérdés, hogy vajon a fizikai
463
jelenség matematikai interpretációja adekvát-e szigorú értelemben véve, vagy pedig inadekvát képét adja csak a fizikai valóságnak. Néha azonban az ilyen kísérletek, még ha csak képzeletben is hajtjuk végre, meggyőzőek a matematikus számára is. A XIX. században Riemann a függvénytan sok alapvető tételét fedezte fel úgy, hogy azokra az egyszerű kísérletekre gondolt, amelyek azt vizsgálták, hogyan oszlik el az elektromos áram vékony fémlemezekben. Könyvünknek ebben a részében a variációszámitás egyik mély problémáját fogjuk tárgyalni kísérleti demonstrációk alapján. A problémát „Plateau problémájának” nevezik, mivel Plateau (1801–1883) belga fizikus végzett érdekes kísérleteket a tárgyra vonatkozóan. Maga a probléma sokkal régibb, egészen a variációszámítás kialakulásának kezdeti korára nyúlik vissza. Legegyszerűbb alakjában a következő: keressük meg egy adott zárt térgörbe által határolt legkisebb felszínű felületet. Néhány rokon kérdéssel kapcsolatos kísérletet is tárgyalni fogunk, s kiderül majd, hogy ezáltal egyrészt több korábbi eredményünk, másrészt új típusú matematikai problémák válnak világosabbá. 2. Szappanbuborék-kísérletek Matematikailag Plateau problémája „parciális differenciálegyenletek” vagy egyenletrendszerek megoldásával függ össze. Euler mutatta meg, hogy minden (nem-sík) minimálfelületnek nyereg alakúnak kell lennie, és a felület középgörbülete3 a felület minden pontjában nulla. A múlt század folyamán sok speciális esetben kimutatták a megoldás létezését, azonban az általános esetre csak az utóbbi időben bizonyította be a megoldás létezését J. Douglas és T. Radó. Plateau kísérletei számos, igen általános peremgörbe esetére adnak közvetlen fizikai megoldást. Ha valamely drótból készült zárt keretet, térbeli vázat, kicsiny felületi feszültségű folyadékba mártunk, s azután kiemeljük, vékony hártya formájában a legkisebb felszínű minimálfelület feszül a vázra. (Feltételezzük, hogy eltekinthetünk a nehézségi erőtől és minden más olyan erőtől, amely zavarja a hártyának azt a tulajdonságát, hogy 3
Egy felület P pontbeli középgörbülete a következőképpen van definiálva: tekintsük a felületre P-ben állított merőlegest és az ezt tartalmazó síkokat. Ezek a síkok a felületet olyan görbékben metszik, amelyeknek általában P pontban más és más görbülete. Tekintsük mármost a minimális és a maximális görbületű görbét. (Általában az ezeket tartalmazó két sík merőleges lesz egymásra.) E két görbület összegének a felét nevezik a felület P pontbeli középgörbületének.
464
lehető legkisebb felületet felvéve, a felületi feszültségből eredő potenciális energia legkisebb lehetséges értékével stabilis egyensúlyi helyzetbe jöjjön.) Ilyen folyadékra jó recept a következő: oldjunk fel 10 gramm tiszta, száraz nátrium-oleátot 500 gramm desztillált vízben, és keverjük össze az oldat 15 köbcentiméterét 11 köbcentiméter glicerinnel. Bronzdrótból készült vázat ebbe az oldatba merítve a kifeszített hártya viszonylag stabilis. A drótkeret átmérője ne haladja meg a 12–15 centimétert.
240. ábra. 13, csaknem sík felület rendszeréből álló kocka-keretre kifeszített szappanhártya Ezzel a módszerrel igen könnyű Plateau problémájának a „megoldása” úgy, hogy a drótkeretet egyszerűen a kívánt formára alakítja. Gyönyörű modelleket kapunk szabályos poliéder éleinek a sorozatából képzett sokszögű drótkereteken. Különösen érdekes felületet kapunk, ha egy egész kockakeretet mártunk az oldatba. Az eredmény először a különféle egymást metsző felületek rendszere lesz, amelyek mind 120◦ -os szög alatt találkoznak metszésvonalaik mentén. (Ha a kockát óvatosan emeljük ki, tizenhárom csaknem sík felületet kapunk.) Azután átszúrhatunk – és ezáltal megsemmisíthetünk – ezekből a felületekből annyit, hogy csak egy felület maradjon meg, melyet egy zárt sokszögvonal határol. Sok szép felületet lehet ilyen módon előállítani. Ugyanez a kísérlet tetraéderrel is elvégezhető.
465
3. A Plateau-probléma körébe tartozó új kísérletek A szappanhártyából képzett minimálfelületekkel való kísérletek köre nagyobb Plateau most ismertetett eredeti demonstrációinál. Újabban a minimálfelületek problémáját olyan esetekben is tanulmányozták, amikor nemcsak egy, hanem tetszőleges számú keret van előírva, és emellett a felület topologikus struktúrája is bonyolultabb. Lehet pl. a felület egyoldalú vagy nullától különböző nemszámú. Ezek az általánosabb problémák bámulatosan sok geometriai jelenséget állítanak elő, amelyek azután a szappanhártyakísérletekkel bemutathatók. Célszerű ezekhez a kísérletekhez hajlékony drótkeretet használni, mert így tanulmányozható az előírt peremvonalak deformációjának a folyadékhártyára való hatása. A következőkben leírunk néhány példát.
241. ábra. Egyoldalú felület (Moebius-féle szalag)
242. ábra. Kétoldalú felület
1. Ha a peremgörbe kör, sík körlemezt kapunk. Ha a körkerületet folytonosan deformáljuk, azt várhatnánk, hogy a minimálfelület mindig megtartja a körlemez topologikus jellegzetességét. De nem ez történik. Ha a körkerületet a 241. ábrán látható módon deformáljuk, olyan minimálfelületet kapunk, amely nem egyszeresen összefüggő többé, mint a körlemez, hanem egyoldalú Moebius-féle szalag. Megfordítva, kiindulhatunk ebből a keretből és a Moebius-féle szalag alakú szappanhártyából is. Deformálhatjuk
466
a drótkeretet két hozzáerősített fogantyúval (241. ábra). A deformálás folyamatában lesz egy pillanat, mikor a hártya topologikus jellege hirtelen megváltozik, a felület újból az egyszeresen összefüggő körlemez topologikus típusává alakul (242. ábra). Ha a deformációt visszafelé végezzük el, újból megkapjuk a Moebius-féle szalagot. Ebben a megfordított deformációban az egyszeresen összefüggő felület Moebius-féle szalaggá való átalakulása későbben következik be. Látjuk ebből, hogy kell lenni a határgörbe alakok számára egy egész adott nagyságú változási tartománynak, amelyen belül a Moebius-féle szalag is, meg az egyszeresen összefüggő felület is stabilis, azaz relatív minimumot szolgáltat. Azonban ha a Moebius-féle szalag felszíne sokkal kisebb lesz, mint a másik felületé, az utóbbi túlságosan instabilissá válik ahhoz, hogy kialakulhasson.
243. ábra. Három felületből álló rendszer 2. Kifeszíthetünk egy minimális forgásfelületet két kör közé. A drótkeretet a folyadékból kiemelve azt látjuk, hogy nem egyszerű felület keletkezett, hanem három, egymással 120◦ os szög alatt találkozó felületből álló rendszer, melyek közül az egyik egyszerű, az előírt határoló körökkel párhuzamos körlemez (243. ábra). A közbülső felület megsemmisítésével a klasszikus katenoidot kapjuk (a katenoid az a felület, amely a 459. oldalon ismertetett láncgörbe – katena=lánc – szimmetriatengelyére merőleges egyenes körüli forgatásával keletkezik). A két határoló kör széthúzása közben elérkezik egy pillanat, amikor a kétszeresen összefüggő minimálfelület (a katenoid) instabilissá válik. Ebben a pillanatban a katenoid diszkontinuus ugrással két elválasztott körlemezre esik szét. Ez a folyamat természetesen nem megfordítható.
467
244. ábra
245. ábra
246. ábra
0 és 1 nemszámú különböző három felületet kifeszítő keret 3. Másik fontos példát kapunk a 244–246. ábrán látható kerettel, amelyen három különböző minimálfelületet feszítünk ki. Mindegyiket ugyanaz az egyszer zárt görbe határolja; az egyik nemszáma 1 (244. ábra), a másik kettő pedig egyszeresen összefüggő, és valamiképpen szimmetrikus egymással. Ha a váz tökéletesen szimmetrikus, az utóbbi kettő egyenlő felszínű. De ha nem ez a helyzet, akkor csak az egyik képvisel a felület számára abszolút minimumot, a másik csak relatív minimumot, feltéve, hogy a minimumot csak az egyszeresen összefüggő felületek között keressük. Az 1 nemszámú megoldás lehetősége azon alapul, hogy az 1 nemszámú felületek megengedésével kisebb felszínű felületet kapunk, mint ha ragaszkodunk az egyszeresen összefüggő felületekhez. A keret deformálásával, ha a deformáció elég radikális, el kell jutnunk egy olyan ponthoz, ahol ez már nem igaz. Ebben a pillanatban az 1 nemszámú felület egyre instabilabbá válik, és hirtelen szakadással a 245. vagy 246. ábrán látható egyszeresen összefüggő stabilis megoldások valamelyikébe ugrik át. Ezeknek az egyszeresen összefüggő felületeknek valamelyikéből, pl. a 246. ábrán láthatóból kiindulva, deformálhatjuk a keretet oly módon, hogy a másik, 245. ábrán látható egyszeresen összefüggő megoldás stabilisabb lesz. A következmény az, hogy adott pillanatban egyik felület szakadás útján átmegy a másikba. Lassan megfordítva a deformációt, visszatérhetünk a keret eredeti alakjára, de most a másik megoldás lesz benne. Az eljárást újból megismételhetjük a másik irányba, s így ide-oda játszhatunk szakadásos átmenetekkel a két típus között. Óvatosan eljárva, egyik vagy másik egyszeresen összefüggő felületet szakadásosan átalakíthatjuk az 1
468
nemszámú felületté is. Ebből a célból a két körlemezszerű részt olyan közel kell hozni egymáshoz, hogy az 1 nemszámú felület legyen sokkal stabilisabb. Ebben a folyamatban néha átmeneti hártyák jelentkeznek, amelyeket meg kell előbb szüntetni, hogy az 1 nemszámú felületet megkapjuk.
247. ábra. Egyetlen zárt térgörbe által határolt magasabb topológiai struktúrájú egyoldalú minimálfelület Ebből a példából láthatjuk, hogy ugyanazon keretben nemcsak azonos topológiai típusú megoldások létezhetnek, hanem más, eltérő típusúak is. Továbbá újból azt látjuk, hogy egyik megoldás szakadásosan mehet át a másikba, miközben a probléma feltételei folytonosan változnak. Nem nehéz ugyanilyen jellegű bonyolultabb modelleket konstruálni, s viselkedésüket kísérletileg tanulmányozni.
248. ábra. Egymásba láncolt görbék Érdekes jelenség, amikor két vagy több egymásba láncolt zárt görbe által határolt
469
minimálfelületek keletkeznek. Két kör esetére a 248. ábrán látható felületet kapjuk. Ha ebben a példában a körök merőlegesek egymásra, és síkjaik metszésvonala mindegyik körnek egy-egy átmérője, akkor ennek a felületnek két alakja lehetséges, melyek egyenlő felszínűek és egymásnak tükörképei. Ha a köröket egymáshoz képest kissé elmozdítjuk, az alak folytonosan változik, noha minden egyes helyzetre csak az egyik alak képvisel abszolút minimumot, a másik pedig relatívot. Ha a köröket úgy mozgatjuk, hogy a relatív minimum alakul ki, lesz egy pont, amikor az átugrik az abszolút minimumba. Itt mind a két minimálfelület azonos topológiai jellegű, mint ahogy a 245. és 246. ábra felületei is azonos jellegűek voltak, amelyeknél a keret kis deformációjával egyiket átugrasztottuk a másikba. 4. Egyéb matematikai problémák kísérleti megoldása A folyadékhártya felületi feszültsége miatt csak akkor van stabilis egyensúlyi helyzetben, ha felszíne minimum. Ez a megállapítás matematikai szempontból jelentős kísérletek kimeríthetetlen forrása. Ha a hártya határának egy részét valamely felületen, pl. a síkon, szabadon engedjük mozogni, akkor ezeknél a határoknál a hártya merőleges lesz az előírt felületre.
249. ábra. Négy pont közötti legrövidebb összeköttetés demonstrálása Ezt a tényt a Steiner-probléma és általánosítása (l. 5. §) meglepő demonstrálására használhatjuk. Helyezzünk el két párhuzamos üveg- vagy átlátszó műanyaglemez közé
470
három vagy több, a lemezekre merőleges rudacskát. Merítsük ezt a rendszert szappanoldatba, onnan kiemelve, a szappanhártya a lemezek között, függőleges síkok rendszerében helyezkedik el, összekötve a rögzített rudacskákat. A hártyarendszer üveglemezeken megjelenő vetülete a 435. oldalon tárgyalt probléma megoldása. Ha a lemezek nem párhuzamosak, vagy a rudacskák nem merőlegesek a lemezekre, vagy a lemezek görbültek, akkor a hártya által a lemezekre vetített görbe nem egyenesszakaszokból áll, hanem új variációs problémákat illusztrál.
250. ábra. Legrövidebb összeköttetés 5 pont között Ahol egy minimálfelület három levele 120◦ -os szög alatt találkozik, ott a vonalak megjelenése úgy fogható fel, mint a Steiner-problémával kapcsolatos jelenségek több dimenzióra való általánosítása. Ez azonnal világossá válik, ha pl. két pontot, A-t és B-t a térben három görbével kötünk össze, és tanulmányozzuk a szappanhártyák megfelelő stabilis rendszerét. Legegyszerűbb esetként vegyük az egyik görbének az AB szakaszt, a másik kettőnek két egybevágó körívet. Az eredmény a 251. ábrán látható. Ha a két körív síkja 120◦ -nál kisebb szöget zár be, három felületet kapunk, melyek 120◦ -os szög alatt találkoznak; ha a két körívet elforgatjuk, növelve a síkjuk által bezárt szöget, a megoldás folytonos változással két sík-körszeletbe megy át.
471
251. ábra. Két pontban érintkező három drót közé kifeszített 120°-os szög alatt 252. ábra. Két pontot összekötő három törött vonal érintkező három felület Kössük most A-t és B-t három bonyolultabb görbével össze. Példaként vehetünk három törött vonalat, amelyek mindegyike ugyanazon kocka két szemközti csúcsát összekötő három-három éléből áll. Az eredmény három egybevágó felület lesz, melyek a kocka átlójában találkoznak. (Ezt a felületrendszert úgy kapjuk a 240. ábrán lerajzoltból, hogy a kellőképpen kiválogatott élekkel szomszédos hártyákat megszüntetjük.) Ha az A és B pontot összekötő három törött vonalat mozgatjuk, azt látjuk, hogy a hármas metszés vonala elgörbül, de a 120◦ -os szögek megmaradnak (252. ábra). Minden jelenség, amelynél három minimálfelület találkozik valamilyen térgörbe mentén, lényegében hasonló természetű. Ezek a jelenségek mind annak a síkproblémának az általánosításai, hogy hogyan kell n pontot egyenesszakaszok legrövidebb rendszerével összekötni. Végül valamit a szappanbuborékokról. A gömb alakú szappanbuborék azt demonstrálja, hogy az adott térfogatot (a bezárt levegő mennyiségével definiálva) körülzáró zárt felületek közül a gömb felszíne a legkisebb. Ha adott térfogatú szappanbuborékokat tekintünk, amelyek azonban adott feltételek mellett húzódhatnak össze a lehető legkisebb felszínre, az eredmény nem gömb lesz, hanem állandó középgörbületű felületek, melyeknek a gömb és a körhenger speciális esetei. Fújjunk például szappanbuborékot két, előzetesen szappanoldattal megnedvesített párhuzamos üveglemez közé. Amikor a buborék érinti az egyik lemezt, hirtelen félgömb alakot vesz fel, amikor a másik lemezt is érinti, körhenger alakba ugrik át, így a legkézzelfoghatóbb módon demonstrálva a kör izoperimetrikus tulajdonságát. A kísérlet kulcsa
472
253. ábra. Annak a demonstrálása, hogy adott területű síkidomok közül a kör kerülete a legkisebb az a tény, hogy a szappanhártya merőlegesen áll be a határoló felszínre. Szappanbuborékokat fújva merőleges összekötőrudacskákkal ellátott lemezek közé, illusztrálhatjuk a 453. oldalakon tárgyalt problémákat.
254. ábra
255. ábra
Izoperimetrikus alakzatok, kerületi feltételekkel Egy finom végű cső segítségével tanulmányozhatjuk az izoperimetrikus probléma megoldásának a viselkedését, növelve vagy csökkentve a levegő mennyiségét a szappanbuborékban. A levegő kiszívásával azonban sohasem kapjuk meg a 455. oldalon közölt,
473
egymást érintő körívekből álló síkidomot. Ha a bezárt levegő térfogata csökken, a körívháromszög szögei (elméletileg) nem lesznek kisebbek 120◦ -nál; olyan alakzatokat kapunk, mint amilyen a 254–255. ábrán látható. Ezek itt is egyenesszakaszokhoz tartanak, ha a terület a nullához tart, mint a 235. ábra esetében. Annak, hogy a szappanhártyák nem képeznek egymást érintő köríveket, az az oka, hogy amint a buborék elválik s csúcsoktól, az összekötő egyeneseket nem kell többé kétszer számítani. A megfelelő kísérleteket a 256. és 257. ábrán láthatjuk.
256. ábra
257. ábra
Ha kocka alakú keret belsejébe úgy fújunk szappanbuborékot, hogy a buborék túlbuggyanjon a kereten, akkor állandó középgörbületű felületeket kapunk, négyzet alapokon. Ha a szalmaszálon át most levegőt szívunk ki a buborékból, gyönyörű szép struktúrák sorozatát kapjuk, végeredményként pedig azt, ami a 258. ábrán látható. Különféle egyensúlyi állapotok stabilitása s a közöttük történő átmenetek jelensége, matematikai szempontból igen tanulságos kísérletek forrásai lehetnek. A kísérletek illusztrálhatják a stacionárius értékek elméletét, mivel az átmenetek úgy oldhatók meg, hogy nem stabilis egyensúlyi helyzeten keresztül menjenek végbe, amely a „stacionárius állapotot” képviseli. Pl. a 240. ábrán látható, kockába helyezett struktúra nem szimmetrikus, mivel a kockaélekből kiinduló tizenkét felületet középen egy vertikális állású sík köti össze. Ezért még legalább két másik egyensúlyi helyzetnek kell lenni, az egyikben vertikális, a másikban horizontális síkban fekvő középső négyzettel. Valóban, ha finom csövön keresztül a kocka éleire fújunk, kényszeríthetjük a struktúrát, hogy olyan alakot öltsön,
474
amelyben a négyzet a kocka közepében levő egyetlen ponttá redukálódik; ez a nem stabilis egyensúlyi helyzet azután azonnal átmegy az eredeti struktúra 90◦ -os elforgatásával nyerhető másik két stabilis helyzet valamelyikébe. Hasonló kísérletet lehet végezni azzal a szappanhártyával is, amely Steiner problémáját demonstrálja négyzetet képező négy pont esetére (219–220. ábra.).
258. ábra Ha ilyen problémák megoldását izoperimetrikus problémák határeseteként kívánjuk megkapni – pl. a 240. ábrát a 258. ábrából –, ki kell szívnunk a levegőt a szappanbuborékból. Mármost a 258. ábra tökéletesen szimmetrikus, a levegőtartalom eltűnésére bekövetkező határesete a középpontban találkozó 12 sík tökéletesen szimmetrikus rendszere lenne. Ez valóban így is figyelhető meg. Ebben a határesetben azonban az elért helyzet nem jelent stabilis egyensúlyt; átalakul a 240. ábra valamelyik alakjába. A fent leírtnál valamivel viszkózusabb folyadékot használva, az egész jelenség igen könnyen megfigyelhető. Példája ez annak a ténynek, hogy még fizikai problémánál sem feltétlenül az adatok folytonos függvénye a megoldás; hiszen pl. nulla térfogat határesetére a 240. ábra által adott megoldás nem határhelyzete a 258. ábra által nullához tartó ε esetére, ε térfogatra adott megoldásnak.
475
476
VIII. fejezet. Az integrál- és differenciálszámítás Bevezetés Az integrál- és differenciálszámítás „felfedezését” néha, abszurd módon túlegyszerűsítve a dolgokat, két embernek, Newtonnak és Leibniz nek tulajdonítják. Valójában az integrálés differenciálszámítás, a „kalkulus” vagy infinitezimális számítás hosszú fejlődés eredménye. Ezt a fejlődést Newton és Leibniz se el nem indították, se be nem fejezték, bár mind a kettőjüknek igen fontos szerep jut benne. A XVII. századi Európában szétszórva, többnyire az egyetemeken kívül, mindenfelé lelkes tudósok folytatták Galilei és Kepler matematikai munkáját. Ezek az emberek levelezés és állandó utazás útján szoros személyes kapcsolatban állottak egymással. Figyelmüket főleg két fontos probléma kötötte le. Az egyik az érintőprobléma: adott görbe érintőinek a meghatározása – a differenciálszámítás alapproblémája. A másik a kvadraturaprobléma: egy adott görbén belüli terület meghatározása – az integrálszámítás alapproblémája. Newton és Leibniz nagy érdeme az, hogy világosan felismerték, milyen szorosan összefügg ez a két probléma egymással. Az ő kezükben az új, egységesített módszerek hatalmas természettudományos eszközökké váltak. Igen nagy része volt a sikerben a Leibniz által kitalált bámulatos szimbolikus jelölésnek. Semmiképpen sem csökkenti eredményei nagyságát, hogy sokszor ködös, tarthatatlan fogalmakkal kapcsolta össze azokat, olyan fogalmakkal, amelyek sokáig útját állották a tiszta megértésnek olyan elmékben, akik jobban szerették a misztikát a világos gondolkodásnál. Kettőjük közül Newton volt a sokkal nagyobb természettudós. Úgy látszik, Newtonra elsősorban Barrow (1630–1677) hatott, aki tanára és tanszéki előde volt a Cambridge-i egyetemen. Leibniz nem volt benfentes, igazi „outsider” volt. Ragyogó jogász, diplomata és filozófus, a század egyik legtevékenyebb és legsokoldalúbb elméje, az új matematikát hihetetlenül rövid idő alatt tanulta meg Huygenstől, a fizikustól, egy párizsi diplomáciai küldetése alatt. Nemsokkal ezután közölte azokat az eredményeket, amelyek a modern infinitezimális számítás mag-
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220526105851+02’00’
477
vát tartalmazzák. Newton, aki sokkal előbb jutott ezekre a felfedezésekre, húzódozott a közlésüktől. Ebben odáig ment, hogy bár mesterművének, a Principiának sok tételét eredetileg a kalkulus módszerei segítségével találta meg, mégis közlésükre a klasszikus geometria stílusát választotta, úgyhogy a Principiában az infinitezimális számításnak, az integrál- és differenciálszámításnak még explicit nyoma is alig található. Csak sokkal később közölte a „fluxiók” módszerére vonatkozó munkáit. Csodálói közben elkeseredett prioritásharcba kezdtek Leibniz barátaival. Plágiummal vádolták Leibniz et, jóllehet egy új elmélet elemeivel telített légkörben mi sem természetesebb, mint az egyidejű, független felfedezések. A kalkulus „felfedezése” körül keletkezett prioritásharc szerencsétlen szokást eredményezett az elsőbbségi igények túlságos hangsúlyozására, s ezen az alapon a szellemi tulajdon iránt támasztott követelések nagyon könnyen megmérgezik a természettudósok közötti érintkezés légkörét. Úgy látszott, hogy a XVII. században, s a XVIII. század nagyobbik felében a matematikai analízis elhagyja a tiszta és világos érvelés görög ideálját. „Intuíció” és „ösztönös útkeresés” helyettesítette sok fontos esetben a (logikai szigorúságú) érvelést. Ez azután az új módszerek iránti kritikátlan vakhitre vezetett, s szinte emberfelettinek képzelték erejüket. Általános volt a vélemény, hogy a kalkulus eredményeinek világos előadása nemcsak szükségtelen, lehetetlen is. Ha az új tudomány nem kivételes képességű emberek kicsiny csoportjának a kezében lett volna, igen komoly hibák, valóságos katasztrófa következhetett volna be. Az úttörőket azonban erős matematikai ösztönük vezette, s ez megőrizte őket a túl nagy tévedésektől. Azonban amikor a francia forradalom óriási mértékben kiterjesztette a felsőfokú oktatásban részesülők körét, mikor egyre többen és többen kívántak részt venni a tudományos tevékenységben, akkor az új analízis kritikai felülvizsgálatát már nem lehetett tovább halogatni. Ezzel a feladattal a XIX. század nézett szembe, s ma a kalkulus a misztikum legcsekélyebb nyoma nélkül, teljes szigorral tanítható. Semmivel sem lehet megokolni ma már, miért ne érthetné meg minden művelt ember a természettudományoknak ezt az alapvető eszközét. Ebben a fejezetben elemi bevezetést szeretnénk adni. Inkább az alapfogalmak megértésére törekszünk, nem a formális manipulációk ismertetésére. Végig előtérbe helyeztük a szemléletességet, de úgy, hogy a szemléltetés a legteljesebb összhangban legyen a pontos fogalmakkal s a világos eljárásokkal.
478
1. § Az integrál 1. Terület mint határérték Síkidomok területszámításában válasszuk területegységnek az egységnyi oldalhosszúságú négyzetet. Ha hosszegységünk a centiméter, a megfelelő területegység a négyzetcentiméter lesz; azaz az a négyzet, melynek oldala egy centiméter hosszú. A definíció alapján igen könnyen kiszámíthatjuk a derékszögű négyszög területét. Ha p és q a négyszög két szomszédos oldalának hosszegységünkben mért hosszúsága, akkor a derékszögű négyszög területe pq négyzetegység, vagy röviden, a terület egyenlő a pq szorzattal. Ez tetszőleges p-re és q-ra igaz, akár racionálisak, akár nem. Racionális p-re és q-ra úgy kapjuk ezt az eredményt, hogy m, n, m 0 , n 0 egész számokkal felírjuk, hogy p = m/n, q = m 0 /n 0 . Azután megkeressük a két oldal közös mértékét, ami 1/N = 1/nn 0 , úgyhogy p = mn 0 /N, q = nm 0 /N. Végül a derékszögű négyszöget 1/N oldalú és 1/N2 területű kis négyzetekre osztjuk. Az ilyen kis négyzetek száma nm 0 · mn 0 , és az egész terület nm 0 mn 0 · 1/N2 = nm 0 mn 0 /n2 n 02 = m/n · m 0 /n 0 = pq. Ha p és q irracionális, ugyanezt az eredményt kapjuk, p-t és q-t pr és qr közelítő racionális számokkal helyettesítve, azután feltételezve, hogy pr és qr tart a p-hez és a q-hoz. Geometriailag nyilvánvaló, hogy a háromszög területe egyenlő azon derékszögű négyszög területének a felével, melynek alapja ugyanaz a b és magassága ugyanaz a h, mint a háromszögé; a háromszög területét tehát a jól ismert 12 bh kifejezés adja meg. A sík bármely, egy vagy több sokszögvonal által határolt tartománya felbontható háromszögekre; tehát területe mint ezen háromszögek területének az összege kapható meg. A területek számításának általánosabb módszerei akkor válnak szükségessé, ha nem sokszögvonalak, hanem görbék által határolt síkidomok területét keressük. Hogy kell pl. meghatározni a körlemez területét, vagy a parabolaszeletét? Ezt a fontos kérdést, amely az egész integrálszámítás alapja, már i. e. III. században tárgyalta Arkhimédész, aki az ilyen területeket „exhauszciós” (kimerítési) módszerrel számította ki. Mint Arkhimédész, s mint minden nagy matematikus egészen Gauss koráig, mi is elfogadhatjuk azt a „naiv” szemléletet, amelyik a görbe által határolt területet szemléletesen adott létezőnek tekinti, olyasminek, amit kiszámítani kell, nem pedig definiálni (l. mégis a 480. oldalon közölt fejtegetést). A kiszámítandó tartományba egy közelítő tartományt írunk, melynek
479
sokszögvonal a határa, s pontosan meghatározott területe van. Ha most választunk egy olyan beírt sokszögtartományt, amely az előbbit magába zárja, a kiszámítandó tartomány jobb megközelítését kapjuk. Ilyen módon haladva tovább, fokozatosan „kimeríthetjük” az egész területet: a kiszámítandó tartomány területét növekvő oldalszámú beírt sokszögtartományok alkalmasan választott sorozatának a határértékeként kapjuk meg. Kiszámíthatjuk ily módon az 1 sugarú kör területét; ennek a területnek a számértékét π-vel jelöljük. Arkhimédész ezt az általános eljárást a kör és a parabolaszelet esetében végezte el. A XVII. században sok más esetet oldottak meg vele sikerrel. A határérték tényleges kiszámítása minden egyes esetben valamilyen szellemes műfogáson alapult, amely a kezelt speciális probléma természetéhez alkalmazkodott. A kalkulus egyik legfőbb eredménye éppen az volt, hogy ezeket a speciális és korlátolt hatóképességű területszámítási eljárásokat egy eredményes, általános módszerrel helyettesítette. 2. Az integrál
259. ábra. Az integrál mint terület A infinitezimális számítás első alapvető fogalma az integrál fogalma. Ebben a pontban az integrál elnevezésen a görbe alatti terület határérték segítségével kifejezett értékét fogjuk érteni. Ha adva van egy y = f(x) pozitív folytonos függvény, pl. y = x2 vagy y = 1 + cos x, akkor azt a területet tekintjük, amelyet alulról az x-tengely egy a koordinátától valamely nagyobb b koordinátáig terjedő szakasza határol, két oldalról az a és b pontban az x-tengelyre emelt merőlegesek, felülről pedig az y = f(x) görbe. Ennek a tartománynak A területét akarjuk kiszámítani.
480
Mivel ilyen tartomány általában nem bontható fel négyszögekre vagy háromszögekre, nem kaphatunk explicit számolással közvetlen kifejezést erre az A területre. De találhatunk A-ra közelítő értéket, s így előállíthatjuk A-t határértékként, a következő módon: Osszuk fel az x = a-tól x = b-ig terjedő intervallumot adott számú kis részintervallumra, emeljünk minden osztáspontban merőlegest az x-tengelyre és helyettesítsük a görbe alatti tartomány mindegyik sávját olyan téglalappal, amelynek magasságát valahol a görbe illető sávba eső legalacsonyabban és legmagasabban fekvő pontja között választjuk. E derékszögű négyszögek területének S összege a görbe alatti tényleges A terület egyik közelítő értékét adja. A megközelítés pontossága annál nagyobb lesz, minél nagyobb a derékszögű négyszögek száma és minél keskenyebb egy-egy ilyen kis derékszögű négyszög. A pontos területet tehát határértékként jellemezhetjük: ha a görbe alatti terület négyszögbeosztás-megközelítéseiből olyan S1 , S2 , S3 , . . .
(1)
sorozatot képezünk, hogy Sn legszélesebb derékszögű négyszögének a szélessége n növekedtével 0-hoz tart, akkor (1) sorozat A határértéket közelíti meg, Sn → A,
(2)
és ez az A határérték, a görbe alatti terület, független attól, miféle speciális módon választjuk az (1) sorozatot, feltéve, hogy a közelítő derékszögű négyszögek szélessége nullához tart. (Pl. Sn keletkezhetik Sn−1 -ből egy vagy több új osztáspontot csatolva az Sn−1 -et definiáló osztáspontokhoz, de lehet Sn osztáspontjainak a választása teljesen független is Sn−1 osztáspontjainak a választásától.) A tartomány ezen határértékként kifejezett A területét nevezzük definíciószerűen az f(x) függvény a-tól b-ig terjedő integráljának. Speciális szimbólummal, az „integrál”-jellel Zb A = f(x) dx
(3)
a
alakba írjuk. R Az szimbólumot, „dx”-et és az „integrál” elnevezést Leibniz vezette be, hogy
481
emlékeztessen arra a módra, ahogyan a határértéket kapjuk. A jelölés megmagyarázására ismételjük el részletesebben az A terület megközelítésének folyamatát. Ezzel egyszerre a határérték képzésének analitikus megfogalmazása lehetőséget ad majd, hogy elvessük az f(x) = 0 és b > a megszorító feltételeket, s végül, hogy kiküszöbölhessük az integrál definíciónk alapjaként elfogadott terület szemléletes fogalmát (utóbbit a kiegészítés 1. §-ában fogjuk végrehajtani).
260. ábra. Terület megközelítése kis négyszögekkel Osszuk be az a-tól b-ig terjedő intervallumot n kis részintervallumra és tegyük fel az egyszerűség kedvéért, hogy mindegyik részintervallum egyenlő, (b − a)/n szélességű. Vezessük be az osztáspontokra az x0 = a, x2 = a +
2(b − a) , n
x1 = a + ...,
b−a , n
xn = a +
n(b − a) =b n
jelöléseket. Jelöljük az egymás után következő x értékek közötti (b − a)/n különbséget ∆x-szel (olv. „delta x”), ∆x =
b−a = xj+1 − xj , n
ahol a ∆ szimbólum egyszerűen „különbséget” jelent (∆ „operátor” szimbólum, nem szabad számmal összetéveszteni). Választhatjuk mindegyik közelítő derékszögű négyszög magassságának a részintervallum jobb oldali végpontjában felvett y = f(x) értéket.
482
Akkor ezen derékszögű négyszögek területeinek az összege Sn = f(x1 ) · ∆x + f(x2 ) · ∆x + . . . + f(xn ) · ∆x alakú lesz, amit rövidítve Sn = alakba írunk. Itt a
Pn j=1
n X
(4)
(5)
f(xj ) · ∆x
j=1
szimbólum (olvasd „szigma j = 1-től n-ig” vagy „szumma
j = 1-től n-ig”) azt jelenti, hogy összegezni kell azokat a kifejezéseket, amelyeket kapunk, ha j sorra felveszi az 1, 2, 3, . . ., n értékeket. A
P
szimbólum használata összegezés eredményének tömör alakban való kifejezésére a
következő példákkal illusztrálható: 2 + 3 + 4 + . . . + 10 =
10 X
j,
j=2
1 + 2 + 3 + ... + n =
n X
j,
j=1
2
2
2
2
1 + 2 + 3 + ... + n =
n X
j2 ,
j=1
2
n
aq + aq + . . . + aq =
n X
aqj ,
j=1
n X a + (a + d) + (a + 2d) + . . . + (a + nd) = (a + jd). j=0
Képezzünk most az ilyen Sn megközelítésekből sorozatot. Ha n minden határon túl nő, nő mindegyik (5) szummában a tagok száma, az egyes f(xj ) ∆x tagok pedig mind nullához tartanak a ∆x = (b − a)/n tényező miatt. Növekvő n-nel az (5) összeg az A
483
területhez tart, A = lim
n X j=1
Zb f(xj ) · ∆x =
f(x) dx.
(6)
a
Ezt a határátmenetet – az Sn közelítő összegről A-ra – szimbolizálta Leibniz, amikor R P az összegezés jelét felcserélte az jellel, a ∆ szimbólumot d-vel. (Leibniz korában R P a szummációs szimbólum jelét rendesen S-nek írták, s az szimbólum nem egyéb stilizált S betűnél.) Leibniz szimbóluma nagyon kifejező annak a módszernek a szempontjából, ahogyan az integrált kapjuk, véges összeg határértékeként. De vigyázni kell arra, nehogy hatása alatt túlságosan jelentősnek higgyünk valamit, ami végül is puszta konvenció: ti. azt, hogy hogyan jelöljük a határértéket. A kalkulus történetének korai napjaiban, amikor a határérték fogalmát még nem értették tisztán, nem mindig akkor alkalmazták, amikor kellett volna, az integrál jelentését úgy magyarázták, hogy „a véges ∆x különbséget a végtelen kicsiny dx mennyiséggel kell helyettesíteni, és az integrál maga végtelen sok végtelen kicsiny f(x) dx mennyiség összege.” A végtelen kicsiny határozottan vonzza a spekulatív lelkeket, a modern matematikában azonban semmi helye sincsen. Semmi haszna, ha az integrál világos fogalmát jelentés nélküli frázisok ködével vesszük körül. De néha még magát Leibniz et is elragadta szimbólumainak szuggesztív ereje; ezek a szimbólumok úgy hatnak, mintha „végtelen kicsiny” mennyiségek összegét jelölnék, végtelen kicsiny mennyiségekét, amelyekkel sok szempontból mégis úgy lehetne dolgozni, mintha közönséges mennyiségek lennének. Valóban, az integrál elnevezést is azért találták ki, hogy utaljanak rá: az egész, integer terület A „infinitezimális” f(x) dx részekből van összetéve. Csaknem száz év telt el Newton és Leibniz kora után, míg világosan felismerték, hogy a határértékfogalom, csak ez és semmi más, az egyedüli alapja az integrál definíciójának. Ezen az alapon megmaradva elkerülhetünk minden pontatlanságot, nehézséget és értelmetlenséget, mindent, ami annyira zavarta az infinitezimális számítás korai fejlődését. 3. Általános megjegyzések az integrálfogalomról. Általános definíció Az integrál területként való geometriai definíciójában explicite feltettük, hogy f(x) az integrálás a, b intervallumában sehol nem lehet negatív, azaz a függvényt ábrázoló görbe egyetlen része sem feküdhet az x-tengely alatt. De ha az integrált analitikusan
484
261. ábra. Pozitív és negatív területek definiáljuk, az Sn összegek sorozatának határértékeként, akkor ez a megszorítás felesleges. Egyszerűen vesszük a kicsiny f(xj ) · ∆x mennyiségeket, képezzük az összegüket, azután határátmenetet végzünk; ez az eljárás akkor is teljesen értelmezett marad, ha az f(xj ) értékek némelyike, vagy akár minden f(xj ) érték, negatív. Geometriailag, területekkel interpretálva (261. ábra), az f(x) integrálját a függvény görbéje és az x-tengely által határolt területek algebrai összegeként kapjuk, ahol az x-tengely alatti területeket negatívoknak számítjuk, a többit pozitívnak. Az alkalmazásokban előfordulhat, hogy olyan
Rb a
f(x) dx integrálra jutunk, ahol b
kisebb, mint a, úgyhogy (b − a)/n = ∆x negatív szám. Analitikus definíciónkban f(xj ) · ∆x negatív, ha f(xj ) pozitív és ∆x negatív stb. Más szóval az integrál értéke a b-től a-ig terjedő integrál értékének negatívja lesz. Így az egyszerű Zb
Za f(x) dx = − f(x) dx
a
b
szabályt kapjuk.
262. ábra. Tetszőleges beosztás az integrál általános definíciójában
485
Hangsúlyozni kívánjuk, hogy az integrál értéke ugyanaz marad akkor is, ha a beosztásban nem szorítkozunk egymástól egyenlő távolságra levő xj pontokra, vagy ami ugyanaz, egyenlő ∆x = xj+1 − xj különbségekre. Választhatjuk az xj -ket másképpen is, úgy, hogy a ∆xj = xj+1 − xj különbségek nem egyenlőek (és ennek megfelelően indexszel különböztetendők meg). Az Sn = f(x1 ) · ∆x0 + f(x2 ) · ∆x1 + . . . + f(xn ) · ∆xn−1 összegek és az Sn0 = f(x0 ) · ∆x0 + f(x1 ) · ∆(x1 ) + . . . + f(xn−1 ) · ∆xn−1 összegek azonos határértékhez tartanak ebben az esetben is, ez a határérték az
Rb a
f(x) dx
integrál értéke, feltéve, ha vigyázunk arra, hogy növekvő n-nel a ∆xj = xj+1 − xj különbségek mind úgy tartsanak nullához, hogy a különbségek közül az, amelyik adott n-re legnagyobb, tartson nullához, ha n növekszik. Ennek megfelelően az integrál végső definíciója
Zb f(x) dx = lim a
n X
f(vj ) · ∆xj ,
(6a)
j=1
ha n → ∞. Ebben a kifejezésben vj bármely pontot jelölhet az xj 5 vj 5 xj+1 intervallumban, és a beosztásra kiszabott egyetlen korlátozás az, hogy a leghosszabb ∆xj = xj+1 − xj intervallumnak nullához kell tartania, ha n növekszik. A (6a) határérték létezése nem igényel bizonyítást, ha adottnak vesszük a görbe alatti terület fogalmát és azt a lehetőséget, hogy ez a terület megközelíthető derékszögű négyszögek összegeivel. Azonban, amint az később tárgyalni fogjuk (480. o.), pontosabb elemzésből kiderül, hogy az integrálfogalom logikailag teljes megadásához kívánatos, sőt, egyenesen nélkülözhetetlen, hogy bizonyítsuk bármely f(x) folytonos függvény esetében a határérték létezését, a terület geometriai fogalmára való minden előzetes hivatkozás nélkül.
486
4. Példák integrálásra. xn integrálása Eddig tisztán elméleti szempontból tárgyaltuk az integrálszámítást. A döntő kérdés azonban az, hogy vajon ez az általános eljárás: az Sn képzése, s azután a határátmenet, ténylegesen kézzelfogható eredményre vezet-e konkrét esetekben? Természetesen ennek az eldöntéséhez további meggondolásra van szükség, amely megfelel annak a specifikus f(x) függvénynek, aminek éppen az integrálját keressük. Amikor jó kétezer évvel ezelőtt Arkhimédész megtalálta a parabolaszelet területének a kiszámítására szolgáló eljárást, lényegében azt végezte el, roppant szellemes műfogás segítségével, amit mi ma az f(x) = x2 függvény integrálásának nevezünk; a XVII. században a modern infinitezimális számítás előfutárai sikerrel oldották meg olyan egyszerű függvények integrálását, mint pl. xn , megint csak speciális műfogásokkal. Sok-sok speciális esetben szerzett tapasztalat kellett ahhoz, hogy megtalálják az integrálás problémájának általános megoldását az infinitezimális számítás rendszeres módszereiben, s ezzel egyúttal a megoldható individuális problémák köre is hatalmasan megnőtt. A jelen pontban néhány tanulságos speciális problémát tárgyalunk, olyanokat, amelyek az integrálszámítás kidolgozása előtti időkből származnak, mivel ezek a problémák kitűnően illusztrálják azt a tényt, hogy az integrálás semmi egyéb, mint határérték-számítás. a.) Egy meglehetősen triviális példával kezdjük. Ha y = f(x) állandó, például f(x) = 2, Rb akkor nyilvánvaló, hogy a 2 dx integrál, területként felfogva egyenlő 2(b − a)-val, mivel a derékszögű négyszög területe egyenlő: alap szorozva a magassággal. Hasonlítsuk össze ezt az eredményt az integrálnak mint határértéknek (6) alatt adott definíciójával. Ha az (5)-ben minden j értékre f(xj ) = 2 értéket helyettesítünk be, azt találjuk, hogy Sn = lim
n X j=1
f(xj ) · ∆x =
n X j=1
2 ∆x = 2
n X
∆x = 2(b − a)
j=1
minden n-re, mivel n X
∆x = (x1 − x0 ) + (x2 − x1 ) + . . . + (xn − xn−1 ) = xn − x0 = b − a.
j=1
b.) Majdnem ilyen egyszerű f(x) = x integrálása is. Itt
Rb a
x dx egy trapéz területe
487
263. ábra. A trapéz területe (263. ábra), és ez, az elemi geometria szerint, (b − a)
b+a b2 − a 2 = . 2 2
Ez az eredmény megint összhangban van az integrál (6) alatti definíciójával, amint az látható egy ténylegesen elvégzett határátmenetből, melyet a geometriai ábrára való tekintet nélkül végzünk: ha az (5)-ben f(x) = x-et helyettesítünk be, akkor az Sn összeg Sn =
n X j=1
xj ∆x =
n X
(a + j∆x)∆x =
j=1
= (na + ∆x + 2∆x + 3∆x + . . . + n∆x)∆x = = na∆x + (∆x)2 (1 + 2 + 3 + . . . + n). A 14. oldalon megadott (1) képletet használva az 1 + 2 + 3 + . . . + n számtani sorra, azt kapjuk, hogy Sn = na∆x + Mivel ∆x =
b−a , n
n(n + 1) (∆x)2 . 2
ez egyenlő 1 1 Sn = a(b − a) + (b − a)2 + (b − a)2 2 2n
488
kifejezéssel. Ha most n a végtelenhez tart, az utolsó tag a nullához tart, s az eredmény Zb lim Sn =
1 1 x dx = a(b − a) + (b − a)2 = (b2 − a2 ), 2 2
a
megegyezésben az integrálnak területként való geometriai értelmezésével.
264. ábra. Parabola alatti terület c.) Kevésbé triviális már az f(x) = x2 függvény integrálása. Arkhimédész geometriai módszert használt az ezzel ekvivalens geometriai probléma megoldására. Ez a probléma az, hogy y = x2 parabola szeletének a területét kell megkeresni. Analitikusan járunk el a (6a) definíció alapján. A formális számítás egyszerűsítése kedvéért válasszuk 0-t az integrál a „alsó határá”-nak ; akkor ∆x = b/n. Mivel xj = j · ∆x és f(xj ) = j2 (∆x)2 , Sn -re az Sn =
n X
f(j∆x)∆x = [12 · (∆x)2 + 22 · (∆x)2 + . . . + n2 · (∆x)2 ] · ∆x =
j=1
= (12 + 22 + . . . + n2 )(∆x)3 kifejezést kapjuk. Most már ténylegesen kiszámíthatjuk a határértéket. Használjuk a 16. oldalon levezetett 12 + 22 + . . . + n2 =
n(n + 1)(2n + 1) 6
489
képletet, és végezzük el a ∆x = b/n helyettesítést, akkor azt kapjuk, hogy n(n + 1)(2n + 1) b3 b3 · 3 = Sn = 6 n 6
1 1 1+ 2+ . n n
Ez az előzetes átalakítás igen megkönnyíti a határérték kiszámítását, mivel 1/n nullához tart, ha n minden határon túl nő. Így határértékként egyszerűen
b3 6
·1·2=
b3 3
adódik,
az eredmény tehát Zb x2 dx =
b3 . 3
0
Alkalmazzuk ezt az eredményt 0-tól a-ig terjedő területre, Za x2 dx =
a3 , 3
0
és kivonva a területeket Zb x2 dx =
b3 − a3 . 3
a
*Feladat: Bizonyítsuk be ugyanígy, a 17. oldalon megadott (5) képlet használatával, hogy Zb x3 dx =
b4 − a4 . 4
a
Általános képleteket vezetve le az 1-től n-ig terjedő egész számok k-adik hatványainak 1k + 2k + . . . + nk összegére, Zb xk dx =
bk+1 − ak+1 , k+1
(7)
a
k tetszőleges pozitív egész szám. *De ahelyett, hogy ezen az úton haladnánk, még egyszerűbb módszerrel, még általánosabb eredményt kapunk, ha azt az előző megjegyzésünket alkalmazzuk, hogy az integrált kiszámíthatjuk egymástól nem egyenlő távolságban levő osztáspontok segítségével is. A (7) képletet nemcsak
490
bármely pozitív egész k számra vezetjük le, hanem tetszőleges pozitív vagy negatív k = u/v racionális számra, ahol u pozitív egész szám, v pedig pozitív vagy negatív egész szám. Csupán a k = −1 értéket zárjuk ki, amelyre a (7) képlet nincsen értelmezve. Azt is feltételezzük, hogy 0 < a < b. A (7) integrálási formula levezetésére olyan Sn -eket képezünk, ahol az x0 = a, x1 , x2 , . . ., p xn = b osztáspontok geometriai sorban követik egymást. Vezessük be n a/b = q jelölést, úgyhogy b/a = qn , és legyen definíciószerűen x0 = a, x1 = aq, x2 = aq2 , . . ., xn = aqn = b. Látni fogjuk, hogy ezzel a műfogással a határátmenet igen könnyű lesz. Az Sn „téglányösszeg”, mivel f(xj ) = xkj = ak qjk , és ∆xj = xj+1 − xj = aqj+1 − aqj , Sn = ak (aq − a) + ak qk (aq2 − aq) + ak q2k (aq3 − aq2 ) + . . . + ak q(n−1)k (aqn − aqn−1 ) lesz. Mivel mindegyik tag tartalmazza az ak (aq − a) tényezőt, írhatjuk, hogy
Sn = ak+1 (q − 1) 1 + qk+1 + q2(k+1) + . . . + q(n−1)(k+1) . t-t helyettesítve qk+1 helyébe, látjuk, hogy a kapcsos zárójelbe tett kifejezés 1 + t + t2 + . . . + tn−1 tn − 1 geometriai sor, melynek összege, amint azt a 15. oldalon láttuk, . Azonban tn = qn(k+1) = t − 1 k+1 b bk+1 = k+1 . a a Sn = (q − 1)
bk+1 − ak+1 qk+1 − 1
=
bk+1 − ak+1 , N
(8)
ahol N=
qk+1 − 1 . q−1
Eddig n rögzített szám volt. Engedjük most n-et növekedni, és határozzuk meg N határértékét. p Amint n növekszik, n b/a = q 1-hez tart (l. 393. o.), tehát N számlálója és nevezője egyaránt nullához tart, ami óvatosságra int. Tegyük fel először, hogy k valamely pozitív egész szám; akkor a (q − 1)-gyel való osztás elvégezhető, és azt kapjuk, hogy (122. o.) N = qk + qk−1 + . . . + q + 1. Ha n növekszik, q 1-hez tart tehát q2 , q3 , . . ., qk is az 1-hez tart, úgyhogy N k + 1-et közelíti bk+1 − ak+1 meg. Ebből azonban azt látjuk, hogy Sn a értékhez tart, ami bizonyítandó volt. k+1
491
Feladat: Bizonyítsuk be, hogy bármely racionális k 6= −1 értékre ugyanez a határérték-formula, N → k + 1, tehát a (7) eredmény továbbra is érvényes. Adjuk meg először, mint most tettük, egész, de negatív k számokra a bizonyítást. Legyen azután k = u/v, vezessük be a q1/v = s jelölést és az s(k+1)v − 1 su+v − 1 su+v − 1 N= = = sv − 1 sv − 1 s−1
sv − 1 s−1
jelölést. Ha n növekszik, s és q egyaránt 1-hez tart, tehát a jobb oldalon a számlálóban álló hányados (u+v)-hez, a nevezőben álló v-hez, így N határértékére ismét az (u+v)/v = k+1 értéket kapjuk. Az 5. §-ban megmutatjuk majd, hogy ezt a hosszadalmas és mesterkélt számítgatást mennyivel egyszerűbb és célravezetőbb módszerrel váltja fel az integrálszámítás. 1 1 Feladatok: 1) Igazoljuk xk fenti integrálásat k = , − , 2, −2, 3, −3 esetére. 2 2 2) Keressük meg az alábbi integrálok értékét: −1 Z
a)
+1 Z
x dx. b) −2
Z2 x dx. c)
−1
−2 Z 2
x dx.
d)
1
Zn 3
x dx.
e)
−1
x dx. 0
3) Keressük meg a következő integrálok értékét: +1 Z
a)
+2 Z 3
x dx. −1
b)
+1 Z
x cos x dx. c) −2
+1 Z
x cos x sin x dx. d)
3
4
2
tg x dx.
5
−1
−1
(Útmutatás: Tekintsük az integráljel alatti függvények görbéit, vegyük figyelembe x = 0-ra vonatkoztatott szimmetria tulajdonságaikat, s értelmezzük az integrálokat területként.) *4) Integráljuk sin x és cos x függvényeket 0-tól b-ig ∆x = h helyettesítést és a 633. oldal képleteit alkalmazva. 5) Integráljuk f(x) = x és f(x) = x2 függvényeket 0-tól b-ig egyenlő részekre beosztva és a 1 (6a)-ban vj = (xj + xj+1 ) értékeket helyettesítve. 2 *6) Igazoljuk a (7) és az integrál egyenlő ∆x értékekkel való definiciója alapján az 1k + 2k + . . . + nk 1 → , k+1 n k+1
ha
n→∞
1 határátmenetet. (Útmutatás: Írjunk = ∆x-et, és mutassuk meg, hogy a határérték egyenlő n R1 k 0 x dx integrállal.)
492
*7) Igazoljuk n → ∞ esetére: 1 √ n
1 1 1 √ +√ + ... + √ n+n 1+n 2+n
√ → 2( 2 − 1)
(Útmutatás: Írjuk fel ezt az összeget úgy, hogy határértékét integrál formájában kapjuk meg.) 8) Számítsuk ki a P1 P2 parabolaív és a P1 P2 húr által határolt parabolaszelet területét y = ax2 parabola esetében a két pont, x1 és x2 koordinátái segítségével.
5. Az integrálszámítás szabályai Fontos lépés volt az infinitezimális számítás történetében, amikor sikerült olyan általános szabályokat megfogalmazni, amelyek segítségével a bonyolult problémák egyszerűbbekre voltak visszavezethetők, s így csaknem gépies módon megoldhatóvá váltak. Az infinitezimális számításnak ezt az algoritmikus jellegét különösen szépen lehet látni Leibniz jelölési módjában. Ha azonban túlságosan a problémák mechanikus megoldására koncentrálunk, könnyen üres gyakorlattá süllyeszthetjük az integrálszámítás oktatását. Az integrálás néhány egyszerű szabálya azonnal következik akár a (6) definícióból, akár az integrál területként való geometriai értelmezéséből. Két függvény összegének az integrálja egyenlő a két függvény integráljainak az összegével. Egy f(x) függvény valamely c állandóval való szorzatának az integrálja egyenlő f(x) integráljának c-szeresével. A két szabályt összefoglalva a következő képlet fejezi ki: Zb
Zb
Zb
[cf(x) + dg(x)] dx = c f(x) dx + d g(x) dx. a
a
(9)
a
A bizonyítás közvetlenül következik az integrál véges összeg határértékeként való definíciójából (5), mivel egy Sn összegre szemmel láthatóan igaz a megfelelő formula. A szabály közvetlenül kiterjeszthető kettőnél több függvény esetére. A szabály használatára példaként tekintsük az f(x) = a0 + a1 x + a2 x2 + . . . + an xn polinomot, ahol az a0 , a1 , . . ., an együtthatók állandók. f(x) polinom a-tól b-ig ter-
493
jedő integráljának a képzésére tagonként haladunk, a szabály szerint. A (7) képlet használatával azt találjuk, hogy Zb f(x) dx = a0 (b − a) + a1
bn+1 − an+1 b2 − a2 + . . . + an . 2 n+1
a
Egy másik, az analitikus és a geometriai értelmezésből egyaránt nyilvánvaló szabályt fejez ki az Zb
Zc
Zc
f(x) dx + f(x) dx = a
f(x) dx
(10)
a
b
képlet. Nyilvánvaló továbbá, hogy az integrál 0 lesz, ha b egyenlő a-val. A 485. oldalon említett Zb
Za (11)
f(x) dx = − f(x) dx a
b
megegyezik az utóbbi két szabállyal, mivel (10) azon esetének felel meg, ha c = a. Néha kényelmesebbé tehető a számítás annak a ténynek a felhasználásával, hogy az integrál értéke nem függ az f(x) független változója számára választott speciális x névtől; pl. Zb
Zb f(x) dx =
a
Zb f(u) du =
a
f(t) dt
stb.
a
ugyanis a koordináták nevének egyszerű megváltoztatása abban a rendszerben, amelyben a függvényt grafikusan ábrázoljuk, nem változtatja meg a görbe alatti területet. Ugyanez a megjegyzés érvényes akkor is, ha magát a koordinátarendszert változtatjuk meg. Toljuk el pl. a 265. ábrán a koordinátarendszer kezdőpontját egy egységgel jobbra, O-ból O 0 -be úgy, hogy x-et az új x = 1 + x 0 által megadott x 0 koordináta váltsa fel. Az y = f(x) egyenletű görbe egyenlete az új koordináta-rendszerben y = f(1 + x 0 ) lesz. Pl. 1 1 y= = . Ez alatt a görbe alatti adott A terület, mondjuk x = 1 és x = b között, x 1 + x0
494
265. ábra. Az y-tengely eltolása az új koordináta-rendszerben az x 0 = 0 és x 0 = b − 1 közötti ív alatti terület lesz. Tehát Zb
b−1 Z
f(1 + x 0 ) dx 0 ,
f(x) dx = 1
0
vagy x 0 nevet u-ra változtatva Zb
b−1 Z
f(x) dx = 1
f(1 + u) du.
(12)
0
Például Zb 1
1 dx = x
b−1 Z
1 du; 1+u
(12a)
0
495
és f(x) = xk függvényre Zb
b−1 Z k
1
(12b)
(1 + u)k du;
x dx = 0
Hasonlóképpen Zb
b−1 Z k
(1 + u)k du
x dx = 0
Mivel (12c) jobb oldala egyenlő
(12c)
(k = 0).
−1
bk+1 -gyel, azt kapjuk, hogy k+1 b−1 Z
(1 + u)k du =
bk+1 . k+1
(12d)
−1
Feladatok: 1) Számítsuk ki 1 + x + x2 + . . . + xn 0-tól b-ig terjedő integrálját. 2) Igazoljuk n > 0-ra, hogy (1 + x)n −1-től z-ig terjedő integrálja egyenlő (1 + z)n+1 (n + 1) értékkel. 3) Mutassuk meg, hogy xn sin x függvény 0-tól 1-ig terjedő integrálja kisebb mint (Útmutatás: az utóbbi érték xn integrálja.) 4) Igazoljuk közvetlenül és a binominális tétel alkamazásával, hogy z-ig terjedő integrálja
(1 + z)n+1 . n(n + 1)
1 . n+1
(1 + x)n függvény −1-től n
Említsünk meg végül két, egyenlőtlenség alakjában megadott fontos szabályt. Ez a két szabály igen hasznosan alkalmazható az integrálok értékének durva megbecsülésére. Tegyük fel, hogy b > a, és hogy az f(x) függvény értékei az a, b intervallumban sehol sem nagyobbak egy másik g(x) függvény értékeinél. Akkor felírható, hogy Zb
Zb f(x) dx 5
a
496
g(x) dx, a
(13)
266. ábra. Integrálok összehasonlítása amint az azonnal látható vagy a 266. ábrából, vagy az integrál analitikus definíciójáből. Ha speciálisan g(x) = M állandó, amelynél f(x) függvény értékei nem nagyobbak, akkor felírható, hogy Zb
Zb g(x) dx =
a
M dx = M(b − a). a
Következésképpen Zb f(x) dx 5 M(b − a).
(14)
a
Ha f(x) nem negatív, akkor f(x) = |f(x)|. Ha f(x) < 0, akkor |f(x)| > f(x). Tehát, a (13)-ban g(x) = |f(x)|-et helyettesítve, a következő hasznos képletet kapjuk: Zb
Zb
f(x) dx 5 |f(x)| dx. a
(15)
a
Mivel |−f(x)| = |f(x)|, azt is felírhatjuk, hogy Zb
Zb
− f(x) dx 5 |f(x)| dx, a
a
497
s ez, (15)-tel együtt, a valamivel élesebb b b Z Z f(x) dx 5 |f(x)| dx. a
(16)
a
egyenlőtlenséget adja.
2. § A derivált 1. A derivált mint érintő iránytangense Míg az integrálfogalom gyökerei már az ókorban megtalálhatók, az infinitezimális számítás másik alapvető fogalmát, a deriváltét, csak a XVII. században fogalmazta meg Fermat s mások. Newton és Leibniz fedezték fel, hogy ez a két, látszólag annyira különböző fogalom szervesen összefügg egymással, s ez a felfedezés azután a matematikai tudományok addig páratlan fejlődésének a kiindulópontja lett. Fermat azt vizsgálta, hogyan lehet egy y = f(x) függvény minimumát és maximumát meghatározni. A függvény grafikus ábrázolásában a maximum csúcsnak, tetőpontnak felel meg, amely minden környező pontnál magasabban van, a minimum pedig mélypontnak, amely valamennyi környező pontnál mélyebben fekszik. A 342. oldalon a 191. ábrán a B pont maximum, a C pont pedig minimum. A maximum és minimum pontok jellemzésére természetes módon kínálkozik a görbe érintőjének a fogalma. Feltesszük, hogy a görbén nincs csúcsos szöglet vagy egyéb szingularitás és, hogy minden egyes pontjában van határozott iránya, melyet érintője ad meg. Maximum vagy minimum pontokban az y = f(x) görbe érintőjének párhuzamosnak kell lennie az x-tengellyel, hiszen egyébként emelkednék vagy esnék a görbe ezekben a pontokban. Ezek a megjegyzések arra csábítanak, hogy egész általánosságban vizsgáljuk az y = f(x) görbe tetszőleges P pontjában a görbéhez húzott érintő irányát. Egy egyenes irányát az x, y síkon az ún. iránytangens megadásával szokás jellemezni. Ez az iránytangens annak a szögnek a tangense, melyet az egyenes az x-tengely pozitív irányával bezár. Ha P az L egyenes egy tetszőleges pontja, haladjunk jobb kéz felé az x-tengellyel párhuzamos irányban valamely R pontig, itt forduljunk meg felfelé vagy lefelé, és haladjunk az x-tengelyre merőlegesen az egyenesen fekvő Q pontig: L egyenes
498
267. ábra. Egyenesek iránytangensei RQ lesz. A PR távolságot pozitívnak vesszük, RQ aszerint PR pozitív vagy negatív, amint R-ből felfelé vagy lefelé kell haladni Q-hoz, úgyhogy az iránytangense akkor tg α =
iránytangens a vízszintes irány mentében vett hosszúságegységre eső emelkedést vagy süllyedést fejezi ki, ha az L egyenesen balról jobbra haladunk. A 267. ábrán az első egyenes iránytangense 2/3, a másodiké pedig −1. A görbe P pontjához tartozó iránytangensén a görbe P pontjába húzott érintőjének iránytangensét értjük. Amíg a görbe érintőjét szemléletesen adott matematikai fogalomnak fogadjuk el, addig csupán azt a problémát kell megoldanunk, hogyan kell eljárást találni az iránytangens kiszámítására. Egyelőre ezt a szempontot fogadjuk el, az itt szereplő problémák részletesebb elemzését a kiegészítésre (559. o.) halasztva. 2. A derivált mint határérték Az y = f(x) görbe P(x, y) pontbeli iránytangensét nem lehet egyedül a P pont figyelembevételével kiszámítani. Határértéket kell itt is számítani, olyasféle módon, mint a görbe alatti terület kiszámításánál. Ez a határértékszámítás a differenciálszámítás alapja. Tekintsünk a görbén P közelében egy másik, P1 pontot, melynek koordinátái x1 , y1 . Jelöljük a P és a P1 pontot összekötő egyenest t1 -gyel; ez a görbe egy szelője, amely a P ponthoz húzott érintőt közelíti meg, ha P1 közel van P-hez. Jelöljük az x-tengely pozitív iránya és a t1 által bezárt szöget α1 -gyel.Mármost ha x1 közeledik x-hez, akkor P1 a görbe mentén P felé mozog és a t1 szelő a görbe P pontjába húzott érintőjéhez mint határhelyzethez tart. Jelölje α az x-tengely pozitív iránya és a t által bezárt szöget,
499
268. ábra. A derivált mint határérték akkor, ha x1 → x,1 y1 → y,
P1 → P,
t1 → t
és
α1 → α.
Az érintő a szelő limesze, az érintő iránytangense a szelő iránytangensének a határértéke. Magát a t érintő iránytangensét nem tudjuk explicit kifejezéssel megadni, azonban a t1 szelő iránytangensét megadja a t1 iránytangense =
y1 − y f(x1 ) − f(x) = x1 − x x1 − x
képlet vagy, ha a különbségképzés műveletét megint a ∆ szimbólummal jelöljük, t1 iránytangense =
∆y ∆f(x) = . ∆x ∆x
A t1 szelő iránytangense „differenciahányados”: a függvényértékek ∆y különbsége, osztva a független változó értékeinek ∆x különbségével. Továbbá t iránytangense = t1
1
Jelölésünk itt kissé különbözik a VI. fejezetben bevezetettől, mert ott az x → x1 jelölésben a második érték volt rögzített. Vigyáznunk kell, nehogy a jeleknek ez a felcserélése megzavarjon.
500
iránytangensének határértéke = = lim
∆y f(x1 ) − f(x) = lim , x1 − x ∆x
ahol a határértéket x1 → x határátmenetre kell kiszámítani, azaz ha ∆x = x1 − x → 0. A görbe t érintőjének iránytangense a ∆y/∆x differenciahányados határértéke, ha ∆x = x1 − x tart a nullához. Az eredeti f(x) függvény az y = f(x) görbe „magasságát” adta meg az x helyen. Tekintsük most a görbe x és y = f(x) koordinátájú, változó P pontját. A görbe ezen változó P pontbeli érintőjének az iránytangense az x valamilyen új függvénye, amelyet f 0 (x)-szel jelölünk és az f(x) függvény deriváltjának nevezünk. Azt a határértékszámítási eljárást, amellyel ezt a függvényt kapjuk, f(x) differenciálásának nevezzük. A differenciálás olyan művelet, amely adott f(x) függvényhez meghatározott szabály szerint rendel hozzá egy másik f 0 (x) függvényt, éppen úgy, mint ahogyan az f(x) függvényt is valamilyen szabály definiálja, amely az x változó minden értékéhez az f(x) értéket rendeli hozzá: az y = f(x) görbe „magassága” az x pontban = f(x), az y = f(x) görbe érintőjének iránytangense az x pontban = f 0 (x). A „differenciálás” elnevezés abból a tényből ered, hogy f 0 (x) az f(x1 ) − f(x) különbség és az x1 − x különbség hányadosának ahatárértéke: f 0 (x) = lim
f(x1 ) − f(x) . x1 − x
ha x1 → x.
(1)
Másik, sok esetben hasznos jelölés f 0 (x) = D f(x), a „D” egyszerűen „deriváltjának” rövidítése; a leibnizi jelölés y = f(x) deriváltjának a: dy dx
vagy
d f(x) , dx
melyről a 4. §-ban szólunk majd. Az utóbbi jelölés azt juttatja kifejezésre, hogy a derivált ∆ f(x) a ∆y/∆x vagy differenciahányados határértéke. ∆x Ha az y = f(x) görbét növekvő x értékek irányába járjuk végig, akkor a pozitív
501
269. ábra. A derivált előjele derivált, f 0 (x) > 0, egy adott pontban a görbe emelkedését jelenti (növekvő y értékek), a negatív derivált f 0 (x) < 0, a görbe esését (csökkenő y értékek), ha pedig f 0 (x) = 0, az annyit jelent, hogy a görbe érintője vízszintes irányú az illető x pontban. Maximum vagy minimum esetében a görbe iránytangensének nullának kell lennie (269. ábra). Tehát ha az f 0 (x) = 0 egyenletet megoldjuk x-re, megkapjuk a maximumok és minimumok helyét, amint azt először Fermat fejtette ki. 3. Példák Azt lehetne hinni, hogy az (1) definíciót eredményező megfontolásoknak nem sok haszna van. Az egyik problémát helyettesítettük a másikkal: a helyett, hogy az y = f(x) görbe egy adott pontjába tartozó érintőjét keresnénk meg, ki kell számítanunk az (1) által kijelölt határértéket, ami első pillanatra éppen olyan nehéznek látszik. Azonban mihelyt elhagyjuk az általánosságok világát és speciális f(x) függvényeket tekintünk, rögtön kézzelfogható eredményeket kapunk. A legegyszerűbb ilyen speciális függvény f(x) = c, ahol c valamely állandó. Az y = f(x) = c függvény grafikus ábrázolása vízszintes vonal, amely egybeesik saját érintőjével, és nyilvánvaló, hogy f 0 (x) = 0
502
x minden értékére. Ugyanez következik az (1) definícióból is, ugyanis f(x1 ) − f(x) c−c 0 ∆y = = = = 0, ∆x x1 − x x1 − x x1 − x úgyhogy trivialitásként lim
f(x1 ) − f(x) = 0, x1 − x
ha x1 → x.
Tekintsük következőnek az y = f(x) = x függvényt, melynek grafikus ábrázolása a kezdőponton átmenő, a koordináta-rendszer első negyedét felező egyenes. Geometriailag nyilvánvaló, hogy f 0 (x) = 1 x minden értékére. Az (1) analitikus definícióból ismét azt kapjuk, hogy x1 − x f(x1 ) − f(x) = = 1, x1 − x x1 − x tehát lim
f(x1 ) − f(x) = 1, x1 − x
ha x1 → x.
A legegyszerűbb nem triviális példa y = f(x) = x2 függvény differenciálása, amely geometriailag a parabolához húzott érintők iránytangenseinek a meghatározását jelenti. Ezen a legegyszerűbb példán megtanulhatjuk, hogyan kell elvégezni a határátmenetet, ha az eredmény nem azonnal nyilvánvaló. Felírhatjuk, hogy
∆y f(x1 ) − f(x) x2 − x2 = = 1 . ∆x x1 − x x1 − x
Ha a számlálóban és a nevezőben egyszerre próbálnánk meg elvégezni a határátmenetet, az értelmetlen 0/0 kifejezést kapnánk. Azonban elkerülhetjük ezt, ha a differenciahányadost más alakba írjuk át, s még mielőtt elvégeznénk a határátmenetet, egyszerűsítünk a zavaró x1 − x tényezővel. (A differenciahányados határértékének a kiszámításánál kizárólagosan az x1 6= x értékeket vesszük figyelembe, úgy hogy ez az egyszerűsítés
503
mindig megengedett; l. 370. o.). Így a következő kifejezést kapjuk: (x1 − x)(x1 + x) x21 − x2 = = x1 + x. x1 − x x1 − x Most, az egyszerűsítés után, semmi akadálya többé az x1 → x határátmenet elvégzésének. A határértéket „behelyettesítéssel” kapjuk; ugyanis a differenciahányados új alakja, x1 + x függvény folytonos, és a folytonos függvény határértéke x1 → x határátmenetnél egyszerűen a függvény x1 = x helyen felvett értéke, a mi esetünkben x + x = 2x, úgyhogy f 0 (x) = 2x
az eredmény f(x) = x2 -re.
Hasonlóképpen igazolhatjuk, hogy f(x) = x3 esetére f 0 (x) = 3x2 . Ugyanis a ∆y f(x1 ) − f(x) x3 − x3 = = 1 ∆x x1 − x x1 − x differenciahanyados az x31 − x3 = (x1 − x)(x21 + x1 x + x2 ) képlet szerint átalakítható, a ∆x = x1 − x nevezővel egyszerűsíteni lehet, és így a ∆y = x21 + x1 x + x2 ∆x folytonos kifejezést kapjuk. Ha most x1 tart x-hez, ez a kifejezés egyszerűen x2 + x2 + x2 kifejezéshez tart, és így határértékként f 0 (x) = 3x2 adódik. Általánosságban, f(x) = xn esetére, ahol n tetszőleges pozitív szám, f 0 (x) = nxn−1 kifejezést kapjuk deriváltként. Feladat: Igazoljuk ezt az eredményt. (Alkalmazzuk az xn1 − xn = (x1 − x)(xn−1 + x1n−2 x + 1 2 n−2 + xn−1 ) algebrai formulát.) xn−3 1 x + . . . + x1 x
A derivált explicit meghatározását lehetővé tevő másik egyszerű műfogás példájaként
504
tekintsük az f(x) =
1 x
függvény esetét. Itt y1 − y ∆y = = ∆x x1 − x
1 1 − x1 x
·
1 x − x1 1 = · . x1 − x x1 x x1 − x
Ismét egyszerűsíthetünk, és azt találjuk, hogy 1 ∆y =− , ∆x x1 x amely az x1 = x helyen folytonos; tehát a határértéke f 0 (x) = −
1 . x2
Természetesen, sem a derivált, sem maga a függvény nincs értelmezve az x = 0 helyen. 1 2 1 Feladatok: Igazoljuk hasonló módon, hogy f(x) = 2 deriváltja f 0 (x) = − 3 , f(x) = n x x x n deriváltja f 0 (x) = − n+1 ; f(x) = (1 + x)n deriváltja f 0 (x) = n(1 + x)n−1 . x
Végezzük most el y = f(x) =
√ x
differenciálását. A differenciahányadosra y1 − y = x1 − x
√
√ x1 − x x1 − x
√ √ √ √ kifejezést kapjuk. Itt az x1 − x = ( x1 − x)( x1 + x) képlet szerint egyszerűsíthetünk egy tényezővel, s az y1 − y 1 √ =√ x1 − x x1 + x folytonos kifejezést kapjuk. Ennek a határértéke 1 f 0 (x) = √ . 2 x √ 1 1 Feladatok : Igazoljuk, hogy f(x) = √ deriváltja f 0 (x) = − √ 3 ; f(x) = 3 x deriváltja x 2( x)
505
√ √ 1 −x 1 f 0 (x) = √ ; f(x) = 1 − x2 deriváltja f 0 (x) = √ ; f(x) = n x deriváltja f 0 (x) = √ . 3 2 n 1 − x2 3 x n xn−1
4. A trigonometrikus függvények deriváltjai Lássuk most a trigonometrikus függvények differenciálásának roppant fontos kérdését. Ebben a pontban a szögeket kizárólag ívmértékben fejezzük ki. Vezessük be y = f(x) = sin x függvény differenciálására az x1 − x = h jelölést, úgyhogy x1 = x + h és f(x1 ) = sin x1 = sin(x + h). A trigonometriából ismert, sin(A + B)-re érvényes képlet szerint f(x1 ) = sin(x + h) = sin x cos h + cos x sin h. Tehát f(x1 ) − f(x) sin(x + h) − sin x = = cos x x1 − x h
sin h h
+ sin x
cos h − 1 h
.
(2)
Ha most x1 tart az x-hez, akkor h tart a 0-hoz, sin h tart a 0-hoz és cos h tart az 1-hez. Továbbá, a 372. oldalon kapott eredmény szerint lim és lim
sin h =1 h
cos h − 1 = 0. h
Tehát (2) jobb oldala cos x-hez tart, minek következtében azt az eredményt kapjuk, hogy f(x) = sin x függvény deriváltja f 0 (x) = cos x, vagy röviden D sin x = cos x. Feladat: Igazoljuk, hogy D cos x = − sin x.
506
f(x) = tg x függvény differenciálására írjunk tg x =
sin x -et, így azt kapjuk, hogy cos x
f(x + h) − f(x) sin(x + h) sin x 1 = − · = h cos(x + h) cos x h =
sin(x + h) cos x − cos(x + h) sin x 1 · = h cos(x + h) cos x
=
sin h 1 . h cos(x + h) cos x
(Az utolsó egyenlőség a sin(A − B) = sin A cos B − cos A sin B képletből következik, ha sin h A = x + h és B = x). Ha most h tart a nullához, tart az 1-hez, cos(x + h) tart h cos x-hez, és így azt kapjuk, hogy f(x) = tg x függvény deriváltja f 0 (x) =
1 cos2 x
vagy D tg x = Feladat: Igazoljuk, hogy D cotg x = −
1 . cos2 x
1 . sin2 x
*5. Differenciálás és folytonosság A függvény differenciálhatóságából következik folytonossága. Ugyanis, ha létezik ∆y/∆x határértéke, ha ∆x tart a nullához, akkor könnyű belátni, hogy f(x) függvény ∆y változásának tetszőlegesen kicsinynek kell lennie, ha a ∆x különbség tart a nullához. Tehát valahányszor egy függvény differenciálható, folytonossága automatikusan biztosított; azért ebben a fejezetben előforduló differenciálható függvények esetében nem említjük explicite, s nem bizonyítjuk a folytonosságot, hacsak erre valami különleges okunk nincsen. 6. Derivált és sebesség. Második derivált és gyorsulás Az eddigiekben a derivált elemzését összekapcsoltuk a függvény grafikus ábrázolásának geometriai fogalmával. Azonban ennek a fogalomnak a jelentősége távolról sem korláto-
507
zódik csupán a görbét érintő egyenesek iránytangensváltozásának a meghatározására. A természettudományok szempontjából még sokkal fontosabb valamely t idővel változó f(t) mennyiség változási sebességének a kiszámítasa. Éppen ez volt az a szempont, amelyik felől Newton közeledett a differenciálszámításhoz. Newton mindenekelőtt a sebesség jelenségét akarta analizálni, ahol az idő és a mozgó részecske pillanatnyi helyzete tekintendő változó elemnek, vagy, amint Newton kifejezte, „fluens mennyiség”-nek. Ha a részecske egyenes mentén mozog, amit az x-tengelynek tekintünk, akkor mozgását teljesen jellemeztük, ha mindent időpillanatban megadjuk valamilyen x = f(t) függvénnyel a részecske x helyzetét. Az x-tengely mentében állandó b sebességgel végbemenő „egyenletes mozgást” az x = a + bt lineáris függvény definiálja, ahol a a részecske koordinátája t = 0 időben. A síkban a részecske mozgását két függvény írja le, x = f(t),
y = g(t),
amelyek a két koordinátát mint az idő függvényeit jellemzik. Speciálisan az egyenletes mozgás két lineáris függvénynek felel meg, x = a + bt,
y = c + dt,
ahol b és d az állandó sebesség két „komponense”, a és c a részecske koordinátái a t = 0 időpillanatban; a részecske pályája egyenes, melynek egyenlete (x − a)d − (y − c)b = 0, amit úgy kapunk, hogy a fenti két összefüggésből kiküszöböljük a t időt. Ha a részecske vertikális x, y síkban mozog, pusztán a nehézségi erő hatása alatt, akkor, amint az elemi fizikából tudjuk, a mozgást x = a + bt,
1 y = c + dt − gt2 2
egyenletek írják le, ahol a, b, c, d a részecske kezdeti állapotától függő állandók, g pedig a nehézségi gyorsulás, amelynek az értéke megközelítőleg 9, 81, ha az időt másodpercben, a távolságot méterben mérjük. A részecske pályája, amit úgy kapunk, hogy a fenti két egyenletből kiküszöböljük t-t, jelen esetben parabola, ha b 6= 0; egyébként a pálya a vertikális tengely egy része.
508
Ha a részecske adott görbe mentén kényszerül mozogni a síkban (mint vonat a sínen); akkor mozgását leírhatjuk úgy, hogy az s ívhosszúságot mint a t idő függvényét adjuk meg, s = f(t). Az ívhosszúságot valamely rögzített P0 kezdőponttól mérjük a görbe mentén, a részecske t időben elfoglalt P helyzetéig. Például az x2 + y2 = 1 egységsugarú körön s = ct függvény a kör kerületén c sebességű egyenletes forgást ír le. Feladatok: *Rajzoljuk meg a következő függvények által leírt síkmozgások pályáját: 1) x = sin t, y = cos t. 2) x = sin 2t, y = sin 3t. 3) x = sin 2t, y = 2 sin 3t. 4) Tegyük fel, hogy a fent leírt parabolikus mozgásban a részecske t = 0 időben a kezdőpontban van, és hogy b > 0, d > 0. Keressük meg a pálya legmagasabb pontjának koordinátáit. Keressük meg a pálya x-tengellyel való második metszéspontjának t idejét és az x értékét.
Newton első célja az volt, hogy a nem egyenletes mozgás sebességét meghatározza. Egyszerűség kedvéért tekintsük egy egyenes mentén mozgó részecske x = f(t) függvény által megadott mozgását. Ha a mozgás állandó sebességgel történő egyenletes mozgás lenne, akkor a mozgás sebességét úgy kaphatnánk meg, hogy vennénk két értéket az időre, t és t1 -et, azután a részecske helyzetének ezeknek megfelelő x = f(t) és x1 = f(t1 ) értékeit, s képeznénk a v = sebesség =
x1 − x f(t1 ) − f(t) távolság = = idő t1 − t t1 − t
hányadost. Így pl., ha t-t órákban mérjük és x-et kilométerekben, akkor t1 −t = 1-re x1 −x az 1 óra alatt megtett kilométerek számát adja meg; s v a sebességet, óránként megtett kilométerekben kifejezve. Az az állítás, hogy a mozgás sebessége állandó, egyszerűen úgy értendő, hogy az f(t1 ) − f(t) t1 − t
(3)
differenciahányados azonos t és t1 minden értékére. De ha a mozgás nem egyenletes, mint pl. a szabadon eső test esetében, amelynek sebessége az esés folyamán állandóan nő, akkor a (3) hányados nem adja meg a t időpillanatbeli sebességét, csupán a t-től t1 -ig terjedő időintervallumra vett átlagos sebességet adja. Ahhoz, hogy a t időpontbeli pillanatnyi sebességet megkapjuk, az átlagsebesség határértékét kell vennünk, ha t1 tart
509
t-hez. Így Newton szerint bevezetjük a következő definicíót: sebesség a t időpontban = lim
f(t1 ) − f(t) = f 0 (t). t1 − t
(4)
Más szóval, a sebesség a távolság koordináta idő szerinti deriváltja, vagy a távolság idő szerinti „pillanatnyi változási sebessége”. (Megkülönböztetésül a (3) által adott átlagos változási sebességtől, a sebesség változásának átlagától.) A sebesség változásának a sebességét, a sebesség változási sebességét, gyorsulásnak nevezik. Ez nem egyéb, mint egy derivált – a sebesség – deriváltja, amit általában f 00 (t)-vel szokás jelölni, s f(t) második deriváltjának nevezik. Galilei figyelte meg, hogy azt az x vertikális távolságot, melyet a szabadon eső test t idő alatt tesz meg 1 x = f(t) = gt2 2
(5)
formula írja le, ahol g a nehézségi állandó. Az (5)-öt differenciálva következik, hogy a test v sebességét t időpontban v = f 0 (t) = gt
(6)
adja meg, s az α gyorsulást, α = f 00 (t) = g, amely állandó. Tegyük fel, hogy a test sebességét elengedése után 2 másodperccel kell meghatározni. Az átlagos sebesség t = 2-től t = 2, 1-ig terjedő időintervallumban 1 g(2, 1)2 2
− 12 g(2)2 4, 905(0, 410) = = 20, 11 (méter/secundum). 2, 1 − 2 0, 1
t = 2 értéket helyettesítve be (6)-ba, látjuk, hogy a pillanatnyi sebesség a második másodperc végén v = 19, 62. Feladat: Mi az átlagos sebessége a testnek t = 2 és t = 2, 01 időpont által határolt időintervallumban? Mi t = 2 és t = 2, 001 által határoltban?
Síkbeli mozgás esetében két x = f(t) és y = g(t) függvény f 0 (t) és g 0 (t) deriváltja definiálja a sebesség két komponensét. Rögzített görbe mentén történő mozgásra a
510
sebességet s = f(t) függvény deriváltja definiálja, ahol s az ívhosszúság. 7. A második derivált geometriai jelentése
270. ábra A második deriváltnak az analízisben és a geometriában is megvan a jelentősége, hiszen f 00 (x) azt adja meg, milyen sebesen változik az y = f(x) görbe f 0 (x) iránytangense, emelkedése, s így utal a görbe görbülési módjára. Ha f 00 (x) egy intervallumban pozitív, akkor ott f 0 (x) változásának a sebessége pozitív. Ha egy függvény változásának a sebessége pozitív, az annyit jelent, hogy a függvény értékei x növekedtével növekszenek. Tehát f 00 (x) > 0 azt jelenti, hogy az f 0 (x) iránytangens, a görbe emelkedési iránya x növekedtével növekszik, úgyhogy ott, ahol a görbe iránytangense, emelkedési iránya pozitív, meredekebbé válik a görbe, ahol pedig a görbe iránytangense, emelkedési iránya negatív, ott a görbe kevésbé lesz meredek. Az ilyen görbére azt mondjuk, hogy felfelé konkáv (270. ábra). Hasonlóképpen, ha f 00 (x) < 0, az y = f(x) görbe lefelé konkáv (271. ábra). Az y = f(x) = x2 parabola mindenütt felfelé konkáv, mivel f 00 (x) = 2 mindig pozitív. Az y = f(x) = x3 görbe x > 0 értékekre felfelé konkáv, x < 0 értékekre pedig lefelé konkáv (153. ábra), mivel f 00 (x) = 6x, amint azt az olvasó könnyen igazolhatja. Mellékesen, ha x = 0, f 0 (x) = 3x2 = 0 (de nem minimum vagy maximum!); és f 00 (x) = 0 az x = 0 értékre. Ezt a pontot inflexiós pont nak nevezik. Ilyen pontban az érintő, ebben az esetben az x-tengely, keresztezi a görbét. Ha s a görbe mentén mért ívhosszúságot jelöli, α a görbe érintőjének hajlásszögét,
511
271. ábra akkor α = h(s) az s valamilyen függvénye lesz. Amint a görbe mentén haladunk, α = h(s) változik. A változás sebességét, h 0 (s)-et a görbe görbületének nevezik abban a pontban, ahol az ív hosszúsága s. Bizonyítás nélkül említsük meg, hogy a κ görbület kifejezhető a görbét definiáló y = f(x) függvény első és második deriváltjával: κ=
f 00 (x) . [1 + (f 0 (x)2 ]3/2
8. Maximum és minimum Adott f(x) függvény maximumait és minimumait úgy kapjuk meg, hogy először képezzük f 0 (x)-et, azután megkeressük x azon értékeit, amelyeknél ez a derivált, eltűnik, végül megvizsgáljuk, hogy ezek közül az értékek közül melyik szolgáltat maximumot vagy minimumot. Ezt az utóbbi kérdést a második derivált, f 00 (x) viselkedéséből lehet eldönteni. A második derivált előjeléből láthatjuk, hogy a görbe konvex vagy konkáv alakú-e, és ha a második derivált eltűnik, ez a tény, rendszerint inflexiós pontra utal, amihez nem tartozhat szélső érték. f 0 (x) és f 00 (x) előjelének a megfigyelésével nemcsak a görbe szélső pontjait határozhatjuk meg, hanem megtalálhatjuk a függvényt ábrázoló görbe alakját is. A módszer megadja azokat az x értékeket, amelyeknél szélső értékek lépnek fel; az y = f(x) megfelelő értékeit pedig úgy kapjuk meg, hogy az így nyert x értékeket behelyettesítjük f(x)-be. Példaként tekintsük az f(x) = 2x3 − 9x2 + 12x + 1
512
polinomot, és képezzük az f 0 (x) = 6x2 − 18x + 12,
f 00 (x) = 12x − 18
deriváltakat. Az f 0 (x) = 0 másodfokú egyenlet gyökei x1 = 1, x2 = 2, és ezeken a helyeken f 00 (x1 ) = −6 < 0, f 00 (x2 ) = 6 > 0. Tehát f(x)-nek van egy maximuma, f(x1 ) = 6 és egy minimuma, f(x2 ) = 5. Feladatok: 1) Rajzoljuk meg a fentebb tárgyalt függvény görbéjét. 2) Elemezzük az f(x) = (x2 − 1)(x2 − 4) függvény viselkedését és rajzoljuk meg görbéjét. 3) Keressük meg x + 1/x, x + a2 /x, px + q/x minimumát, ha p és q pozitivok. Van ezeknek a függvényeknek maximuma? 4) Keressük meg sin x és sin(x2 ) maximumát és minimumát.
3. § A differenciálás technikája Eddig arra törekedtünk, hogy sokféle speciális függvényt differenciáljunk, a differenciahányadost megfelelő átalakítással előkészítve a határátmenetre. Döntő lépés volt, amikor Leibniz, Newton és követőik munkája nyomán ezeket az individuális műfogásokat sokkal célravezetőbb általános módszerekkel helyettesítették. Ezekkel a módszerekkel csaknem automatikusan lehet differenciálni minden, a matematikában közönségesen előforduló függvényt, feltéve, hogy az ember megtanul néhány egyszerű szabályt, és képes felismerni alkalmazhatóságukat. A differenciálás így számolási „algoritmus” jellegét öltötte, az elméletnek éppen ezt a jellegét fejezi ki a „kalkulus” (számolás) elnevezés. Nem mehetünk messze ennek a technikának részletezésében. Csupán néhány egyszerű szabályt említünk. (a) Összeg differenciálása. Ha a és b állandók, és a k(x) függvényt k(x) = af(x) + bg(x) adja meg, akkor, amint azt az olvasó könnyen igazolhatja, k 0 (x) = af 0 (x) + bg 0 (x).
513
Hasonló szabály érvényes akárhány tag esetére is. (b) Szorzat differenciálása. p(x) = f(x)g(x) szorzat deriváltja p 0 (x) = f(x)g 0 (x) + g(x)f 0 (x). Könnyen igazolható ez a következő műfogással: ugyanazt a tagot egymásután plusz és mínusz előjellel felírva, p(x + h) − p(x) = f(x + h)g(x + h) − f(x)g(x) = = f(x + h)g(x + h) − f(x + h)g(x) + f(x + h)g(x) − f(x)g(x), az első két és az utolsó két tagot kombinálva p(x + h) − p(x) g(x + h) − g(x) f(x + h) − f(x) = f(x + h) + g(x) . h h h Közeledjék most h nullához; mivel f(x + h) tart f(x)-hez, a bizonyítandó állítás közvetlenül következik. Feladat: Igazoljuk, hogy p(x) = xn függvény deriváltja p 0 (x) = nxn−1 . (Útmutatás: írjuk xn -et xn = x · xn−1 alakba, és alkalmazzunk matematikai indukciót.)
(a) és (b) szabály használatával bármely f(x) = a0 + a1 x + . . . + an xn polinomot differenciálhatunk, a derivált f 0 (x) = a1 + 2a2 x + 3a3 x2 + . . . + nan xn−1 . Alkalmazásként bizonyítsuk be a binomiális tételt (vö. 18. o.). Ez a tétel (1 + x)n -t adja meg polinom alakban: f(x) = (1 + x)n = 1 + a1 x + a2 x2 + a3 x3 + . . . + an xn ,
514
(1)
és azt állítja, hogy az ak együtthatót ak =
n(n − 1) . . . (n − k + 1) k!
(2)
képlet fejezi ki. Természetesen an = 1. Láttuk (505. o., feladat), hogy az (1) bal oldalát differenciálva, n(1 + x)n−1 -et kapunk. Így, a megelőző bekezdés szerint, n(1 + x)n−1 = a1 + 2a2 x + 3a3 x2 + . . . + nan xn−1 .
(3)
Ebben a képletben x = 0-t írva azt kapjuk, hogy n = a1 , s ez k = 1-re a (2)-nek felel meg. Differenciáljuk most újból (3)-at, n(n − 1)(1 + x)n−2 = 2a2 + 3 · 2a3 x + . . . + n(n − 1)an xn−2 kifejezést kapva. Behelyettesítve ide x = 0-t, azt találjuk, hogy n(n − 1) = 2a2 megegyezésben (2)-vel k = 2-re. Feladat: Igazoljuk (2)-t k = 3, 4, és matematikai indukcióval általános k esetére.
(c) Hányados differenciálása. Ha q(x) =
f(x) , g(x)
akkor q 0 (x) =
g(x)f 0 (x) − f(x)g 0 (x) , (g(x))2
A bizonyítását feladatnak adjuk fel. (Természetesen, fel kell tenni, hogy g(x) 6= 0.) Feladat: Vezessük le ezzel a szabállyal tg x és cotg x 507. oldalon közölt deriváltját sin x és cos x deriváltjából. Bizonyítsuk be, hogy sec x = 1/ cos x deriváltja sin x/ cos2 x és cosec x = 1/ sin x deriváltja − cos x/ sin2 x.
Mostmár bármely függvényt tudunk differenciálni, ami felírható két polinom hánya-
515
dosaként. Például, f(x) =
1−x 1+x
deriváltja f 0 (x) =
−(1 + x) − (1 − x) 2 =− . 2 (1 + x) (1 + x)2
Feladat: Differenciáljuk f(x) =
1 = x−m xm
függvényt, ahol m pozitív egész szám. Az eredmény f 0 (x) = −mx−m−1 .
d) Inverz függvény differenciálása. Ha y = f(x) inverz függvények (pl. y = x2 és x = g 0 (y) =
1 f 0 (x)
és
x = g(y)
√ y), akkor deriváltjaik egymás reciprokjai: vagy
D g(y) · D f(x) = 1.
Ezt a tényt könnyű igazolni, oly módon, hogy a reciprok differenciahányadosokra, ∆x ∆y -ra és -re térünk vissza. De látható az inverz függvény 339. oldalon közölt ∆y ∆x geometriai értelmezéséből is, ha az érintő iránytangensét az x-tengely helyett az ytengelyre vonatkoztatjuk. Példaként differenciálhatjuk az x = ym függvény y = f(x) =
√ 1 m x = xm
inverz függvényét. (Lásd a közvetlenebb eljárást is m =
516
1 esetére a 505. oldalon.) Mivel 2
x = ym függvény deriváltja mym−1 kifejezés, felírhatjuk, hogy f 0 (x) =
1 1 y 1 = = yy−m , m−1 m my my m
és innen, y = x1/m és y−m = x−1 helyettesítés után, f 0 (x) = 1
D (x m ) =
1 1 −1 x m , vagy m
1 1 −1 xm . m
Differenciáljuk további pédaként a trigonometrikus függvények inverzeit (l. 339. o.); pl. y = arc tg x, ami ugyanazt jelenti, mint x = tg y. Itt az y változó, ívmértékben meg1 1 adva, a − π < y < π intervallumra korlátozott, hogy az inverz függvény egyértelmű 2 2 voltát biztosítsuk. sin2 y + cos2 y = 1 + tg2 y = 1 + x2 , Mivel (l. 507. o.) D tg y = 1/ cos2 y és 1/ cos2 y = 2 cos y azt találjuk, hogy D arc tg x =
1 . 1 + x2
Ugyanígy levezetheti az olvasó a következő képleteket: D arc cot x = −
1 , 1 + x2
D arc sin x = √
1 , 1 − x2
1 . D arc cos x = − √ 1 − x2 Végül, igen fontos szabályként az (e) Összetett függvény differenciálása. Az ilyen függvények két vagy több egyszerű √ függvényből vannak összetéve (l. 340. o.). Például, z = sin( x) z = sin y-ból és √ √ √ √ y = x-ből van összetéve; a z = x + 5 x függvény z = y + y5 és y = x függvényből; 1 z = sin(x2 ) függvény z = sin y-ból és y = x2 -ből; z = sin összetett függvénye z = sin y x 1 és y = egyszerű függvényeknek. x
517
272. ábra
273. ábra
Ha adva van két függvény, z = g(y)
és
y = f(x),
és ha az utóbbi függvényt behelyettesítjük az elsőbe, összetett függvényt kapunk: z = k(z) = g[f(x)]. Azt állítjuk, hogy k 0 (x) = g 0 (y)f 0 (x).
(4)
Ugyanis, ha felírjuk, hogy z1 − z y1 − y k(x1 ) − k(x) = · , x1 − x y1 − y x1 − x ahol y1 = f(x1 ) és z1 = g(y1 ) = k(x1 ), s azután x1 -et közelítjük x-hez, a bal oldal akkor k 0 (x)-hez tart, a jobb oldalon az első tényező g 0 (y)-hoz, a második f 0 (x)-hez, s így bebizonyítottuk a (4)-et. Ebben a bizonyításban szükségünk volt az y1 − y 6= 0 feltételre. Ugyanis osztottunk ∆y = y1 −y-nal, s nem használhatunk olyan x1 értékeket, amelyekre y1 −y = 0. Azonban a (4) formula érvényes marad akkor is, ha ∆y = 0 egy x körüli intervallumban; y akkor állandó, f 0 (x) = 0, k(x) = g(y) konstans x-re vonatkoztatva (mivel y nem változik x-szel), tehát k 0 (x) = 0, amint azt a (4) állítja ebben az esetben.
518
Igazolja az olvasó a következő példákat: k(x) = sin k(x) =
√
√
k 0 (x) = (cos
x,
x+
√ 5 x,
√
1 x) √ , 2 x
1 k 0 (x) = (1 + 5x2 ) √ , 2 x
k(x) = sin(x2 ),
k 0 (x) = cos(x2 ) · 2x, 1 1 0 k (x) = − cos , x x2
1 k(x) = sin , x p k(x) = 1 − x2 ,
−x −1 · 2x = √ . k 0 (x) = √ 2 1 − x2 1 − x2
Feladat: Mutassuk meg a 505. és 516. oldalon kapott eredmények alkalmazásával, hogy f(x) =
√
m
s
xs = x m
függvény deriváltja f 0 (x) =
s s −1 xm m
Jegyezzük meg, hogy összes eddigi x hatványaira vonatkozó formuláink összefoglalhatók egy egyenletbe: Ha r tetszőleges pozitív vagy negatív racionális szám, akkor f(x) = xr függvény deriváltja f 0 (x) = rxr−1 .
Feladatok: 1) Hajtsuk végre a 505. oldalon feladott differenciálásokat ennek a pontnak a szabályaival. 2) Differenciáljuk a következő függvényeket: x sin x,
1 ·sin nx; (x3 −3x2 −x+1)3 , 1+sin2 x, 1 + x2
519
1+x 1+x √ 1 1 4 , arc sin(cos nx), tg . , arc tg , 1 − x2 , 2 x 1−x 1−x 1 + x2 3) Keressük meg a fenti függvények közül néhánynak a második deriváltját, ezenkívül a 1−x következő függvényekét: , arc tg x, sin2 x, tg x. q1 + x q 4) Differenciáljuk c1 (x − x1 )2 + y21 + c2 (x − x2 )2 + y22 függvényt,* és bizonyítsuk be a x2 sin
fénysugár minimum tulajdonságát fényvisszaverődésben és fénytörésben, amint azt a VII. fejezetben állítottuk, a 400. és 458. oldalon. A fényvisszaverődés vagy fénytörés az x-tengelyen történjék, a pálya végpontjának koordinátái legyenek x1 , y1 és x2 , y2 . (Megjegyzés: a függvénynek csak egy olyan pontja van, amelyben a derivált eltűnik; azért, mivel van egy minimum, de maximum szemmel láthatóan nincs, a második derivált vizsgálatára nincsen szükség.) További maximum- és minimumproblémák : 5) Keressük meg az alább felsorolt függvények szélső értékeit, rajzoljuk meg görbéjüket, határozzuk meg növekedési, csökkenési, konvexitási és konkávitási intervallumaikat: x3 − 6x + 2,
x/(1 + x2 ),
x2 /(1 + x4 ),
cos2 x.
6) Keressük meg az x3 + 3ax + 1 függvény maximumát és minimumát, és vizsgáljuk meg, hogy hogyan függnek a értékétől. 7) A 2y2 − x2 = 2 hiperbola melyik pontja van legközelebb az x = 0, y = 3 ponthoz? 8) Adott területű derékszögű négyszögek közül keressük meg azt, amelyiknek legrövidebb az átlója. 9) Írjunk be legnagyobb területű derékszögű négyszöget az x2 /a2 + y2 /b2 = 1 ellipszisbe. 10) Adott térfogatú körhengerek közül keressük meg a legnagyobb felszínűt.
4. § Leibniz jelölése és a „végtelen kicsiny” Newton és Leibniz tudták, hogyan kell az integrált és a deriváltat határértékként meghatározni. De a kalkulus tulajdonképpeni alapelveit sokáig elhomályosította az az ellenkezés, amely nem akarta a határértékszámítást az új módszer valódi, egyedüli forrásának elismerni. Sem Newton, sem Leibniz nem tudott eddig a világos álláspontig eljutni, noha az nekünk, miután már tökéletesen tisztázódott a határértékfogalom, olyan egyszerűnek látszik. Newton és Leibniz példája több, mint egy évszázadig uralkodott a matematikai gondolkodásban. Ez alatt az idő alatt olyan szavakkal ködösítették el a tárgykört, mint „végtelen kicsiny mennyiségek”, „differenciálok”, „végső arányok” stb.
520
Nagyon nehezen váltak meg végül is ezektől a fogalmaktól. A hozzájuk való ragaszkodást a kor szellemi klímája, s talán maga az emberi elme természete is magyarázza. Mert hiszen így okoskodhatnánk: „Rendben van, integrált és differenciált határértékekként lehet, határértékként kell számítani. De végre is, mik ezek az objektumok önmagukban, tekintet nélkül arra a speciális módra, ahogyan leírjuk azokat valamilyen határátmenetet kiszámító eljárással? Nyilvánvalónak látszik, hogy az olyan szemléletes fogalmaknak, mint a terület, meg a görbe érintőjének az iránytangense abszolút jelentésük van önmagukban, s nincsenek ráutalva olyan segédfogalmakra, mint beírt sokszögek, vagy szelők, s ezek limesei.” Valóban, pszichológiai szempontból természetes az a törekvés, hogy területre és érintő iránytangensére mint „magánvaló dolgok”-ra, megfelelő definíciót keressünk. De annak az érett magatartásnak, amelyik már oly sokszor nyitott utat a történelem során a haladás előtt, ezzel ellentétben erről a keresésről való lemondás felel meg, az, hogy terület és érintőiránytangens tudományos szempontból egyedül érvényes definiálását a határérték kiszámításában találjuk meg. A XVII. században azonban még nem volt olyan szellemi hagyomány, amely efféle filozófiai radikalizmust lehetővé tett volna. Leibniz kísérlete a derivált „megmagyarázására” tökéletesen korrekt módon indult, az y = f(x) függvény ∆y f(x1 ) − f(x) = ∆x x1 − x differenciahányadosával. A határértékre, a deriváltra, amelyet mi (Lagrange egy későbbi jelölését követve) f 0 (x)-nek nevezünk, Leibniz először a dy dx jelölést vezette be, a differencia ∆ szimbólumát a d „differenciálszimbólum”-mal cserélve fel. Feltéve, hogy ezen a jelölésen semmi egyebet nem értünk, mint azt, hogy végre kell hajtani a ∆x → 0, és következésképpen a ∆y → 0 határátmenetet, nyugodtan használhatjuk, semmi nehézség vagy misztifikáció nincs benne. Mielőtt még áttérnénk a határra, egyszerűsíteni kell a ∆y/∆x hányados ∆x nevezőjével, vagy úgy kell átalakítani ezt a hányadost, hogy a határátmenet simán elvégezhető legyen. Mindig ez a döntő mozzanat a differenciálás tényleges keresztülvitelében. Ha ilyen megelőző redukció nélkül próbálnánk
521
meg áttérni a határértékre, akkor az értelmetlen ∆y/∆x = 0/0 összefüggést kapnánk, amivel semmit sem tudunk kezdeni. Csak akkor lép a dologba misztifikáció és zavar, ha Leibniz és számos követője nyomdokain haladva, ilyesféleképpen gondolkoznánk: „∆x nem közelít nullához. Nem, ∆x »utolsó értéke« nem nulla, hanem egy »végtelen kicsiny mennyiség«, »differenciál«, amit dx-nek nevezünk; és ugyanígy van ∆y-nak is egy »végső« végtelen kicsiny értéke, dy. Ennek a két végtelen kicsiny differenciálnak a hányadosa megint közönséges szám, f 0 (x) = dy/dx.” Ennek megfelelően Leibniz a deriváltat „differenciálhányados”-nak nevezte. Az efféle végtelen kicsiny mennyiségeket valamiféle újfajta számoknak tekintették, nem nullának, de a valós számrendszer bármely pozitív számjánál kisebbnek. Azt hitték, hogy ezt a fogalmat csak a helyes „matematikai érzék”-kel rendelkezők érthetik meg, s az infinitezimális számítás azért olyan nehéz, mert ez az érzék nem mindenkiben van meg, vagy nem mindenki tudja azt kifejleszteni magában. Ugyanígy az integrált végtelen sok f(x) dx „végtelen kicsiny mennyiség” összegének tekintették. Ez az összeg, gondolták, ez az integrál vagy terület, és értékének kiszámítását közönséges f(xj ) ∆x számok összegének a határértékeként csupán másodlagosnak tekintették. Ma egész egyszerűen nem keresünk többé „közvetlen” magyarázatot, és az integrált mint véges összeg határértékét definiáljuk. Így a nehézségek eltűnnek, s mindent, ami az infinitezimális számításban fontos, józan alapokra helyezünk.
R dy jelölése f 0 (x)-re és f(x) dx jelölése az integdx rálra megmaradt, s roppant hasznosnak bizonyult. A jelölés megtartása valóban mit sem A későbbi fejlődés ellenére Leibniz
árt, feltéve, hogy a d szimbólumot pusztán a határátmenet szimbólumának tekintjük. Leibniz jelölésének az az előnye, hogy hányadosok és összegek határértékét bizonyos értelemben úgy lehet kezelni, „mintha” tényleges hányadosok vagy összegek lennének. Ennek a szimbolizmusnak a szuggesztív ereje mindig is arra csábította az embereket, hogy ezeknek a szimbólumoknak teljesen nem matematikai jelentést tulajdonítsanak. Ha ennek a kísértésnek ellenállunk, akkor a leibnizi jelölés legalábbis kitűnő rövidítés a határértékszámítás körülményes explicit jelölési módja helyett; valóban, szinte nélkülözhetetlen az elmélet haladottabb részeiben. Láttuk pl. a 516. oldalon, hogy y = f(x) függvény x = g(y) inverz függvényének a
522
differenciálási szabálya g 0 (y)f 0 (x) = 1 volt. Leibniz jelölésében ez egyszerűen dx dy · =1 dy dx „mintha” a „differenciálok”-ból álló kifejezésben ugyanúgy lehetne egyszerűsíteni, mint valami közönséges törtben. Hasonlóképpen, z = k(x) összetett függvény differenciálására a 517. oldalon közölt (e) szabály, ahol z = g(y),
y = f(x)
Leibniz jelölésében dz dy dz = · . dx dy dx További előnye Leibniz jelölésének, hogy magukat az x, y, z mennyiségeket emeli ki, nem pedig explicit függvényösszefüggésüket. A függvényösszefüggés eljárást fejez ki, műveletet, amely egy y mennyiséget hoz létre valamilyen más x mennyiségből, így pl. az y = f(x) = x2 függvény olyan y mennyiséget hoz létre, amely az x mennyiség négyzetével egyenlő. A matematikus figyelmének a művelet (a négyzetre emelés) a tárgya. Azonban a fizikusokat és mérnököket többnyire elsősorban maguk a mennyiségek érdeklik. Így tehát Leibniz jelölése, éppen az által, hogy a mennyiségeket emeli ki, különösen vonzó az alkalmazott matematikával foglalkozók számára. Még van egy hozzáfűznivalónk. Amíg a „differenciálok” mint végtelen kicsiny mennyiségek ma már végképpen hitelüket vesztették és kiküszöbölték őket, ugyanaz a szó, a „differenciál”, újból becsúszott a hátsó ajtón keresztül – most azonban már teljesen törvényes és hasznos fogalom jelölésére. Ma egyszerűen egy ∆x különbséget jelent olyan kifejezésekben, ahol ∆x a többi előforduló mennyiséghez képest kicsiny. Nem tárgyalhatjuk itt ennek a fogalomnak a közelítő számításokban való hasznosságát. Ugyancsak nem szólhatunk más, „differenciál”-nak elnevezett törvényes matematikai fogalmakról sem, melyek közül néhány meglehetősen hasznos az infinitezimális számításban s geometriai alkalmazásaiban.
523
5. § Az integrál- és differenciálszámítás alaptétele 1. Az alaptétel Az integrálás fogalma, s valamennyire a differenciálásé, meglehetősen fejlett volt már Newton és Leibniz munkássága előtt is. Ahhoz azonban, hogy az új matematikai analízis hatalmas fejlődése elkezdődhessék, szükség volt még egy további egyszerű felfedezésre. A differenciálásban és az integrálásban szereplő két határértékszámításnak látszólag semmi köze egymáshoz, valójában azonban bensőségesen összefüggnek. Ugyanúgy egymás inverz műveletei, akárcsak az összeadás és kivonás, vagy a szorzás és osztás. Nincsen külön differenciálszámítás és külön integrálszámítás, a kettő egyetlen számítás, az infinitezimális számítás. Leibniz és Newton nagy érdeme éppen az, hogy először ismerték fel és először tudták teljes mértékben használni az infinitezimális számításnak ezt az alaptételét. Felfedezésük természetesen a tudományos fejlődés irányába esett, érthető tehát, hogy több tudósnak kellett egymástól függetlenül, és csaknem egyszerre, a helyzet tiszta megértéséig eljutnia.
274. ábra. Az integrál mint felső határának függvénye Az alaptétel megfogalmazása céljából tekintsük egy y = f(x) függvény rögzített a alsó határtól változó x felső határig terjedő integrálját. Az integrálás felső határául választott x és az f(x) jelölésben szereplő x összezavarásának az elkerülése érdekében írjuk ezt az integrált Zx F(x) = f(u) du a
524
(1)
alakba (l. 494. o.), kifejezésre juttatván ezáltal, hogy az integrált mint x felső határának F(x) függvényét kívánjuk vizsgálni (274. ábra). Ez az F(x) függvény az y = f(u) görbe alatti terület u = a ponttól u = x pontig terjedő része. Szokás a változó felső határú F(x) integrált „határozatlan” integrálnak is nevezni. Mostmár a differenciál- és integrálszámítás alaptétele a következőképpen fogalmazható meg: Az x függvényének tekintett (1) határozatlan integrál deriváltja egyenlő f(u) függvény x helyen felvett értékével: F 0 (x) = f(x). Más szóval, az f(x) függvényből F(x) függvényt előállító integrálás műveletét az F(x) függvényre alkalmazott differenciálás művelete megsemmisíti, megfordítja.
275. ábra. Az alaptétel bizonyítása Szemléletesen igen könnyű a tétel bizonyítása. Az F(x) integrál területként való értelmezésén alapul, de elködösíthető, ha megkíséreljük f(x)-et görbeként, F 0 (x)-et a görbe érintőjének iránytangenseként ábrázolni. Ezért noha az F(x) integrál geometriai magyarázatát elfogadjuk, F(x) differenciálásában az analitikus módszer szerint járunk el. Az F(x1 ) − F(x) különbség a 275. ábrán egyszerűen az x és x1 közötti terület, s látjuk az ábrából, hogy
525
ennek a terüleletnek az értéke (x1 − x)m és (x1 − x)M közé esik, (x1 − x)m 5 F(x1 ) − F(x) 5 (x1 − x)M, ahol M az f(u) függvény legnagyobb, m pedig a legkisebb értékét jelöli az x és x1 közötti intervallumban. Az m-mel és M-mel képzett két szorzat ugyanis az a két téglalap alakú terület, amely a görbe vonal által határolt területbe beírható és köré írható. A felírt egyenlőtlenségből következik, hogy m5
F(x1 ) − F(x) 5 M. x1 − x
Tegyük fel, hogy f(u) függvény folytonos, úgyhogy ha x1 közeledik x-hez, akkor M közeledik m-hez, és mind a kettő megközelíti f(x)-et. Tehát F 0 (x) = lim
F(x1 ) − F(x) = f(x), x1 − x
(2)
amint azt állítottuk. Szemléletesen ez azt a tényt fejezi ki, hogy x növekedtével az y = f(x) görbe alatti terület változásának a sebessége egyenlő a görbe „magasságával” (ordinátájával) az x helyen. Vannak tankönyvek, melyekben a szerzők az alaptételnek ezt a lényeges pontját szerencsétlenül választott nomenklatúrával ködösítik. Sok szerző először bevezeti a deriváltat, azután definiálja a „határozatlan integrált” mint a derivált inverzét, mondván, hogy G(x) akkor határozatlan integrálja f(x)-nek, ha G 0 (x) = f(x). Így eljárásuk közvetlenül kombinálja a differenciálást az „integrál” szóval. Csak későbben vezetik azután be a „határozott integrál” fogalmát mint területet vagy mint egy összeg határértékét, s elmulasztják hangsúlyozni, hogy az „integrál” szó most, ebben az összefüggésben, valami egészen mást jelent. Így az elmélet egyik alapvető tényét hátsó ajtón keresztül lopják be, s erősen akadályozzák a diákot valódi megértésre való törekvésében. Jobb tehát, ha azt a G(x) függvényt, melynek a deriváltja G 0 (x) = f(x) nem „határozatlan integrál”-nak, hanem f(x) primitív függvényének nevezzük. Ebben a
526
nomenklatúrában az alaptétel egyszerűen azt állítja, hogy F(x), azaz f(u) rögzített alsó határtól változó x felső határig terjedő integrálja, az f(x) egyik primitív függvénye. Azért mondjuk, hogy „egyik” primitív függvénye és nem „a” primitív függvénye, mivel azonnal nyilvánvaló, hogy ha G(x) primitív függvénye f(x)-nek, akkor H(x) = G(x) + c
(c tetszőleges állandó)
is primitív függvénye, hiszen H 0 (x) = G 0 (x). Igaz a megfordítottja is. Két primitív függvény, G(x) és H(x), csupán egy állandóban különbözhet egymástól. Ugyanis az U(x) = G(x) − H(x) különbség deriváltja U 0 (x) = G 0 (x) − H 0 (x) = f(x) − f(x) = 0, így ez a különbség állandó, mivel az a függvény, melynek grafikus ábrázolása mindenütt vízszintes egyenes, állandó kell legyen. Ezzel igen fontos szabályhoz jutottunk az a-tól b-ig terjedő integrál kiszámítására, feltéve, hogy ismerjük f(x) egyik G(x) primitív függvényét. Az alaptétel szerint Zx F(x) = f(u) du a
is egy primitív függvénye f(x)-nek. Tehát F(x) = G(x) + c, ahol c állandó. A c állandót Ra meghatározhatjuk, ha emlékezünk rá, hogy F(a) = a f(u) du = 0. Ebből azt kapjuk, hogy 0 = G(a) + c, úgyhogy c = −G(a). De akkor az a-tól x-ig terjedő határozott Rx integrál F(x) = a f(u) du = G(x) − G(a) lesz, vagy ha x helyett b-t írunk, Zb f(u) du = G(b) − G(a),
(3)
a
tekintet nélkül arra, hogy melyik G(x) primitív függvényt választottuk. Más szóval, Rb az a f(x) dx határozott integrál kiszámítására kell találnunk egy olyan G(x) függvényt, melynek deriváltja G 0 (x) = f(x), s azután képeznünk kell a G(b) − G(a) különbséget.
527
2. Első alkalmazások. xr , cos x, sin x, arc tg x integrálása Lehetetlen ebben a könyvben az alaptétel jelentőségéről méltó képet adni. De talán az alábbi néhány példa legalább ízelítőt ad belőle. A mechanika, fizika vagy tiszta matematika konkrét problémáiban igen gyakran a feladat valamilyen határozott integrál értékének a megkeresése. Az integrálnak összeg határértékeként való közvetlen meghatározása sokszor nehéz lehet. Viszonylag könnyű azonban, amint azt a 3. §-ban láttuk, differenciálni, s nem nehéz nagy tapasztalatra szert tenni ezen a területen. Mármost minden differenciálási formula, G 0 (x) = f(x), visszafelé is olvasható, és így olvasva f(x) egyik primitív függvényét, G(x)-et adja. Ezt azután a (3) képlet szerint felhasználhatjuk f(x) bármely két határ között vett integráljának a kiszámítására. Például ha x2 -t, x3 -t vagy xn -t akarjuk integrálni, sokkal egyszerűbben is eljárhatunk, mint azt az 1. §-ban tettük. Tudjuk xn -re levezetett differenciálási képletünkből, hogy xn deriváltja nxn−1 , úgyhogy G(x) =
xn+1 n+1
(n 6= 0)
deriváltja G 0 (x) =
n+1 n x = xn . n+1
Tehát xn+1 /(n + 1) egyik primitív függvénye f(x) = xn -nek, így közvetlenül kapjuk, hogy Zb xn dx = G(b) − G(a) =
bn+1 − an+1 . n+1
a
Ez az eljárás sokkal egyszerűbb, mint ha az integrált közvetlenül, összeg határértékeként számítjuk ki. Általánosabban, a 3. §-ban azt láttuk, hogy bármely pozitív vagy negatív racionális szám legyen is s, az xs függvény deriváltja sxs−1 , tehát s = r + 1-re a G(x) =
1 r+1 x r+1
függvény deriváltja f(x) = G 0 (x) = xr . (Feltételezzük, hogy r 6= −1, azaz s 6= 0.) Tehát
528
xr+1 /(r + 1) az xr egyik primitív függvénye vagy „határozatlan integrálja”, és azt kapjuk, hogy (ha a, b pozitív és r 6= 1) Zb xr dx =
1 (br+1 − ar+1 ). r+1
(4)
a
A (4)-ben feltesszük, hogy az integrálás intervallumában xr integrandus, az integrálandó függvény, értelmezve van és hogy folytonos, ami kizárja, hogy ha r < 0, x = 0 legyen. Feltesszük ezért, hogy ebben az esetben a és b pozitívok.
G(x) = − cos x esetében tudjuk, hogy G 0 (x) = sin x, tehát Za sin x dx = −(cos a − cos 0) = 1 − cos a. 0
Ugyanígy, mivel G(x) = sin x-re G 0 (x) = cos x, következik, hogy Za cos x dx = sin a − sin 0 = sin a. 0
276. ábra. π/4 mint az y = 1/(1 + x2 ) görbe alatti terület 0-tól 1-ig terjedő része Különösen érdekes eredményt kapunk a tangens függvény inverzének a differenciálásából, D arc tg x = 1/(1 + x2 ) kifejezésből. Ebből az következik, hogy arc tg x az 1/(1 + x2 )
529
primitív függvénye, és (3) képletből az Zb arc tg b − arc tg 0 =
1 dx 1 + x2
0
eredményt kapjuk. Mármost arc tg 0 = 0, mivel a tangens 0 értékéhez a szög 0 értéke tartozik. Tehát azt kapjuk, hogy Zb arc tg b =
1 dx. 1 + x2
(5)
0
Speciálisan, ha b = 1, akkor arc tg b egyenlő lesz π/4-del, mivel a tangens 1 értékének 45◦ -os szög felel meg, ami radiánban mérve π/4. Így azt a figyelemre méltó képletet kapjuk, hogy π = 4
Z1
1 dx. 1 + x2
(6)
0
Ebből a képletből azt látjuk, hogy az y = 1/(1 + x2 ) függvény görbéje alatti terület x = 0-tól x = 1-ig terjedő része egyenlő az 1 sugarú kör területének a negyedével. 3. Leibniz formulája π meghatározására A legutóbbi eredményből a XVII. század egyik legszebb matematikai felfedezését vezethetjük le, a Leibniz által π-re adott alternáló sort: 1 1 1 1 1 1 π = − + − + − + ... . 4 1 3 5 7 9 11
(7)
A + . . . szimbólumon azt értjük, hogy a jobb oldal n tagja után a kifejezés megszakításával képzett véges „részletösszegek” sorozata n növekedtével π/4-hez konvergál. A híres probléma bizonyítása céljából emlékeztessünk az 1 − qn = 1 + q + q2 + . . . + qn−1 1−q
530
véges geometriai sorra, vagy pedig az qn 1 2 n−1 = 1 + q + q + ... + q + 1−q 1−q véges geometriai sorra. Helyettesítsünk be ebbe az algebrai azonosságba q = −x2 -et, így azt kapjuk, hogy 1 = 1 − x2 + x4 − x6 + . . . + (−1)n−1 x2n−2 + Rn , 1 + x2
(8)
ahol az Rn „maradéktag” Rn = (−1)n
x2n . 1 + x2
A (8) egyenlet most intgrálható 0 és 1 határok között. A 3. § (a) szabályával azt kapjuk, hogy a jobb oldalon az egyes tagok integráljának az összegét kell venni. Mivel (4) szerint Zb xm dx =
bm+1 − am+1 , m+1
a
azt kapjuk, hogy Z1 xm dx =
1 , m+1
0
tehát Z1
dx 1 1 1 1 = 1 − + − + . . . + (−1)n−1 + Tn , 2 1+x 3 5 7 2n − 1
(9)
0
ahol Z Tn = (−1)
n
x2n dx 1 + x2
531
A (9) bal oldala (6) szerint egyenlő π/4-del. A különbség π/4 és az Sn = 1 −
(−1)n−1 1 1 + + ... + 3 5 2n − 1
π − Sn = Tn . Még csak azt kell megmutatnunk, hogy n növekedtével 4 Tn a nullához tart. Mármost részletösszeg között
x2n 5 x2n , 1 + x2
ha 0 5 x 5 1.
Emlékezzünk 1. § (13) képletére, mely azt állítja, hogy Zb
Zb f(x) dx 5
a
g(x) dx
ha f(x) 5 g(x)
és
a < b.
a
E szerint Z1 |Tn | =
Z1 x2n dx 5 x2n dx; 2 1+x
0
0
mivel a jobb oldal egyenlő 1/(2n + 1)-gyel, amint azt megelőzően láttuk (a (4) képlet), azt kapjuk, hogy |Tn |
r > 0, mivel akkor nr /ns = 1/n(s−r) → 0. Ha az an /bn arány egy véges, a zérustól különböző c állandóhoz tart, akkor azt
567
mondjuk, hogy an és bn sorozat egyenlő gyorsan konvergál, egyenlő rendű. Így pl. an = n2 és bn = 2n2 + n sorozat egyforma rendű, mivel n2 1 an = = 2 bn 2n + n 2+
1 n
1 → . 2
Azt lehetne gondolni, hogy n hatványaival, akár valami mérőrúddal, mindig meg lehet mérni bármely an sorozatnál, hogy milyen gyorsan tart a végtelenhez. Hiszen ehhez nem kell egyéb – gondolhatnánk – mint találni egy megfelelő, ugyanolyan rendű ns hatványt, mint an ; azaz olyant, hogy an /ns nullától különböző véges állandóhoz tartson. Figyelemre méltó tény, hogy ez egyáltalában nem mindig lehetséges, mivel az an exponenciális függvény a > 1 esetében (pl. en ) bármely ns hatványnál gyorsabban tart a végtelenhez, akármekkorára is választjuk s-et, ln n pedig bármely ns hatványnál lassabban tart a végtelenhez, akármilyen kicsiny pozitív kitevő is legyen s. Képletben: ns →0 an
(1)
ln n → 0, ns
(2)
és
ha n → ∞. Az s kitevőnek nem kell egész számnak lennie, bármely pozitív szám lehet. Az (1) bizonyítására egyszerűsítsük előbb az állítást, az arány s-edik gyökét véve; ha a gyök zérushoz tart, zérushoz kell tartania az eredeti aránynak is. Csak azt kell tehát bebizonyítani, hogy n → 0, an/s ha n → ∞. Legyen b = a1/s ; mivel feltevésünk szerint a nagyobb mint 1, b és így √ b = b1/2 is nagyobb lesz mint 1. Felírhatjuk, hogy b1/2 = 1 + q,
568
ahol q pozitív. Most a 17. oldal (6) egyenlőtlensége szerint bn/2 = (1 + q)n = 1 + nq > nq, úgyhogy an/s = bn > n2 q2 és n n 1 < 2 2 = . n/s a nq nq2 Mivel az utóbbi mennyiség n növekedtével a nullához tart, a bizonyítás teljes. Valóban, az xs →0 ax
(3)
összefüggés mindig érvényes, akármilyen x1 , x2 , . . . sorozaton keresztül tart x a végtelenhez. E sorozatnak nem kell a pozitív egész számok 1, 2, 3, . . . sorozatával egybeesnie. Ugyanis, ha n − 1 5 x 5 n, akkor xs ns ns < = a · → 0. ax an−1 an Ez a megjegyzés használható a (2) bizonyítására. Legyen x = ln n és es = a, úgyhogy n = ex és ns = (es )x , akkor a (2) arány x ax alakban írható, ami a (3) speciális esete s = 1-re. *Feladatok: 1) Bizonyítsuk be, hogy ha x → ∞, ln ln x függvény lassabban tart a végtelenhez mint ln x. 2) x/ ln x deriváltja 1/ ln x − 1/(ln x)2 . Bizonyítsuk be, hogy ez nagy x-re „aszimptotikusan” ekvivalens az első taggal, 1/ ln x-szel, azaz, hogy arányuk az 1-hez tart, ha x → ∞.
569
2. ln(n!) nagyságrendje Számos alkalmazásban, pl. a valószínűségszámításban, fontos, hogy ismerjük n! rendjét vagy „aszimptotikus viselkedését” n nagy értékeire is. Itt megelégszünk n! logaritmusának, azaz a Pn = ln 2 + ln 3 + ln 4 + . . . + ln n kifejezésnek a tanulmányozásával. Megmutatjuk, hogy Pn „aszimptotikus értéke” n ln n; azaz, hogy ln(n!) → 1, n ln n ha n → ∞.
287. ábra. ln n! becslése A bizonyítás tipikus példája a matematika egyik gyakran használt módszerének, amely egy összeg és egy integrál összehasonlításából áll. A 287. ábrán a Pn összeg egyenlő a teljes vonallal kihúzott tetejű derékszögű négyszögek területének az összegével, s ez az összeg nem lehet nagyobb, mint a logaritmikus görbe alatt 1 és n + 1 között levő n+1 Z
ln x dx = (n + 1) ln(n + 1) − (n + 1) + 1 1
570
terület (l. 543. o., 1. feladat). Azonban Pn összeg ugyancsak egyenlő azoknak a derékszögű négyszögeknek az összterületével is, amelyeknek a tetejét szaggatott vonallal jelöltük az ábrán, ez a terület pedig nagyobb, mint a logaritmikus görbe alatt 1 és n között levő terület, amit Zn ln x dx = n ln n − n + 1 1
ad meg. Tehát n ln n − n + 1 < Pn < (n + 1) ln(n + 1) − n, és osztva n ln n értékkel, 1−
1 Pn ln(n + 1) 1 1 + < < (1 + 1/n) − = ln n n ln n n ln n ln n ln n 1 ln n + ln(1 + 1/n) 1 = 1+ − . n ln n ln n
Ha n tart a végtelenhez, a két korlát nyilván valóban 1-hez tart, s így állításunkat igazoltuk. *Feladat: Bizonyítsuk be, hogy az egyik határ nagyobb, mint 1 − 1/n, a másik kisebb, mint 1 + 1/n.
3. § Végtelen sorok és végtelen szorzatok 1. Végtelen függvénysorok Mondottuk már, hogy egy s mennyiség végtelen sor alakjában való kifejezése s = b1 + b2 + b3 + . . .
(1)
571
semmi egyéb, mint kényelmes jelölése annak az állításnak, hogy s, növekvő n esetére, véges „részletösszegek” s1 ,
s2 ,
s3 ,
...
sorozatának határértéke, ahol sn = b1 + b2 + b3 + . . . + bn .
(2)
Így (1) egyenlet ekvivalens lim sn = s,
ha n → ∞
(3)
határérték-relációval, ahol sn -et a (2) definiálja. Ha a (3) határérték létezik, azt mondjuk, hogy az (1) sor s értékhez konvergál, ha a (3) határérték nem létezik, azt mondjuk, hogy a sor divergens, széttartó. Így például az 1−
1 1 1 + − + ... 3 5 7
sor konvergál a π/4 értékhez, és az 1−
1 1 1 + − + ... 2 3 4
sor konvergál a ln 2 értékhez. Másrészt az 1 − 1 + 1 − 1 + ... sor divergens (mivel a részletösszegek értéke alternálva 1 és 0), és ugyancsak divergens az 1 + 1 + 1 + 1 + ... sor is, mert a részletösszegek végtelenhez tartanak.
572
Már találkoztunk olyan sorokkal, melyeknek bi tagjai x-nek bi = ci xi alakú függvényei, ahol ci állandó. Az ilyen sorokat hatványsorok nak nevezik. A hatványsorok a részletösszegeket előállító Sn = c0 + c1 x + c2 x2 + . . . + cn xn polinomok határértékei (a c0 állandó tag hozzáadása miatt lényegtelen változtatás szükséges a (2) jelölésen). Valamely f(x) függvény f(x) = c0 + c1 x + c2 x2 + . . . hatványsorba fejtése így módot ad f(x) megközelítésének polinomokkal, a legegyszerűbb függvényekkel való kifejezésére. Összefoglalva és kiegészítve megelőző eredményeinket, a következő hatványsorbafejtéseket sorolhatjuk fel: 1 = 1 − x + x2 − x3 + . . . , 1+x
(4)
érvényes −1 < x < +1 intervallumban. tg−1 x = x −
x3 x5 + − ..., 3 5
(5)
érvényes −1 5 x 5 +1 intervallumban. x2 x3 + − ..., 2 3
(6)
1 1+x x3 x5 ln =x+ + + ..., 2 1−x 3 5
(7)
ln(1 + x) = x − érvényes −1 < x 5 +1 intervallumban.
573
érvényes −1 < x < +1 intervallumban. x2 x3 x4 + + + ..., e =1+x+ 2! 3! 4! x
(8)
érvényes minden x-re. Csatoljuk ehhez a gyűjteményhez most a következő fontos sorbafejtéseket: sin x = x −
x3 x5 + − ..., 3! 5!
(9)
cos x = 1 −
x2 x4 + − ..., 2! 4!
(10)
érvényes minden x-re.
érvényes minden x-re. A bizonyítás egyszerűen következik az alábbi két formulából (l. 528. o.): Zx sin u du = 1 − cos x,
(a)
0
Zx cos u du = sin x.
(b)
0
A cos x 5 1 egyenlőtlenségből indulunk ki. Integrálva 0-tól x-ig, ahol x bármely rögzített pozitív szám, azt kapjuk, hogy (l. (13) képletet a 496. oldalon): sin x 5 x; ezt újból integrálva 1 − cos x 5
574
x2 , 2
ami ugyanaz, mint x2 cos x = 1 − . 2 Újból integrálva, azt kapjuk, hogy sin x = x −
x3 x3 =x− . 2·3 3!
Így haladva minden határon túl, az egyenlőtlenségek két halmazát kapjuk: sin x 5 x
cos x 5 1
x3 3! x3 x5 sin x 5 x − + 3! 5! 3 x x5 x7 sin x = x − + − 3! 5! 7! sin x = x −
......
x2 2! x2 x4 cos x 5 1 − + 2! 4! 2 x x4 x6 cos x = 1 − + − 2! 4! 6!
cos x = 1 −
......
Mármost xn /n! → 0, ha n tart a végtelenhez. Ennek a megmutatására válasszunk 1 x xm < legyen, és írjunk egy m rögzített egész számot úgy, hogy helyett c-t. Írjunk m 2 m bármely n > m egész számot n = m + r alakba, akkor xn x x x 0< =c· · ... n esetében (11) mindegyik Cas együttható nulla, úgyhogy egyszerűen a közönséges binomiális tételt kapjuk vissza. Newtonnak még pályája kezdetéről származó, egyik nagy felfedezése volt, hogy az elemi binomiális tétel pozitív n egész kitevőkről általánosítható tetszőleges pozitív vagy negatív, racionális vagy irracionális a kitevőkre. Ha a nem egész szám, (11) jobb oldala végtelen sort eredményez, amely −1 < x < +1 intervallumban érvényes. Ha |x| > 1, akkor (11) sor divergens, és így az egyenlőségjel értelmét veszíti. Speciális esetben, a = 12 -et helyettesítve be (11)-be, √
1 1·3 3 1·3·5 4 1 x2 + 3 x − 4 x + ... 1+x=1+ x− 2 2 2 · 2! 2 · 3! 2 · 4!
(12)
sorbafejtést kapjuk. Valójában, akár a XVIII. század többi matematikusa, Newton sem tudta bizonyítani képlete érvényességét. A konvergenciafogalom vizsgálata, s az ilyen végtelen sorok érvényességi tartományának, összetartási körének az analízise a XIX. században kezdődött el. Feladat: Írjuk fel
√
√ 1 − x2 és 1/ 1 − x hatványsorát.
A (4)–(11) sorbafejtések speciális esetei Brook Taylor (1685–1731) általános formulá-
576
jának, melynek célja az f(x) függvények egy nagy osztályának kifejtése f(x) = c0 + c1 x + c2 x2 + c3 x3 + . . .
(13)
hatványsor alakjában, úgy hogy törvényt ad ci koefficiensek f függvénnyel és deriváltjaival történő kifejezésére. Nem lehetséges itt Taylor képletének pontos bizonyítását adni, megfogalmazva és megállapítva érvényességi feltételeit. De egyszerű, plauzibilitásra hivatkozó megfontolások is megvilágítják az itt szereplő matematikai tények közötti összefüggéseket. Próbálkozzunk meg azzal a feltevéssel, hogy a (13) sorbafejtés lehetséges. Tegyük fel továbbá, hogy f(x) differenciálható, hogy f 0 (x) is differenciálható, és így tovább, úgy hogy a deriváltak végtelen sorozata f 0 (x), f 00 (x), . . . , f(n) (x), . . . ténylegesen létezik. Végül adottnak vesszük, hogy egy végtelen hatványsor éppen úgy tagonként differenciálható, mint egy véges polinom. E feltételek mellett meghatározhatjuk a cn együtthatókat f(x) függvény x = 0 környezetében való viselkedéséből. Először is, x = 0 értéket helyettesítve (13)-ba, azt kapjuk, hogy c0 = f(0), mivel a sor minden x-et tartalmazó tagja eltűnik. Ha most (13)-at differenciáljuk, azt kapjuk, hogy f 0 (x) = c1 + 2c2 x + 3c3 x2 + . . . + ncn xn−1 + . . . .
(13’)
Helyettesítsünk most újból az x = 0 értéket, de ne a (13)-ba, hanem a (13’)-be, akkor azt kapjuk, hogy c1 = f 0 (0).
577
Ha most a (13’)-t differenciáljuk, azt kapjuk, hogy f 00 (x) = 2c2 x + 2 · 3c3 x + . . . + (n − 1) · n · cn xn−2 + . . . ;
(13")
most a (13")-be helyettesítve x = 0 értéket, látjuk, hogy 2!c2 = f 00 (0). Ugyanígy a (13")-t differenciálva és azután x = 0 értéket helyettesítve be 3!c3 = f 000 (0), s az eljárást folytatva, cn =
1 (n) f (0) n!
általános képletet kapjuk, ahol f(n) (0) az f(x) n-edik deriváltjának értéke az x = 0 helyen. Az eredmény a Taylor-sor: f(x) = f(0) + xf 0 (0) +
x2 00 x3 f (0) + f 000 (0) + . . . . 2! 3!
(14)
Differenciálási feladatként igazolja az olvasó, hogy a (4)–(11) példákban a Taylor-sor együtthatóira adott képlet teljesül. 2. Euler képlete: cos x + i sin x = eix Euler formalisztikus manipulációinak egyik legelbűvőlőbb eredménye annak a szoros kapcsolatnak a felfedezése, amely a komplex számok körében a szinusz és koszinusz függvény között egyrészről, s másrészről az exponenciális függvény között van. Előre meg kell jegyezni, hogy Euler „bizonyítása”, vagy az itt közölt érvelés semmiféleképpen nem szigorú jellegű; tipikus példái ezek a XVIII. században szokásban volt formalisztikus manipulációknak.
578
Induljunk ki De Moivre képletéből, melyet a II. fejezetben bizonyítottunk: (cos nϕ + i sin nϕ) = (cos ϕ + i sin ϕ)n Itt ϕ = x/n-et helyettesítve be, x x n (cos x + i sin x) = cos + i sin n n képletet kapjuk. Mármost, ha x adott, akkor cos nx csak kevéssel tér el nagy n értékek esetében cos 0 = 1-től; továbbá mivel x sin n x → 1, n
x →0 n
ha
(l. 370. o.), látjuk, hogy sin nx aszimptotikusan egyenlő nx -nel. Plauzibilisnak vélhetnénk azért a
ix (cos x + i sin x) = lim 1 + n
n ,
ha
n→∞
határátmenetet. Összehasonlítva az egyenlet jobb oldalát az z n e = lim 1 + , n z
ha
n→∞
képlettel (541. o.), azt látjuk, hogy cos x + i sin x = eix .
(15)
Ez Euler eredménye. Ugyanezt az eredményt egyéb formalisztikus módon is megkaphatjuk ez : ez = 1 +
z2 z3 z + + + ... 1! 2! 3!
sorba fejtett alakjából, z = ix helyettesítéssel, ahol x valós szám. Emlékeztetünk arra, hogy i egymást követő hatványai i, −1, −i, +1, és így tovább, periodikusan, s gyűjtsük
579
össze a valós és az imaginárius részeket: x3 x5 x7 x2 x4 x6 + − + ... + i x − + − + ... . e = 1− 2! 4! 6! 3! 5! 7! ix
Összevetve a jobb oldalt sin x és cos x soraival, újból Euler képletét kapjuk. Az efféle érvelés semmiképpen sem tényleges bizonyítása a (15) összefüggésnek. Második érvelésünk ellen az a kifogás, hogy ez sorbafejtése azzal a feltétellel történt, hogy z valós szám; a z = ix behelyettesítés tehát igazolást követel. Ugyanígy az első érvelést lerombolja az a tény, hogy az ez = lim(1 + z/n)n ,
ha n → ∞
formula levezetése is csak valós z értékekre történt. Ahhoz, hogy Euler képlete puszta formalizmusból szigorú matematikai igazsággá lehessen, a komplex-változós függvénytan kialakítására volt szükség. Ez az elmélet egyike a XIX. század nagy matematikai eredményeinek. Sok más probléma is serkentette ezt a messze ható fejlődést. Láttuk például, hogy a függvények hatványsorba fejtett alakja különböző x intervallumokban konvergál. Miért konvergál némelyik sorbafejtés mindig, azaz minden x-re, s miért válnak más sorbafejtések |x| > 1 esetére értelmetlenné? Tekintsük például a 573. oldalon közölt (4) geometriai sort, mely |x| < 1 esetére konvergál. Ennek az egyenletnek a baloldala tökéletesen értelmezett x = 1 esetében, ugyanis az
1 1+1
=
1 2
értéket veszi fel, de az egyenlet jobb oldala igen különösen viselkedik,
ugyanis 1 − 1 + 1 − 1 + ... lesz. Ez a sor nem konvergál, mivel részletösszegeinek az értéke 1 és 0 között váltakozik. Ez a tény arra utal, hogy egyes függvények sorbafejtése divergens lehet még akkor is, ha maguk a függvények semmi szabálytalanságot nem mutatnak. Természetesen az 1 1+x
függvény végtelen lesz, ha x → −1-hez. Mivel könnyű megmutatni, hogy ha egy
hatványsor x = a > 0 esetére konvergál, ebből következik, hogy −a < x < a esetére is konvergál. Úgy tűnhetnék, hogy a sor különös viselkedésének „magyarázatát” az függvény x = −1 helyen való szakadásában kereshetjük. Azonban pl. az
580
1 1+x2
1 1+x
függvény is
sorba fejthető 1 = 1 − x2 + x4 − x6 + . . . 2 1+x módra, x2 -et helyettesítve a (4)-ben x helyébe. Ez a sor is konvergál |x| < 1 esetére, míg x = 1 esetben újból az 1 − 1 + 1 − 1 + . . . divergens sorhoz vezet, |x| > 1-re pedig robbanásszerűen divergál, bár maga a függvény mindenütt szabályos. Kiderült, hogy efféle jelenségek teljes megértése csak akkor lehetséges, ha a függvényeket az x változó komplex értékei esetében is éppen úgy tanulmányozzuk, mint valós x esetében. Így például
1 1+x2
sorának divergálni kell x = i értékre, mert a tört nevezője
nulla lesz. Következésképpen a sornak minden olyan x értékre is divergálnia kell, amely kielégíti az |x| > |i| = 1 feltételt, mivel kimutatható, hogy akármelyik ilyen x-re való konvergenciájából következnék, hogy konvergál x = i-re is. Így a sorok konvergenciájának a kérdése, amit az infinitezimális számítás korai szakában teljesen elhanyagoltak, a komplex-változós függvénytan megteremtésében egyike volt a legfontosabb tényezőknek. 3. A harmonikus sor és a zéta-függvény. Euler végtelen sora a szinuszfüggvényre Különösen érdekesek az olyan sorok, melyeknek tagjai az egész számok egyszerű kombinációi. Tekintsük példaként az 1+
1 1 1 1 + + + ... + + ... 2 3 4 n
(16)
„harmonikus sort”, amely csak a páros tagok előjelében különbözik ln 2 sorától. Az a kérdés, hogy ez a sor konvergál-e, azonos azzal, hogy vajon az s1 , s2 , s3 , . . . sorozat, ahol sn = 1 +
1 1 1 1 + + + ... + , 2 3 4 n
(17)
véges határértékhez tart-e. Bár a (16) sor tagjai annál jobban megközelítik a 0-t, minél messzebb haladunk a sorban, könnyű belátni, hogy a sor mégsem konvergál. Ugyanis
581
elég sok tagot véve, sn bármely előre megadott pozitív számnál nagyobb lesz, úgyhogy sn minden határon túl növekszik és (16) sor „divergál a végtelenhez”. Hogy ezt belássuk, figyeljük meg, hogy 1 s2 = 1 + , 2 s4 = s2 +
s8 = s4 +
1 1 + 3 4
1 1 1 1 + + + 5 6 7 8
> s2 +
1 1 + 4 4
> s4 +
2 =1+ , 2
1 1 + ... + 8 8
3 =1+ , 2
és álalában s 2m > 1 +
m . 2
(18)
Így például az s2m részletösszeg meghaladja 100-at, mihelyt m = 200. Noha a harmonikus sor nem konvergál, az 1+
1 1 1 1 + s + s + ... + s + ... s 2 3 4 n
(19)
sor konvergál minden 1-nél nagyobb s esetén, és minden s > 1 esetben az ún. zétafüggvényt definiálja: 1 1 1 1 ζ(s) = lim 1 + s + s + s + . . . + s , 2 3 4 n
ha n → ∞,
(20)
mint az s változó függvényét. A zéta-függvény és a prímszámok között van egy igen fontos összefüggés, amit geometriai sorokra vonatkozó ismereteink alapján levezethetünk. Legyen p bármely prímszám, p = 2, 3, 5, 7, . . .; akkor s = 1 esetén 0
0) függvények konvexek, azaz, hogy p 1 2
648
1+
1 1 + x1 x2
x21
+ 2
=
p
1+
2 x1 + x2
x22
s =
1+
x1 + x2 2
2 ,
ha x1 és x2 pozitív.
(83) Bizonyítsuk be ugyanezt a következő függvények esetében: u = x2 , u = xn , ha √ x > 0, u = sin x, ha π 5 x 5 2π, u = tg x, ha 0 5 x 5 π/2, u = − 1 − x2 , ha |x| 5 1.
Maximumok és minimumok (84) Keressük meg P és Q közötti legrövidebb utat, mint a 178. ábrán, ha feltételezzük, hogy az út a két adott egyenest váltakozva n-szer érinti. (Lásd 403. o.) (85) Keressük meg a legrövidebb összeköttetést két pont: P és Q között egy hegyesszögű háromszögön belül, ha az úttól megkívánjuk, hogy adott sorrendben találja a háromszög oldalait. (Lásd 404. o.) (86) Rajzoljuk be a szintvonalakat, és bizonyítsuk be legalább két nyeregpont egzisztenciáját egy olyan felületen, amely egy háromszorosan összefüggő tartomány felett van, és határvonala egy vízszintes síkban fekszik. (Lásd 417. o.) Újból ki kell zárni azt az esetet, amikor a felület érintősíkja egy egész zárt görbe mentén horizontális. (87) Két tetszőleges, a és b pozitív racionális számból kiindulva képezzük lépésről √ lépésre az an+1 = an bn , bn+1 = 12 (an + bn ) párokat. Bizonyítsuk be, hogy ezek intervallumskatulyázást definiálnak. (Az egymásba skatulyázott intervallumok sorozatának határértékei, ha n → ∞, a0 és b0 úgynevezett aritmetikai-geometriai közepe, fontos szerepet játszott Gauss fiatalkori kutatásaiban.) (*88) Keressük meg a 219. ábrán látható egész vonalrendszer hosszúságát, és hasonlítsuk össze a két átló összhosszúságával. (*89) Mi az a feltétel, ami eldönti, hogy négy pont, A1 , A2 , A3 , A4 a 216. vagy a 218. ábrához tartozik-e? (*90) Keressünk öt pontból álló rendszert, melyre különféle, a szögfeltételt kielégítő úthálózatok lehetségesek. Csak néhány ad közülük relatív minimumot. (Lásd 435. o.) (91) Bizonyítsuk be az (a1 b1 + . . . + an bn )2 5 (a21 + . . . + a2n )(b21 + . . . + b2n ) Schwarz-féle egyenlőtlenséget, amely ai , bi számok minden párjára érvényes; igazoljuk, hogy az egyenlőségjel csak abban az esetben érvényes, ha az ai -k arányosak a bi -kel. (Útmutatás: Általánosítsuk a 8. feladat algebrai formuláját.)
649
*(92) Legyen adva n pozitív szám: x1 , . . ., xn . Képezzük belőlük az sk = (x1 x2 . . . xk + . . .)/Cnk által definiált sk kifejezést, ahol a „+ . . .” jelölés azt jelenti, hogy az adott mennyiségek közül k-ból képzett összes Cnk szorzatot össze kell adni. Igazoljuk, hogy √
k+1
sk+1 5
√ k
sk ,
ahol az egyenlőségjel csak akkor érvényes, ha az xi mennyiségek mind egyenlők. (93) n = 3 esetére ezek az egyenlőtlenségek azt állítják, hogy a, b, c három pozitív számra √ 3
r abc 5
ab + ac + bc a+b+c 5 . 3 3
A kocka miféle extremális tulajdonsága következik ezekből az egyenlőtlenségekből? (*94) Keressük meg azt a legrövidebb görbeívet, mely A és B pontot úgy köti össze, hogy az ív és AB szakasz által közbezárt terület előírt legyen. (Válasz: A legrövidebb ív, körív.) *(95) Legyen adva AB és A 0 B 0 szakasz, keressünk A-t és B-t összekötő ívet és A 0 -t B 0 -vel összekötő ívet úgy, hogy a két ív a két szakasszal előírt területet zárjon közre és a két ív összhosszúsága minimum legyen. (Válasz: Az ívek egyenlő sugarú körívek.) (*96) Keressük meg ugyanezt tetszőleges számú AB, A 0 B 0 stb. szakasz esetében. (*97) Legyen adva két egyenes, mely O pontban metszi egymást. Keressünk az egyik egyenesen egy A, a másikon egy B pontot úgy, hogy A-t minimális ívhosszúságú ív kösse össze B-vel és az ív és egyenesek által közbezárt terület előírt legyen. (Válasz: Az ív az egyenesekre merőleges körív lesz.) (*98) Ugyanez, de most a körülzárt tartomány kerülete, azaz az ív plusz OA plusz OB legyen minimum. (Válasz: A megoldás kifelé buggyanó és a két egyenest érintő körív.) (*99) Ugyanez több szögtartomány esetén. (*100) Igazoljuk, hogy a 240. ábrán látható csaknem sík felületek nem síkok, kivéve azt az esetet, hogyha a középpontban ott van a stabilizáló felület. Megjegyzés: ezeknek a görbült felületeknek az analitikus jellemzése még megoldatlan probléma. Ugyanez áll
650
a 251. ábrán látható felületekre is. A 258. ábrán már tényleg síkok találkoznak, tizenkét szimmetrikus sík, 120◦ -os szög alatt, az átlók mentén. Tanács további szappanbuborékkísérletekhez. Végezzük el a 256. és 257. ábrán látható kísérleteket háromnál több összekötőrúddal. Tanulmányozzuk a határhelyzeteket, amikor a levegőtérfogatok a nullához tartanak. Kísérletezzünk nem párhuzamos síkokkal és egyéb felületekkel. Fújjuk fel a 258. ábrán látható kockaszerű szappanbuborékot, míg az egész kockát megtölti, és túlbuggyan az éleken. Azután szívjuk ki ismét a levegőt, megfordítva a folyamatot. (*101) Keressünk két adott összkerületű és legkisebb területű egyenlő oldalú háromszöget. (Válasz: A háromszögeknek egybevágóaknak kell lenniök (alkalmazzuk a differenciálszámítást)). (*102) Keressünk két adott kerületösszegű és legnagyobb területű háromszöget: (Válasz: Az egyik háromszög ponttá fajul el, a másiknak egyenlő oldalúnak kell lennie.) (*103) Keressünk két háromszöget, a két háromszög együttes területe legyen adott, együttes kerülete minimum. (*104) Keressünk két egyenlő oldalú háromszöget, amelyeknek együttes területe adott, együttes kerületük pedig legyen maximum.
A differenciál- és integrálszámítás √ √ (105) Differenciáljuk 1 + x, 1 + x2 ,
r
x+1 függvényeket, közvetlenül a derivált x−1 definíciójának az alkalmazásával, képezve a differenciahányadosokat, és addig átalakítva, míg a határérték x1 = x behelyettesítéssel könnyen megkapható. (Lásd 505. o.) (106) Igazoljuk, hogy az y = e−1/x függvénynek minden deriváltja nulla az x = 0 2
helyen; legyen y = 0, ha x = 0. (107) Mutassuk meg, hogy a 106. feladat függvényét nem lehet Taylor-sorba fejteni. (108) Keressük meg az y = e−x és y = xe−x görbék inflexiós pontját (f 00 (x) = 0). 2
2
(109) Igazoljuk, hogy f(x) polinom esetében, melynek n különböző x1 , . . ., xn gyöke van, f 0 (x) X 1 = . f(x) x − x i i=1 n
651
(*110) Igazoljuk az integrál összeg határértékeként való közvetlen definíciója alapján, hogy ha n → ∞, n
1 1 1 + 2 + ... + 2 2 2 2 1 +n 2 +n n + n2
→
π . 4
(*111) Igazoljuk hasonló módon, hogy b n
b 2b nb sin + sin + . . . + sin → cos b − 1. n n n
(112) Rajzoljuk meg nagyban, milliméterpapíroson a 276. ábrát, és a vonalkázott terület kis négyzeteinek a megszámlálásával keressünk közelítő értéket π-re. (113) Alkalmazzuk a 529. oldalon található (7) képletet π numerikus kiszámítására, legalább 1/100 pontosságot megkívánva. (114) Bizonyítsuk be, hogy eπi = −1. (Lásd 579. o.) (115) Adott alakú görbét megnagyítunk 1 : X arányban. Jelölje a megnagyított görbe ívhosszúságát L(x), az általa körülzárt területet A(x). Mutassuk meg, hogy L(x)/A(x) → 0, ha x → ∞, és általánosabban, L(x)/A(x)k → 0, ha x → ∞, feltéve, hogy k > 12 . Ellenőrizzük körre, négyzetre és *ellipszisre. (A terület magasabb nagyságrendű, mint a kerület. Lásd 566. o.) (116) Az exponenciális függvény gyakran fordul elő speciális kombinációkban, amelyek a következőképpen vannak definiálva és leírva: 1 v = ch x = (ex + e−x ) 2 ex − e−x w = th x = x e + e−x
1 u = sh x = (ex − e−x ), 2
amiket sorra szinusz hiperbolikusz, koszinusz hiperbolikusz, tangens hiperbolikusz függvényeknek nevezünk. Ezeknek a függvényeknek sok tulajdonsága hasonlít a trigonometrikus függvények tulajdonságaihoz; pl. az u2 − v2 = 1 hiperbolával olyan kapcsolatban vannak, mint az u = cos x és v = sin x függvények az u2 + v2 = 1 körrel. Bizonyítsa be az olvasó a következő tényeket és hasonlítsa össze a trigonometrikus
652
függvényekre vonatkozó megfelelő tényekkel: D ch x = sh x,
D sh x = ch x,
D th x = 1/ ch2 x,
sh(x + x 0 ) = sh x · ch x 0 + ch x · sh x 0 ch(x + x 0 ) = ch x · ch x 0 + sh x · sh x 0 . √ Az inverz függvények neve x = ar sh u = ln(u + u2 + 1); x = ar ch v = ln(v ± √ 1 1+w v2 − 1) (v = 1) és x = ar th w = ln (|w| < 1). 2 1−w Deriváltjaikat a következő képletek adják: 1 D ar ch v = ± √ v2 − 1 1 D ar th w = (|w| < 1). 1 − w2
D ar sh u = √
1 , 1 + u2
(v > 1),
(117) Ellenőrizzük Euler képlete alapján a hiperbolikus és a trigonometrikus függvények közötti analógiát. (*118) Keressünk egyszerű összegezési képleteket sh x + sh 2x + . . . + sh nx és 1 + ch x + ch 2x + . . . + ch nx 2 számára, ahhoz hasonlót, mint amilyent a 14. feladatban a trigonometrikus függvényekre adtunk.
Az integrálás technikája A 528. oldalon közölt tétel f(x) függvény a-tól b-ig terjedő határok közötti integrálásának a problémáját f(x) függvény egyik G(x) primitív függvényének a megtalálására vezeti vissza. Láttuk, hogy f(x)-nek azt a primitív függvényét kell megkeresni, amelyre G 0 (x) = f(x). Az integrál akkor egyszerűen a G(b) − G(a) különbség. Ezeket a primi-
653
tív függvényeket, amelyeket f(x) határoz meg (egy tetszőleges additív állandó erejéig) „határozatlan integrál”-nak szokás nevezni, s a kifejező Z G(x) = f(x) dx jellel jelölni, az integrál határai nélkül. (A jelölés a kezdőt félrevezetheti; lásd megjegyzést a 526. oldalon.) Minden differenciálási formula tartalmazza egy határozatlan integrálási probléma megoldását, egyszerűen csak megfordítva kell olvasni, integrálási képletként. Ezt a kissé empirikus eljárást két fontos szabállyal egészíthetjük ki, melyek semmi egyebek, mint az összetett függvények differenciálását és függvények szorzatának a differenciálását megadó szabályok megfelelői. Ez a két fontos integrálási szabály a helyettesítés elve és a parciális integrálás. A) Az első szabály az összetett függvény differenciálási szabályából ered. Legyen egy H(u) = G(x) összetett függvényünk, ahol x = Ψ(u)
és
u = ϕ(x)
legyenek a tekintett intervallumban egymás egyértelműen meghatározott függvényei. Akkor H 0 (u) = G 0 (x)Ψ 0 (u). Ha G 0 (x) = f(x), felírhatjuk, hogy Z G(x) = f(x) dx,
654
továbbá, hogy G 0 (x)Ψ 0 (u) = f(x)Ψ 0 (u), amely, fent H 0 (u)-re adott formula szerint ekvivalens Z H(u) = f(Ψ(u))Ψ 0 (u) du kifejezéssel. Tehát, mivel H(u) = G(x), Z
Z f(x) dx =
f(Ψ(u))Ψ 0 (u) du.
(I)
Leibniz jelölésében (l. 520. o.) ez a szabály a roppant kifejező Z
Z f(x) dx =
f(x)
dx du du
dx alakot ölti, amely azt jelenti, hogy a dx jelet éppen úgy lehet a du jellel helyettesíteni, du dx mintha csak dx és du számok volnának, pedig tört. du A következőkben az (I) képlet hasznosságát illusztráljuk néhány példával. Z 1 (a) J = du. Itt (I) jobb oldalából indulunk ki, x = ln u = Ψ(u) helyettesítéssel. u ln u 1 1 Akkor Ψ 0 (u) = , f(x) = ; tehát u x Z dx J= = ln x, x vagy Z
du = ln ln u. u ln u
1 Igazolhatjuk ezt az eredményt, mindkét oldalt differenciálva. Azt kapjuk, hogy = u ln u d (ln ln u), melynek helyessége könnyen belátható. du Z R cos u (b) J = cotg u du = du. Itt x = sin u = Ψ(u) helyettesítéssel azt kapjuk, sin u
655
hogy Ψ 0 (u) = cos u,
f(x) =
1 , x
tehát Z
dx = ln x x
J= vagy Z
cotg u du = ln sin u. Ez az eredmény differenciálással ismét igazolható. (c) Általánosságban, ha Z
Ψ 0 (u) du Ψ(u)
J=
alakú integrálunk van, x = Ψ(u), f(x) = Z J= (d) J =
R
J= (e) J =
dx = ln x = ln Ψ(u). x
sin x cos x dx. sin x = u, cos x = Z
Z
1 helyettesítéssel azt kapjuk, hogy x
du u dx = dx
du helyettesítéssel azt kapjuk, hogy dx
Z u du =
u2 1 = sin2 x. 2 2
ln u 1 dx du. Itt ln u = x, = helyettesítéssel u u du Z J=
dx x du = du
Z x dx =
x2 1 = (ln u)2 . 2 2
A következő példákban (I)-t bal oldaláról kiindulva használjuk.
656
Z (f) J =
dx √ dx √ . x = u helyettesítéssel x = u2 és = 2u, tehát du x Z J=
√ 1 · 2u du = 2u = 2 x. u
(g) x = au helyettesítéssel, ahol a állandó, azt kapjuk, hogy Z J= (h) J =
R√
dx = 2 a + x2
Z
dx 1 1 · 2· du = du a 1 + u2
Z
1 − x2 dx. Itt x = cos u helyettesítéssel Z J=
Z − sin u du = − 2
1 du x 1 = · arc tg . 2 a 1+u a a dx = − sin u. Akkor du
1 − cos 2u u sin 2u du = − + . 2 2 4
√ Alkalmazva sin 2u = 2 sin u cos u = 2 cos u 1 − cos2 u képletet, azt kapjuk, hogy 1 1 p J = − arc cos x + x 1 − x2 . 2 2 Számítsuk ki a következő határozatlan integrálokat, és igazoljuk differenciálással az eredményt: Z (119)
u2
u du . −u+1
Z 2
(120)
ueu du. Z
(121) Z (122)
du . u(ln u)n 8x dx. 3 + 4x
Z (123)
x2
dx . +x+1
x2
dx . + 2ax + b
Z (124)
657
Z (125)
t2 Z
(126) Z (127)
p 1 + t2 dt.
t+1 √ dt. 1 − t2 t4 dt. 1−t
Z (128)
cosn t · sin t dt. Z
(129) Igazoljuk, hogy példát.)
dx x 1 = ar th ; 2 2 a −x a a
Z
dx x √ = ar sh . (Vö. (g) és (h) 2 2 a a −x
B) A szorzat differenciálására adott (p(x) · q(x)) 0 = p(x) · q 0 (x) + p 0 (x) · q(x) szabály (513. o.) következőképpen írható integrál formula alakjába: Z
Z 0
p(x) · q(x) = p(x) · q (x) dx + p 0 (x) · q(x) dx vagy Z
Z 0
p(x) · q (x) dx = p(x) · q(x) − p 0 (x) · q(x) dx.
(II)
Ebben az alakjában a parciális integrálás szabályának nevezzük. A szabály olyankor hasznos, mikor az integrálandó függvény p(x)q 0 (x) szorzat alakjában írható, ahol q 0 (x) függvény q(x) primitív függvényét ismerjük. Ebben az esetben (II) képlet p(x)q 0 (x) határozatlan integráljának a megkeresését visszavezeti p 0 (x)q(x) függvény integrálására, amit gyakran sokkal könnyebb megoldani. Példák :
658
(a) J =
R
ln x dx. Legyen p(x) = ln x, q 0 (x) = 1, úgy hogy q(x) = x. Akkor (II) szerint Z
Z ln x dx = x ln x −
x dx = x ln x − x. x
R (b) J = x ln x dx. Legyen p(x) = ln x, q 0 (x) = x. Akkor x2 J= ln x − 2 (c) J =
R
Z
x2 x2 x2 dx = ln x − . 2x 2 4
x sin x dx. Válasszunk itt p(x) = x, q(x) = − cos x értékeket, és azt kapjuk,
hogy Z x sin x dx = −x cos x + sin x. Számítsuk ki parciális integrálással a következő integrálokat: R (130) xex dx. R (131) x2 cos x dx. (Útmutatás: Alkalmazzuk (II)-t kétszer egymás után.) R (132) xa ln x dx. (a 6= −1). R (133) x2 ex dx. (Útmutatás: használjuk a 130. feladatot.) R Az sinm x dx integrál parciális integrálása π figyelemre méltó végtelen szorzat alakjában való kifejtésére vezet. Levezetésére írjuk a sinm x függvényt sinm−1 x · sin x alakba és integráljuk 0 és π/2 határok között parciális integrálás alkalmazásával. Az Z π/2
Z π/2 sin x dx = (m − 1)
sinm−2 x cos2 x dx =
m
0
0
Z π/2
Z π/2 sin x dx + (m − 1)
sinm−2 x dx,
m
= −(m − 1) 0
0
vagy Z π/2
m−1 sin x dx = m
Z π/2 sinm−2 x dx
m
0
0
képletet kapjuk, mivel jelen esetben (II) jobb oldalának első tagja, pq, 0 és π/2 értékekre nulla. Az utolsó képlet ismételt alkalmazásával a következő formulákat kapjuk Im =
659
Rπ/2 0
sinm x dx integrálra (a képletek különbözőek aszerint, hogy m páros vagy páratlan): I2n = I2n+1 =
2n − 1 2n − 3 1 π · · ... · , 2n 2n − 2 2 2 2n 2n − 2 2 · · ... . 2n + 1 2n − 1 3
Mivel ha x a 0 < x < π/2 intervallumban változik, sin x a 0 < sin x < 1 intervallumban, sin2n−1 x > sin2n x > sin2n+1 x, úgyhogy I2n−1 > I2n > I2n+1
lásd 496. o.
vagy I2n I2n−1 > > 1. I2n+1 I2n+1 Behelyettesítve ezekbe az egyenlőtlenségekbe a fent I2n−1 stb. számára kiszámított értékeket, azt kapjuk, hogy 2n + 1 1 · 3 · 3 · 5 · 5 · 7 . . . (2n − 1)(2n − 1)(2n + 1) π > · > 1. 2n 2 · 2 · 4 · 4 · 6 · 6 . . . (2n)(2n) 2 Ha most n → ∞, látjuk, hogy a közbülső tag 1-hez tart, tehát Wallis előállítását kapjuk π/2-re: π 2 · 2 · 4 · 4 · 6 · 6 . . . (2n)(2n) . . . = = 2 1 · 3 · 3 · 5 · 5 · 7 . . . (2n − 1)(2n − 1)(2n + 1) . . . = lim
660
24n (n!)4 , [(2n)!]2 (2n + 1)
ha n → ∞.
Javaslat, további olvasmányokra Általános művek Ahrens, W.: Mathematische Unterhaltungen und Spiele, 1–2. kötet, 2. kiadás, Leipzig, 1910–1918, Teubner. Ball, W. W. Rouse: Mathematical Recreations and Essays, 11. kiadás, H. S. M. Coxeter gondozásában, New York, 1940, Macmillan. Bell, E. T.: The Development of Mathematics, 2. kiadás, New York, 1940, McGrawHill. Bell, E. T.: Men of Mathematics, New York, 1937, Simon and Schuster. Dantzig, T.: Aspects of Science, New York, 1937, Macmillan. Dresden, A.: An Invitation to Mathematics, New York, 1936, Holt. Enriques, F.: Questioni riguardanti le matematiche elementari, 1–2. kötet, 3. kiadás, Bologna, 1924–1926, Zanichelli. Kasner, E. – Newman, J.: Mathematics and the Imagination, New York, 1940, Simon and Schuster. Klein, F.: Elementarmathematik vom höheren Standpunkte aus, 1–2. kötet, 3. kiadás, Berlin, 1924–1925, Springer. Kraitchik, M.: La mathématique des jeux ou récréations mathématiques, 2. kiadás, Bruxelles–Paris, 1953. Neugebauer, O.: Vorlesungen über Geschichte der antiken mathematischen Wissenschaften Erster Band: Vorgriechische Mathematik. Berlin, 1934, Springer. Poincaré, H.: Science et hypothèse, Paris, 1902, Flammarion. Poincaré, H.: Science et méthode, Paris, 1908, Flammarion. Rademacher, H. – Toeplitz, O.: Von Zahlen und Figuren, 2. kiadás, Berlin, 1933, Springer. Russell, B.: Introduction to Mathematical Philosophy, London, 1924, Allen and
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173511+02’00’
661
Unwin. Russell, B.: The Principles of Mathematics, 2. kiadás, New York, 1938, Norton. Smith, D. E.: A Source Book in Mathematics, New York, 1929, McGraw-Hill. Steinhaus, H.: Matematikai kaleidoszkóp, (magyar fordítás), Bp., 1951, Művelt Nép Vanderwaerden, B. L.: Erwachende Wissenschaft, Basel, 1956, Birkhauser. Weyl, H.: „The Mathematical Way of Thinking”, Science, 92, 437. és köv. old., 1940. Weyl, H.: Philosophie der Mathematik und Naturwissenschaft, Handbuch der Philosophie, 2. kötet 3–162 old., München, 1926, Oldenbourg.
I. fejezet Dickson, L. E.: Introduction to the Theory of Numbers, Chicago, 1931, University of Chicago Press. Dickson, L. E.: Modern Elementary Theory of Numbers, Chicago, 1939, University of Chicago Press. Hardy, G. H.: „An Introduction to the Theory of Numbers”, Bulletin of the American Mathematical Society, 35, 789. és köv. old., 1929. Hardy, G. H. – Wright, E. M.: An Introduction to the Theory of Numbers, Oxford, 1938, Clarendon Press. Uszpenszkij, J. V. – Heaslet, M. H.: Elementary Number Theory, New York, 1939, McGrawHill. Hasse, H.: Vorlesungen über Zahlentheorie, Berlin – Göttingen – Heidelberg, 1950, Springer.
II. fejezet Birkhoff, G. – MacLane, S.: A Survey of Modern Algebra, New York, 1941, Macmillan. Black, M.: The Nature of Mathematics, New York, 1935, Harcourt. Dantzig, T.: Number, the Language of Science, 3. kiadás, New York, 1939, Macmillan. Enriques, F.: The Historic Development of Logic, translated by J. Rosenthal. New York, 1920, Holt.
662
Fraenkel, A.: Einleitung in die Mengenlehre, 3. kiadás, Berlin, 1928, Springer. Hardy, G. H.: A Course of Pure Mathematics, 10. kiadás, Cambridge, 1952, Cambridge University Press. Hilbert, D. – Ackermann, W.: Grundzüge der theoretischen Logik, 4. kiadás, Berlin, Göttingen, Heidelberg, 1950, Springer. Knopp, K.: Theorie und Anwendung der unendlichen Reihen, 4. kiadás, Berlin – Göttingen – Heidelberg, 1957, Springer. Tarski, A.: Introduction to Logic, New York, 1939, Oxford University Press.
III. fejezet Artin, E.: Galoissche Theorie, Leipzig, 1959, Teubner. Bieberbach, L.: Theorie der geometrischen Konstruktionen, Basel, 1952, Birkhauser. Coolidge, J. L.: A History of Geometrical Methods, Oxford, 1940, Clarendon Press. Dickson, L. E.: New First Course in the Theory of Equations, New York, 1939, Wiley. Enriques, F.: Fragen der Elementargeometrie, 1–2. kötet, 2. kiadás, Leipzig, 1923, Teubner. Hasse, H.: Höhere Algebra, 1–2. kötet, Sammlung Göschen, Bd. 931–932, Berlin, 1951, Gruyter. Hobson, E. W.: „Squaring the Circle”, a History of the Problem, Cambridge, 1913, Cambridge University Press. Kempe, A. B.: How to Draw a Straight Line, London, 1877, Macmillan Klein, F.: Famous Problems of Geometry, translated by W. W. Beman and D. E. Smith, 2. kiadás, New York, 1930, Stechert. Mascheroni, L.: La geometria del compasso, Palermo, 1901, Reber. Mohr, G.: Euclides Danicus, Copenhagen, 1928, Holst. De Morgan, A.: A Budget of paradoxes, 1–2. kötet, Chicago, 1915, Open Court. Thomas, J. M.: Theory of Equations, New York, 1938, McGraw-Hill. Weisner, L.: Introduction to the Theory of Equations, New York, 1939, Wiley.
663
IV. fejezet Blaschke, W.: Projektive Geometrie, 3. kiadás, Basel – Stuttgart, 1954, Birkhauser. Coxeter, H. S. M.: Non-Euclidian Geometry, 3. kiadás, Toronto, 1957, University of Toronto Press. Graustein, W. C.: Introduction to Higher Geometry, New York, 1930, Macmillan. Hessenberg, G.: Grundlagen der Geometrie, Berlin – Leipzig, 1930, Gruyter. Hilbert, D.: Grundlagen der Geometrie, 8. kiadás, Stuttgart, 1956, Teubner. O’Hara, C. W. – Ward, D. R.: An Introduction to Projective Geometry, Oxford, 1937, Clarendon Press. Robinson, G. de B.: The Foundations of Geometry, 4. kiadás, Toronto, 1959, University of Toronto Press. Saccheri, Girolamo: Euclides ab omni naevo vindicatus, angolra fordította G. B. Halsted, Chicago, 1920, Open Court. Sanger, R. G.: Synthetic Projective Geometry, New York, 1939, McGraw-Hill. Veblen, O. – Young, J. W.: Projective Geometry, 1–2. kötet, Boston, 1910–1918, Ginn. Young, J. W.: Projective Geometry, Chicago, 1930, Open Court.
V. fejezet Alexandroff, P.: Einfachste Grundbegriffe der Topologie, Berlin, 1932, Springer. Hilbert, D. – Cohn-Vossen, S.: Anschauliche Geometrie, Berlin, 1932, Springer. Newman, M. H. A.: Elements of the Topology of Plane Sets of Points, Cambridge, 1939, Cambridge University Press. Selfert, H. – Threlfall, W.: Lehrbuch der Topologie, Leipzig, 1934, Teubner.
VI. fejezet Barnard, S. – Child, J. M.: Advanced Algebra, London, 1939, Macmillan. Courant, R.: Vorlesungen über Differential- und Integralrechnung, 3. kiadás, Berlin – Göttingen – Heidelberg, 1955, Springer. Ferrar, W. L.: A Text-book of Convergence, Oxford, 1938, Clarendon Press.
664
A lánctörtekre vonatkozóan lásd pl.: Hardy, G. H.: A Course of Pure Mathematics, 10. kiadás, Cambridge, 1952, Cambridge University Press. Perron, O.: Die Lehre von den Kettenbrüchen, 1–2. kötet, 3. kiadás, Stuttgart, 1954–1957, Teubner.
VII. fejezet Courant, R.: „Soap Film Experiments with Minimal Surfaces”, American Mathematical Monthly, 47, 167–174, 1940. Plateau, J.: „Sur les figures d’équilibre d’une masse liquide sans pésanteur”, Mémoires de l’Académie Royale de Belgique, nouvelle série 23, 1849. Plateau, J.: Statique expérimentale et théorétique des Liquides, Paris, 1873.
VIII. fejezet Boyer, C. B.: The Concepts of the Calculus, New York, 1939, Columbia University Press. Courant, R.: Vorlesungen über Differential- und Integralrechnung, 1–2. kötet, 3. kiadás, Berlin, Göttingen, Heidelberg, 1955, Springer. Hardy, G. H.: A Course of Pure Mathematics, 10. kiadás, Cambridge, 1952, Cambridge University Press. Osztrovszkij, A.: Vorlesungen über Differential- und Integralrechnung, 1–2. kötet, 2. kiadás, Basel – Stuttgart, 1960, Birkhauser. Toeplitz, O.: Die Entwicklung der Infinitesimalrechnung, Berlin – Göttingen – Heidelberg, 1949, Springer.
665
666
Javaslat, további újabb olvasmányokra Általános művek Albers, D. J. és lexanderson, G. L. (szerk.): Mathematical People, Boston, 1985, Birkhäuser. Albers, D. J., Alexanderson, G. L. és Reid, Constance (szerk.): Mathematical People, New York, 1990, Academic Press. Bollobás, B. (szerk.): Littlewood’s Miscellany, Cambridge, 1986, Cambridge University Press. Casti, J. L.: Complexification, New York, 1994, HarperCollins. Cohen, J. és Stewart, I.: The Collapse of Chaos, New York, 1993, Viking. COMAP (szerk.): For All Practical Purposes, New York, 1994, Freeman. Davis, P. J. és Hersh, R.: The Mathematical Experience, Boston, 1981, Birkhäuser. Davis, P. J. és Hersh, R.: Descartes’ Dream, Brighton, 1986, Harvester. Devlin, K.: All the Math That’s Fit to Print, Washington, 1994, Mathematical Association of America. Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Devlin, K.: Mathematics, the Science of Patterns, New York, 1994, Scientific American Library. Ekeland, I.: The Broken Dice, Chicago, 1993, University of Chicago Press. Ekeland, I.: Mathematics and the Unexpected, Chicago, 1988, University of Chicago Press. Gilbert, G. T., Krusemeyer, M. I. és Larson, C.: The Wohascum County Problem Book, Dolciani Mathematical Expositions 14, Washington, 1993, Mathematical Association of America. Golubitsky, M. és Field, M. J.: Symmetry in Chaos, Oxford, 1992, Oxford University Press.
pdf létrehozva: 2022. május 26. 11:30 tex módosítva: D:20220525173520+02’00’
667
Guillen, M.: Bridges to Infinity, London, 1983, Rider. Honsberger, R.: Ingenuity in Mathematics, Washington, 1970, Mathematical Association of America. Honsberger, R.: Mathematical Gems I, Dolciani Mathematical Expositions 1, Washington, 1973, Mathematical Association of America. Honsberger, R.: Mathematical Gems II, Dolciani Mathematical Expositions 2, Washington, 1974, Mathematical Association of America. Honsberger, R.: Mathematical Gems III, Dolciani Mathematical Expositions 9, Washington, 1985, Mathematical Association of America. Jacobs, K.: Invitation to Mathematics, Princeton, 1992, Princeton University Press. Kline, M.: Mathematical Thought from Ancient to Modern Times, Oxford, 1972, Oxford University Press. Maor, E.: e: The Story of a Number, Princeton, 1994, Princeton University Press. Newman, J. R. (szerk.): The World of Mathematics, 4 kötetben, New York, 1956, Simon and Schuster. Peterson, I.: The Mathematical Tourist, New York, 1988, Freeman. Reid, C.: Courant: In Goettingen and New York, New York, 1976, Springer-Verlag. Ruelle, D.: Chance and Chaos, Princeton, 1991, Princeton University Press. Schroeder, M.: Chaos, Fractals, Power Laws, New York, 1991, Freeman. Stewart, I.: Concepts of Modern Mathematics, New York, 1995, Dover. Stewart, I.: Does God Play Dice?, Oxford, 1989, Blackwell. Stewart, I.: From Here To Infinity, Oxford, 1996, Oxford University Press. Stewart, I.: Nature’s Numbers, New York, 1995, Basic Books. Stewart, I.: The Problems of Mathematics, Oxford, 1992, Oxford University Press. Stewart, I. és Golubitsky, M.: Fearful Symmetry, Oxford, 1992, Blackwell. Sved, M.: Journey Into Geometries, Washington, 1991, Mathematical Association of America.
668
IX. fejezet 1. §. Prímeket előállító képletek Davis, M., Matijasevic, Y. és Robinson, J.: “Hilbert’s Tenth Problem. Diophantine Equations: Positive Aspects of a Negative Solution”, in Proceedings of Symposia in Pure Mathematics 28: Mathematical Developments Arising from Hilbert Problems, pp. 323–378, Washington, 1976, American Mathematical Society. Davis, M. és Hersh, R.: “Hilbert’s Tenth Problem.”, Scientific American, 229, no. 5, pp 84–91, 1973. Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Jones, J. P., Sato, D., Wada, H. és Wiens, D.: “Diophantine Representation of the Set of Prime Numbers.”, American Mathematical Monthly, 83, pp 449–464, 1976. Stewart, I.: Concepts of Modern Mathematics, New York, 1995, Dover. 2. §. A Goldbach-sejtés és az ikerprímek Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Yuan, W.: Goldbach Conjecture, Singapore, 1984, World Scientific. 3. §. A nagy Fermat-tétel Bell, E. T.: The Last Problem, Washington, 1990, Mathematical Association of America. Cox, D.: “Introduction to Fermat’s Last Theorem.” American Mathematical Monthly, 101, 1994: 3–14. Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Katz, I.: “Fame by Numbers.” The Guardian Weekend, April 8, 1995, pp. 34–42. Ribenboim, P.: Thirteen Lectures on Fermat’s Last Theorem, New York, 1979, Springer-Verlag. Rubin, K. és Silverberg, A.: “A Report on Wiles’ Cambridge Lectures.” Bulletin of the American Mathematical Society, 31, pp. 15–38, 1994.
669
Stewart, I.: “Fermat’s Last Time Trip.” Scientific American, 269, no. 5, pp. 85–88, 1993. Stewart, I.: From Here To Infinity, Oxford, 1996, Oxford University Press. Stewart, I.: The Problems of Mathematics, Oxford, 1992, Oxford University Press. 4. §. A kontinuum-hipotézis Bernays, P.: Axiomatic Set Theory, New York, 1991, Dover. Cohen, P. J. és Hersh, R.: “Non-Cantorian Set Theory.” In Mathematics in the Modern World, szerk. Kline, M. San Francisco, 1979, Freeman. Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Hatcher, W. S.: The Logical Foundations of Mathematics, Oxford, 1982, Pergamon Press. Lavine, S.: Understanding the Infinite, Cambridge, 1994, Harvard University Press. Stewart, I.: “A Subway Named Turing.” Scientific American, 271, no. 3, pp. 90–92, 1994. Vaught, R. L.: Set Theory: An Introduction, Boston, 1985, Birkhäuser. 5. §. Halmazelméleti jelölések Stewart, I.: Concepts of Modern Mathematics, New York, 1995, Dover. Vaught, R. L.: Set Theory: An Introduction, Boston, 1985, Birkhäuser. 6. §. A négyszín-tétel Appel, K. és Haken, W.: “The Four-Color Problem.” In Mathematics Today, szerk. Steen, L. A., New York, 1978, Springer. Appel, K. és Haken, W.: “The Four-Color Proof Suffices.” The Mathematical Intelligencer, 8, no. 1, pp 10–20, 1986. Devlin, K.: Mathematics: The New Golden Age, Harmondsworth, 1988, Penguin. Ringel, G.: Map Color Theorem, New York, 1974, Springer. Saaty, T. L.: “Remarks on the Four-Color Problem: The Kempe Catastrophe.” Mathematics Magazine, 40, pp 31–36, 1967. Stewart, I.: From Here To Infinity, Oxford, 1996, Oxford University Press.
670
Stewart, I.: The Problems of Mathematics, Oxford, 1992, Oxford University Press. Stewart, I.: “The Rise and Fall of the Lunar M-pire.” Scientific American, 268, no. 4, pp 90–91, 1993. 7. §. Hausdorff-dimenziók és fraktálok Barnsley, M. F.: Fractals Everywhere, Boston, 1993, Academic Press. Mandelbrot, B. B.: The Fractal Geometry of Nature, New York, 1982, Freeman. Peitgen, H. O., Jürgens, H. és Saupe, D.: Chaos and Fractals, New York, 1992, Springer-Verlag. Stewart, I.: From Here To Infinity, Oxford, 1996, Oxford University Press. Stewart, I.: The Problems of Mathematics, Oxford, 1992, Oxford University Press. 8. §. Csomók Ashley, C. W.: The Ashley Book of Knots, London, 1947, Faber and Faber. Freyd, P., Freyd, P., Yetter, D., Hoste, J., Lickorish, W. B. R., Millett, K. és Ocneanu, A.: “A new Polynomial Invariant of Knots and Links.” Bulletin of the American Mathematical Society, 12, pp 239–246, 1985. Jones, V. F. R.: “A Polynomial Invariant for Knots via von Neumann Algebras.” Bulletin of the American Mathematical Society, 12, pp 103–111, 1985. Jones, V. F. R.: “Knot Theory and Statistical Mechanics.” Scientific American, 263, no. 5, pp 52–57, 1990. Lickorish, W. B. R. és Millett, K. C.: “The New Polynomial Invariants of Knots and Links.” Mathematics Magazine, 61, pp 3–23, 1988. Livingstone, C.: Knot Theory, Carus Mathematical Monographs 24, Washington, 1993, Mathematical Association of America. Stewart, I.: From Here To Infinity, Oxford, 1996, Oxford University Press. Stewart, I.: “Knots, Links, and Videotape.” Scientific American, 270, no. 1, pp 136–138, 1994. Stewart, I.: The Problems of Mathematics, Oxford, 1992, Oxford University Press.
671
9. §. Egy mechanikai probléma Poston, T.: “Au Courant with Differential Equations.” Manifold, 18, pp 6–9, 1976. tavasza. Stewart, I.: Game, Set and Math, Oxford, 1989, Blackwell. 10. §. A Steiner-féle probléma Bern, M. W. és Graham, R. L.: “The Shortest-Network Problem.” Scientific American, 260, no. 1, pp 66–71, 1989. Gilbert, E. N. és Pollak, H. O.: “Steiner Minimal Trees.” SIAM Journal of Applied Mathematics, 16, pp 1–29, 1968. Melzak, Z. A.: Companion to Concrete Mathematics, New York, 1973, Wiley. Stewart, I.: “Trees, Telephones, and Tiles.” New Scientist, 1795, pp 26–29, 1991. Winter, P.: “Steiner Problems in Networks: A Survey.” Networks, 17, pp 129–167, 1987. 11. §. Szappanhártyák és minimum-felületek Almgreen, F. J. Jr.: “Minimal Surface Forms.” The Mathematical Intelligencer, 4, no. 4, pp 164–171, 1982. Almgreen, F. J. Jr.: Plateau’s Problem, and Introduction to Varifold Geometry, New York, 1966, Benjamin. Almgreen, F. J. Jr. és Taylor, J. E.: “The Geometry of Soap Films and Soap Bubbles.” Scientific American, 235, no. 1, pp 82–93, 1976. Isenberg, C.: The Science of Soap Films and Soap Bubbles, New York, 1992, Dover Publications. 12. §. Nemsztenderd analízis Dauben, J. W.: Abraham Robinson: The Creation of Nonstandard Analysis, Princeton, 1995, Princeton University Press. Hurd, A. E. és Loeb, P. A.: An Introduction to Nonstandard Real Analysis, New York, 1985, Academic Press.
672
Keisler, M. J.: Foundations of Infinitesimal Calculus, New York, 1976, Prindle, Weber and Schmidt. Robinson, A.: Introduction to Model Theory and to the Metamathematics of Algebra, Amsterdam, 1963, North-Holland. Stroyan, K. D. és Luxemburg, W. A. U.: Introduction to the Theory of Infinitesimals, New York, 1985, Academic Press.
673
674