139 7 219MB
Hungarian Pages 508 [512] Year 1966
l.V)lI.L VWH~ VW V IW SNIHHOll "H - rnVllOO:::> "ll
R. COURANT
- H. ROBBINS
MI A MATEMATIKA? tÓ,
,
•
GONDOLAT
KÖNYVKIADÓ
. BUDAPEST,
1966
A mű eredeti cime: R. Courant-H.
©
Robbins: WHAT IS MATHEMATICS?
Richard Courant, New York, 1941
Fordította:
VEKERDI LÁSZLÓ
A fordítást ellenőrizte: LUKÁCS ERNŐNÉ
Tartalomjegyzék Az első kiadás előszava .............................................••.. A második, harmadik és negyedik kiadás előszava Hogyan használjuk ezt a könyvet Mi a matematika?
~. : : .. ............................
13 15 16 17
I. fejezet A természetes számok Bevezetés
.
23 23
1. § Számolás egész számokkal .....•....................................... 1. Az aritmetika törvényei , 2. Pozitív egész számok jelölése 3. Számolás nem tízes számrendszerekben
. . .
2. § A számrendszer végtelen voltáról. A matematikai indukció 1. A matematikai indukció elve 2. Számtani sor 3. Geometriai sor 4. Az első n egész szám négyzetének összege 5. Egy fontos egyenlőtlenség 6. A binomiális tétel 7. További megjegyzések a matematikai indukcióról
. . . . . . . .
31 31 34 35 36
. ~.
42 42
. . . . . . .
42 42 46 46 47 48 51
. . .
52 52 57
:
24 24 26
29
37
38
40
Kiegészítés az I. fejezethez Számelmélet Bevezetés 1. § Prímszámok 1. Alapvető tények 2. A prímszámok eloszlása a) Prímszámokat előállító képletek b) Prímszámok a számtani sorokban c) A prímszámtétel d) Két, prímszámokra vonatkozó megoldatlan 2. § Kongruenciák -: 1. Alapfogalmak 2. A kis Fermat-tétel 3. Kvadratikus maradékok
:
probléma
58
5
3. § Püthagoraszi
számok és Fermat elveszett tétele (a "nagy Fermát-tétel")
......
60
4. § Euklidészi algoritmus 1. Általános elmélet ................................................ 2. Az aritmetika alaptételének alkalmazása 3. Az Euler-féle q:>-függvény.Újból a kis Fermat-tétel . . . . . . . . . . . . . . . . . .. 4. Lánctörtek. Diophantoszi egyenletek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
62 62 66 67 68
II. fejezet A "matematika Bevezetés
számrendszere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
72
1. § A racionális számok 1. Racionális számok mint a mérés eszközei ' . . . . . . . .. 2. A racionális számok elméleti szükségessége. Az általánosítás elve 3. Racionális számok geometriai értelmezése ..... '. . . . . . . . . . . . . . . . . . . . . . ..
12 12 74 17
2. § Inkommenzurábilis szakaszok, irracionális számok, határérték 1. Bevezetés , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. Tizedes törtek. Végtelen tizedes törtek 3. Határérték. Végtelen geometriai sorok 4. Racionális számok és szakaszos tizedes törtek . . . . . . . . . . . . . . . . . . . . . . .. 5. Irracionális számok általános definíciója intervallumskatulyázással . . . .. 6. Más módszerek irracionális számok definiálására. Dedekind-szelet
78 78 80 83 86 88 90
3. § Néhány megjegyzés az analitikus geometriával kapcsolatban .. . . . . . . . . . . .. 1. Alapelvek 2. Az egyenes egyenlete. Görbék egyenletei .. . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
92 92 93
4. § A végtelen matematikai analizise 1. Alapfogalmak :.............................. 2. A racionális számok megszámlálhatósága és a kontinuum nemmegszárnlálhatósága............................................................. 3. A Cantor-féle "számosságok" ......... . 4. Az indirekt bizonyítás 5. A végtelen paradoxonai 6. A matematika alapjai ........•.....................................
96 96 98 102 104 105 106
5. § Komplex számok 1. A komplex számok eredete 2. A komplex számok geometriai szemléltetése 3. A de Moivre-képlet és az egységgyökök 4. Az algebra alaptétele
,'107 107 110 115 118
6. § Algebrai és transzcendes számok 1. Definíciójuk és létezésük 2. Liouville tétele és transzcendens Kiegészítés A halmazalgebra
elemei
1. Általános elmélet
6
számok előállítása l.
120 120 121
II. fejezethez 126 126
2. A halmazalgebra alkalmazása a matematikai logikában 3. A halmazalgebra alkalmazásáról a valószínűségszámításban
130 132
III. fejezet 135 135
Geometriai szerkesztések. Számtestek algebrája Bevezetés I. rész A megoldhatatlan ság bizonyítása és az algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
138
1. § Alapvető geometriai szerkesztések 1. A négy alaprnűvelet és a gyökvonás mint szerkesztések 2. Szabályos sokszögek 3. Az Apollóniosz-féle feladat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. - 2. § Megszerkeszthető számok és számtestek 1. Általános elmélet 2. Minden megszerkeszthető szám algebrai szám
138 138 140 142 144 144 150
3. § A három görög probléma megoldhatatlansága 151 1. A kocka megkettőzése 151 2. Egy harmadfokú egyenletekre vonatkozó tétel ...............•......... 153 3. A szög harmadolása 154 4. A szabályos hétszög . . . . . . . . . . . . . .. 156 5. Néhány megjegyzés a kör négyszögesítéséről ,....... 157 II. rész 157
Különféle szerkesztési módszerek 4. § Geometriai
transzformációk.
Az inverzió
157
1. Általános megjegyzések. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 157 2. Az inverzió tulajdonságai " 159 3. Inverz pontok geometriai megszerkesztése 160 4. Vonalszakasz megfelezése és a kör középpontjának meghatározása pusztán körző használatával ...............................................• 162 5. § Egyéb segédeszközöket használó szerkesztések. Mascheroni-féle szerkesztések pusztán körző használatával " ., 163 1. A kocka megkettőzésének klasszikus szerkesztési módja 163 2. A körző geometriája 164 3. Rajzolás mechanikus eszközökkel. Mechanikus görbék. Cikloisok 168 4. Csuklós szerkezetek. Peaucellier-féle és Hart-féle invezorok . . . . . . . . . . . . .. 170 6. § Az inverzió néhány sajátsága és alkalmazása . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 173 1. Szögállandóság. Körseregek 173 2. Alkalmazás az Apollóniosz-féle feladatok megoldására 176 3. Többszörös tükrözések . . . . . . . . . . . . . . . . . .. 177 IV. fejezet Projektív geometria. Axiomatika.
Nem-euklidészi
1. § Bevezetés 1. Geometriai tulajdonságok 2. Projektív transzformációk
geometriák
osztályozása.
Transzformációk
180 invariánsai _..
180 180 182
7
2. § Alapfogalmak 183 1. A projektív transzformációk csoportja 183 2. Desargues tétele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 185 3. § Kettősviszony . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 187 1. A kettősviszony definíciója és invariáns voltának bizonyítása 187 2. A teljes négyoldal 193 4. § Párhuzamosság és végtelen 1. Végtelen távoli pontok mint "ideális pontok" 2. Ideális elemek és projekció 3. Kettősviszony végtelen távoli elemekkel 5. § Alkalmazások l. Előzetes megjegyzések 2. A síkbeli Desargues-tétel bizonyítása 3. Pascal tétele 4. Brianchon tétele 5. A dualitás elvéről
194 194 197 199 199 199 201 202 . . . .. 203 204
6. § Analitikus előállítási mód 1. Bevezető megjegyzések 2. Homogén koordináták. A dualitás algebrai alapja
205 205 206
7. § Vonalzó használatával
209
megszerkeszthető
feladatok
8. § Kúpszeletek és másodrendű felületek 1. Kúpszeletek elemi metrikus geometriája . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. Kúpszeletek projektív tulajdonságai 3. Kúpszelet mint burkológörbe 4. A kúpszeletekre vonatkozó általános Pascal- és Brianchon-féle tételek . . . .. 5. A hiperboloid 9. § Axiomatika és nem-euklidészi geometria 1. Az axiomatikus módszer 2. Hiperbolikus nem-euklidészi geometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. Geometria és valóság 4. A Poincaré-féle modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. Elliptikus vagy Riemann-féle geometria
211 211 214 217 221 223 224 224 228 232 233 234
Függelék Több dimenziós terek geometriája 1. Bevezetés 2. Analitikus eljárás 3. Geometriai vagy kombinatorikus
eljárás
236 236 236 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 239
V. fejezet Topológia Bevezetés 1. § Euler poliéder tétele 2. § Az alakzatok topologikus tulajdonságai l. Topologikus tulajdonságok 2. Összefüggés
243 243 244 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 248 248 250
3. § További példák topológiai tételekre 1. Jordan-féle síkgörbetétel 2. A négyszínprobléma 3. A dimenzió fogalma 4. Egy fixponttétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. Csomók 4. § Felületek topológiai osztályozása 1. A felületek nemszáma 2. A felület Euler-féle karakterisztikája 3. Egyoldalú felületek
251 251 252 254 257 260
261 261 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 263 264
Függelék 1. Az ötszíntétel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 268 2. A Jordan-tétel sokszögek esetében .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 270 3. Az algebra alaptétele 272 VI. fejezet Függvény és határérték. Bevezetés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 275 275
1. § Változók és függvények 1. Definiciók és példák 2. Az ívmérték 3. A függvény grafikus ábrázolása. 4. Összetett függvények 5. Folytonosság 6. Több változós függvények 7. Függvény és transzformáció
Inverz függvény
. . . . .
276 276 280 281 284 285 287 290
2. § Határérték 1. Az an sorozat határértéke 2. Monoton sorozatok 3. Az Euler-féle e szám 4. A :rt szám 5. Lánctörtek
291 291 296 298 300· 302
3. § Függvény határértéke folytonos megközelítéssel 1. Bevezetés. Általános definíció 2. Megjegyzések a határérték fogalmáról
305 305 306
3. A sin x sin határértéke x 4. Határérték, ha x ->- ee 4. § A folytonosság
308 ••.••.••..••
: .••••••..•••••.••••.•••••••..••••
310
pontos definíciója
311
5. § A folytonos függvények elméletének két alapvető tétele
314
1. 2. 3. 4.
Bolzano tétele Bolzano tételének bizonyítása Weierstrass tétele szélső értékek létezéséről Egy sorozatokra vonatkozó tétel. Zárt halmazok
314 314 315 317
,6. § Bolzano tételének néhány alkalmazása. 1. Geometriai alkalmazások 2. Egy mechanikai probléma
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 318 318 321
Kiegészítés a VI. fejezethez További példák a határértékre
és a folytonesságra
323
1. § Példák ahatárértékre 1. Általános megjegyzések 2. q" határértéke
323 323 323
yp
3. határértéke 4. A szakadásos függvények mint folytonos függvények határértéke 5. Határérték kiszámítása iterációval
324 . . . . . . . .. 326 327
2. § Példa a folytonosságrá
328 VII. fejezet
Szélső értékek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 330 Bevezetés
330
1.*
331 331 331 333
Elemi geometriai feladatok , 1. Háromszög maximális területe, ha a háromszög két oldala adott 2. Héron-tétele. A fénysugarak szélső érték tulajdonsága 3. A Héron-tétel alkalmazása háromszög-feladato kra 4. Az ellipszis és hiperbola érintési tulajdonságai. Megfelelő szélső érték tulajdonságok .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. Adott görbék extrém távelságai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
2. § Szélső érték problémák 1. Az elv 2. Példák
egyik általános
alapelve
3. § Stacionárius pontok és a differenciálszámítás 1. Szélső értékek és stacionárius pontok 2. Több változós függvények maximuma és minimuma. 3. Minimax pontok és a topológia 4. A pont távolsága egy felülettől
10
333 336
338 , 338 339
Nyeregpontok
341 341 342 344 345
4. § A Schwarz-féle háromszögprobléma 1. Schwarz bizonyítása 2. Másik bizonyítás 3. Tompaszögű háromszög . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. Háromszögek fénysugarakból 5. Néhány megjegyzés tükrözési problémákról és ergodikus mozgásról
345 345 347 349 350 351
5. § Steiner-féle probléma 1. A probléma megoldása 2. A két lehetőség elemzése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. Egy komplementer probléma 4. Megjegyzések és feladatok 5. Általánosítás úthálózat-probléma esetére
352 352 353 355 356 356
.6. § Szélső pontok és egyenlőtlenségek 1. Két pozitív mennyiség aritmetikai 2. Általánosítás n változó esetére 3. A legkisebb négyzetek elve
. . . . . . . . . . . . . . . . . . . . . . . . . . . .. és geometriai közepe
358 358 360 361
7. § Szélső pont létezése. Dirichlet-féle elv 1. Általános megjegyzések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. Példák 3. Elemi szélső érték problémák 4. A bonyolultabb esetek nehézségeiről
362 362 364 366 367
.s. §
Az izoperimetrikus
probléma.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 369
9. § Szélső érték feladatok kerületi feltételekkel. az izoperimetrikus probléma között
Összefüggés Steiner problémája
és 371
10. § Yariációszámítás 1. Bevezetés 2. Variációszámítás. Fermat elve az opti kában .. . . . . . . . . . . . . . . . . . . . . . . . .. 3. Bernoulli módszere a brachistochrone-probléma megoldására 4. Geodetikus vonalak a gömbön. Geodetikus vonalak és maximinimumok ..
374 374 375 377 379
11. § Minimumproblémák kísérleti megoldása. Szappanbuborék-kísérletek 1. Bevezetés 2. Szappanbuborék-kísérletek 3. A Plateau-probléma körébe tartozó új kísérletek 4. Egyéb matematikai problémák kísérleti megoldása . . . . . . . . . . . . . . . . . . . ..
380 380 380 381 385
VIII. fejezet Az integrál- és differenciálszámítás
390
Bevezetés 1. § Az integrál 1. Terület mint határérték , 2. Az integrál 3. Általános megjegyzések az integrálfogalomról. 4. Példák integrálásra, x" integrálása 5. Az integrálszámítás szabályai
390
Általános definíció
391 391 393 396 397 402
2. § A derivált 1. A derivált mint érintő irány tangense 2. A derivált mint határérték 3. Példák 4. A trigonometrikus függvények derivált jai ........................•.... 5. Differenciálás és folytonosság 6. Derivált és sebesség. Második derivált és gyorsulás 7. A második derivált geometriai jelentése 8. Maximum és minimum
406 406 407 409 413 414 414 417 418
3. § A differenciálás technikája
418
4. § Leibniz jelölése és a "végtelen kicsiny"
424
II
5. § Az integrál- és differenciálszámítás alaptétele 1. Az alaptétel 2. Első alkalmazások. x', cos x, sin x, arc tg x integrálása 3. Leibniz formulája n: meghatározására
427 427 430' 432
6. § Az exponenciális függvény és a logaritmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. A logaritmus definíciója és tulajdonságai. Az Euler-féle e szám 2. Az exponenciális függvény 3. Képletek e, aZ, x', differenciálására 4. e, e", ln x határértékként való explicit kifejezése 5. Végtelen sorok a logaritmusra. Numerikus számítások
434 434 437 439' 440; 442
7. § Differenciálegyenletek 1. Definíció 2. Az exponenciális függvény differenciálegyenlete. vekedés törvénye. Kamatos kamat 3. További példák. Legegyszerűbb rezgőmozgások 4. Newton dinamikai alaptörvénye
445 445 Radioaktív
bomlás. A nö4"46· 449 451
Kiegészítés a VIII. fejezethez 1. § Elvi kérdések 1. Differenciálhat6ság 2. Az integrál 3. Az integrálfogalom
egyéb alkalmazásai.
Munka. Hosszúság
2. § Nagyságrend 1. Az exponenciális függvény és x hatványai 2. In(n!) nagyságrendje
454 . 454 . 456 . 457 . 460 . 460 . 462
3. § Végtelen sorok és végtelen sorozatok . 464 1. Végtelen függvénysorok : . 464 2. Euler képlete: cos x+ i sin x = elz •.......•..•••.••.•..•..•........•... 469 3. A harmonikus sor és a zéta-függvény. Euler végtelen sora a sinusfüggvényre 471 4. § A prímszámtéte1 bevezetése statisztikus módszerrel
474
Függelék Kiegészítő megjegyzések, problémák és feladatok Aritmetika és algebra Analitikus geometria Geometriai szerkesztések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. A projektív és a nem-euklidészi geometria '. . . . . .. Topológia Függvény, határérték és folytonosság Maximumok és minimumok A differenciál- és integrálszámítás Az integrálás technikája
479 479' 481 487 487 489 491 492 494 496
Javaslat további olvasmányokra
502
Általános művek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 502
12
Az első kiadás előszava Több mint kétezer éve már, hogy minden művelt ember szellemi fegyvertárához tartozik némi jártasság a matematikában. Napjainkban azonban a nevelés terén súlyos veszélyben van a matematikának ez a tradicionális helyzete. Szerencsétlenségünkre, a matematika hivatalos képviselői is felelősek ebben. A matematika tanítása sok helyütt üres feladat-megoldások begyakorlásává süllyedt, ami hasznos lehet ugyan a képletek alkalmazása szempontjából, de sem igazi megértéséhez, sem nagyobb szellemi függetlenséghez nem vezet. Ugyanakkor a matematikai kutatás nagyon hajlamos lett a túlságos szakosodásra, és az absztrakció fontosságának túlzott hangsúlyozására. Elhanyagolják az alkalmazásokat és a rokon területekkel való összefüggéseket. Ezek azonban a legkevésbé sem jogosítanak fel minket a visszavonulásra és elszigetelődésre. Ezeknek a körülményeknek éppen az ellenkező reakciót kell kiváltani mindenkiben, akiben felelősségérzet van. Tanítók, tanulók és a művelt közönség egyaránt konstruktív reformokat igényelnek, nem pedig visszavonulást a legkisebb ellenállás irányába. Az a céljuk, hogy organikus egészként értsék meg a matematikát, mint a természettudományos gondolkodás és cselekvés alapját. Néhány kitűnő matematikus-életrajz és matematikatörténet, meg néhány problémakeltő népszerűsítő írás tudatosította már ezeket a rejtett igényeket. De matematikai tudást ezeken a közvetett utakon keresztül nem lehet szerezni. A matematika megértését éppúgy lehetetlen könnyű szórakozásként közvetíteni, mint ahogy zenei műveltséget sem adhat még a legragyogóbb népszerűsítés sem annak, aki maga nem hallgatott hosszú időn át intenzíven zenét. Az élő matematika tárgyával kell tényleges érintkezésbe kerülni. Ez nem jelenti azt, hogy a technikai részleteknél kell időzni. A matematikának egyaránt mentesnek kell lennie a rutin hangsúlyozásától és attól az ijesztő dogmatizmustól, amely minden célt és motívumot elrejt. Annál is inkább, mert hiszen egyenes út vezet a legegyszerűbb elemektől azokig a kilátókig, ahonnan a modern matematika tárgya és hajtóerői kényelmesen áttekinthetők. Ez a könyv ilyen irányú kísérlet. Nem használ fel többet, mint amit egy jobb középiskolában mindenki megtanult - ennyiben népszerűnek tekinthető, nem 13
akarja az olvasót minden fáradságtól megkimélni. Elég nagyfokú szellemi érettséget kíván olvasójától, és mindenekelőtt azt a készséget, hogy hajlandó legyen saját fejével gondolkozni. A könyvet egyformán szántuk kezdőknek és tudósoknak, diákoknak és tanároknak, filozófusoknak és mérnököknek, tankönyvnek és. kézikönyvnek. Lehet, hogy ez a szándék túlságosan igényes. Más munkák sürgető nyomása miatt engedményeket is kellett tennünk, hogy sok évi munka után •. de anélkül, hogy mégis teljesen kész lenne, kiadhassuk a könyvet. Minden ötletet és kritikát örömmel fogadunk. Legfőképpen pedig azt reméljük, hogy a könyv hasznos szolgálatokat tesz majd annak az amerikai felsőoktatásnak, amelyik mély hálára kötelezte a szerzőt azzal, hogy otthont és munkalehetőséget adott neki. A könyv tervéért és eszmei kivitelezéséért minden felelősség az előszó aláíróját terheli, akinek mindent, ami a könyv javára írható, meg kell osztania Herbert Robbins-szal. Ő önzetlenül magáévá tette a könyv ügyét, amióta csak csatlakozott a munkához, és közremüködésének lényeges része van abban, hogy a miivet jelen formájában befejezhettük. Sok barátomat illeti meg hálás köszönet segitségükért. Hosszú beszélgetések Niels Bohr-ral, Kurt Friedrichs-szel és Otto Neugebauer-rel erősen hatottak a könyv filozófiai és történeti szempontjaira. Edna Kramer a pedagógus szemszögéből bírálta a miivet, s kritikájával javított a könyvön. David Gilbarg készitette az első jegyzetet előadásaimból, s ebből nőtt ki később a könyv. A kézirat gépelésének és újra gépelésének fárasztó munkájában Ernest Courant, Norman Davids Charles de Prima, Alfred Horn, Herbert Mintzer, Wolfgang Wasow és mások segítettek, nekik egyben sok részletjavítás is köszönhető. Donald Flanders értékes. ötletekkel segítette, és ő hozta nyomdakész állapotba a kéziratot. A rajzokat John Knudsen, Hertha von Gumppenberg, Irving Ritter és Otto Neugebauer készítették. A példák gyiijtésében és a függelék összeállításában H. Whitney is részt vett. A Rockefeller-alapitvány kiadói tanácsa készségesen segitett azoknak a jegyzeteknek a megjelentetésében, amelyek később a könyv alapjául szolgáltak. Köszönet illeti a Wawerly nyomdát, elsősorban C. Orth igazgatót a kivételesen szakszerii munkáért, és az Oxfordi Egyetemi Nyomdát, elsősorban Phil ip Vaudrin és W. Oman urakat, bátorító kezdeményezésükért és közremiiködésükért. New Rochelle, N.Y., 1941, augusztus 22. R. Courant.
14
A második, harmadik és negyedik kiadás előszava A legutóbbi évek eseményeinek kényszerítő ereje hirtelen megnövelte a matematikai felvilágosítás és nevelés szükségességét. Ezzel párhuzamosan még inkább növekedett a csalódás és a kiábrándulás veszélye, feltéve, hogy diákok és tanárok nem kisérlik meg a matematikai képletek és eljárások mögé való bepillantást, és. nem kísérlik meg felfogni a matematika valódi lényegét. Ezt a könyvet ilyen diákoknak és tanároknak írtuk, és az első kiadás fogadtatása alapján a szerzők azt remélik, hogy nem eredménytelenül. Az olvasók kritikája alapján számos helyen kiigazitottuk és javítottunk ar könyvön. Hálás köszönet illeti meg Natasa Artin úrhölgyet, aki önzetlenül segített a negyedik kiadás előkészítésében. New RocheIle, N.Y., 1943. március 18. 1945. október 10. 1947. október 28. R. Courant.
Hogyan használjuk ezt a könyvet A könyvet határozott sorrend szerint írtuk, de azért az olvasónak nem kell lapról lapra, fejezetrőlfejezetre átrágnia magát rajta. Pl. a történelmi és filozófiai bevezetést akkor legcélszerűbb elolvasni, amikor már az egész könyvet feldolgoztuk. Az egyes fejezetek nagymértékben függetlenek egymástól. Gyakran előfordul, hogy egy fejezet elején könnyen érthető, de azután meredekebbé válik az út, és a fejezet vége a hozzátartozó kiegészítésekkel már elég nehéz. Így az az olvasó, akinek nem szaktudásra, hanem általános információra van szüksége, megelégedhet egy olyan válogatással, amelyik a részletesebb tárgyalásokat kihagyja. Kevés matematikai előismerettel rendelkező diákoknak szükségképpen válogatniuk kell. Csillaggal (*) vagy kisbetűs szedéssel jelezzük azokat a részeket, amik az első olvasáskor nyugodtan elhagy ható k, anélkül, hogy a kihagyások a későbbiek megértését zavarnák. Még annak sincs semmi akadálya, hogy az olvasó kizárlólag az őt érdeklő fejezetek áttanulmányozására szorítkozzék. A legtöbb feladat különbözik a megszokottaktól, a nehezebbeket csillaggal jelöltük. Ne ijedjen meg az olvasó, ha legnagyobb részüket nem sikerül majd megoldania. Középiskolák felső tagozataiban tanító tanárok sok értékes anyagot találnak majd tehetségesebb diákjaikból alakított szakköreik számára a geometriai szerkesztésekről és a szélső érték számításról szóló fejezetekben. Reméljük, hogy a könyv az egyetemi hallgatók hasznos segítsége lesz elsőéves koruktól az államvizsgáig, ugyanúgy azoknak a természettudományos szakmákban dolgozó embereknek is, akiket őszintén érdekel a tudomány. Az sem lehetetlen, hogy még a matematika alapjairól tartott egyetemi kollégiumok vezérfonalául is szolgálhat, ha ezt a tantárgyat nem a megszokott értelemben kívánná előadni valaki. A III., IV. és V. fejezet geometriai kollégiumokban használható, a VI. és VIII. fejezet együtt teljes bevezetés az infinitezimális számításba, inkább a megértésre, semmint a gyakorlatra helyezve a hangsúlyt. Jól használható bevezető szövegként, ha az előadó azután a speciális szükségletnek megfelelően kiegészíti az anyagot, elsősorban numerikus példákkal. A szövegben elszórt, és a könyv végén egybegyűjtött sok feladat azt a célt szolgálja, hogy megkönynyítse a könyv oktatásban való felhasználását.
16
Mi a matematika? A matematika az emberi gondolkodás jellegzetes terméke. A megfigyelő értelem, a vállalkozó kedv és az esztétikai érzék egyaránt a legtisztábban fejeződik ki benne. Egyesíti magában a logikát és a szemléletet, az analízist és a szerkesztést, ajelenségek individualizálását és a megjelenési formák absztrakcióját. Lehet, hogya divat vagy a hagyományok ezek közül az egyik vagy a másik szempontot helyezik előtérbe, a matematika tudományának életereje és legnagyobb értéke azonban ezeknek az ellentéteknek összhangján és a szintézisükre való törekvésen alapul. Kétségtelen, hogy a fejlődést a matematika minden ágában valamilyen gyakorlati igény és a valóságos dolgok megfigyelése indította el, s ez még akkor is így an, ha ezt az összefüggést az oktatásban és a specializálódott kutatásban már elfelejtették. Ha azonban a fejlődés az alkalmazás szükségességének nyomása alatt elindult, többnyire átlendül a közvetlen felhasználhatóság határain. Ez az átmenet az alkalmazott tudományokból az elméleti tudományokba jól észlelhető az ókori fejlődésben, s ezt támasztja alá az a sok felfedezés is, amivel fizikusok és mérnökök gazdagították a modern matematikát. A matematika története az ókori Keleten kezdődik, ahol i. e. 2000 körül a babilóniaiak gazdag - mai ismereteink szerint az elemi algebra körébe sorolható - anyagot gyűjtöttek össze. Mai értelemben vett tudományként azonban csak jóval később, görög földön jelent meg a matematika az i. e. V. és IV. században. A Kelet és Görögország közötti kapcsolat a perzsa birodalom idején kezdődött, és Nagy Sándor korát követően érte el tetőpontját, megismertetve a görögökkel a babilóniaiak matematikai és csillagászati eredményeit. Nemsokára ezután a matematika a görög városállamok intellektuális köreiben szokásos filozófiai viták tárgya lett. E viták során a görög gondolkodók felismerték, hogy milyen nehézségek rejlenek az olyan fogalmakban, mint a mozgás, a végtelen és a tetszőleges mennyiségeknek adott egységekkel történő mérése. A nehézségeket csodálatra méltó módon oldották meg. Az eredmény Eudoxosz kontinuum elmélete volt. Ehhez fogható teljesítményt csak 2000 év múlva láthatunk az irracionális számok modern elméletében. A matematika deduktív, axiomatikus 2 Mi a matematika?
17
••
felfogása is Eudoxosz korában keletkezett, s Euklidész Elemei-ben kristályosodott ki. Jóllehet a görög matematikának az elméleti és axiomatikus vonás a legfőbb jellegzetessége, és máig is ebben van a legnagyobb hatása, nem lehet eléggé hangsúlyozni, hogy az alkalmazások és a fizikai valósággal létesíthető kapcsolat legalább ilyen fontos volt az antik matematikában. Ennek megfelelően gyakran szívesen alkalmaztak az euklideszinél kevésbé szigorú bizonyítást is. Nem lehetetlen, hogy az inkommenzurábilis mennyiségekkel összefüggő nehézségek korai felfedezése térítette el a görögöket a numerikus számolás továbbfejlesztésétől, bár ez Keleten már igen előrehaladott volt. Ehelyett utat vágtak maguknak a tiszta axiomatikus geometria sűrűjébe. A tudomány történet egyik legkülönösebb kitérője jött ezáltal létre, s az emberiség talán nagyon nagy lehetőségeket mulasztott el. A görög geometriai tradíció tekintélye ugyanis csaknem kétezer évig késleltette a számfogalom és az algebrai módszerek elkerülhetetlen fejlődését, ami ma a modern természettudomány alapja. Az egy helyben topogás hosszú korszaka és lassú előkészítés után a XVII. században robbant ki a matematika és a természettudományok forradalma az analitikus geometriával s az infinitezimális számítással. Az új matematika úttörői valósággal tobzódtak az eredményekben, s a matematika kincsesházának lenyűgöző új világát hódították meg. A görög geometria megőrizte fontosságát, de a kristálytiszta axiomatizáció és a rendszeres dedukció ideálja eltűnt a XVII. ds XVIII. század folyamán. A matematika úttörői lényegtelennek vélték a tiszta definíciókból és önellentmondás-mentes "evidens" axiómákból kiinduló pontos logikai okfejtést. Az összefüggések intuitív megsejtése és az újonnan felfedezett formális módszerek szinte emberfeletti erejéről való vak meggyőződés keveredett a logikailag megfoghatatlan "végtelen kicsi" majdnem misztikus tiszteletével, s ez késztetett az új hódításokra. A haladás önkívületét azután fokról fokra felváltotta a kritikai önfegyelem szelleme, amikor a francia forradalom után a tudományos élet alapja óriási mértékben kiszélesedett, és az új módszerek fölötti uralom nem lehetett többé csupán a biztos matematikai érzékkel rendelkező tudósok kis rétegének fenntartva. A tudósok az új matematika alapelveinek revideálására és magyarázására kényszerültek. Kiváltképpen szükséges volt, hogy a differenciál- és integrálszámítást s a határértékfogalmat a tanulni vágyók szélesebb rétegei számára hozzáférhetővé tegyék. Így a XIX. század nemcsak az új haladás százada lett, hanem a pontosság és a szigorú bizonyítás klasszikus ideáljaihoz való visszatérésé is. Utóbbi tekintetében olyan sikeres volt, hogy még a görög tudomány nyújtotta példaképet is felülmúlta. Az inga ismét a tiszta logika és absztrakció oldalára lendült. Méghozzá olyan mértékben, hogya "tiszta" matematika és létfontosságú alkalmazási területei között veszélyes szakadék keletkezett. Lehet, hogy a matematikusok és az egyéb 18
.. tudósok közötti elidegenedés a kritikai revízió korszakában elkerülhetetlen volt. Mégis úgy látszik, s mindenesetre remélhető, hogy az elszigetelődésnek ez a korszaka lezárult. A visszanyert belső erő és az az óriási egyszerűsödés, amelyet a mélyebb megértés hozott létre, ma már lehetővé teszi a matematikai elmélet tökéletes ismeretét anélkül, hogy alkalmazásait el kellene hanyagolni. A közeljövőben éppen az lesz a matematikusok legfontosabb feladata, hogy helyreállítsák a tiszta és alkalmazott tudomány közötti szerves egységet, s józan egyensúlyt teremtsenek absztrakt általánosság és színes részletek között. Nincs itt helye részletekbe menő filozófiai vagy pszichológiai analízisnek. Néhány fontosabb tényemlítésére szorítkozunk csupán. Igen veszélyesnek tartjuk a matematika deduktív-posztulációs jellegének jelenleg uralkodó túlságos hangsúlyozását. Igaz, nem lenne könnyű egyszerűen leírni, hogy mi a teremtő feltalálás, az irányító és alakító intuíció, pedig ez rejlik minden, még a legabsztraktabb matematikai eredmény mélyén is. Lehet, hogy a kikristályosodott deduktív forma a cél, de a hajtóerő akkor is az intuíció és az alkotókedv. Egyenesen a természettudomány létét fenyegeti az az állítás, hogya matematika semmi más, mint definíciókból és posztulátumokbóllevezetett tételek önellentmondás-mentes, de egyébként teljesen a matematikus szabad akarata által teremtett rendszere. Ha ez igaz lenne, egyetlen értelmes embert sem vonzana a matematika. Hiszen akkor definíciókkal, szabályokkal és szillogizmusokkal való játék lenne az egész, minden cél és értelem nélkül. Csalárd féligazság az az állítás, hogy az elménk önkénye szerint tud értelmes posztulációs rendszereket teremteni. Csak a szerves egész iránt érzett felelősség fegyelme alatt, belső szükségszerűség által vezettetve képes a szabad elme tudományos értékű eredmények elérésére. A logikai analízis kontemplatív irányzata semmiképpen sem képviseli tehát a matematika egészét, azt azonban el kell ismerni, hogya matematikai tények s kölcsönös összefüggéseiknek mélyebb megértését eredményezte, és a matematikai fogalmak lényegének tisztább felfogására vezetett. Ebből fejlődött ki a matematikában az a modern szempont, ami annyira jellemző ma a természettudományokra általában. Bármilyen filozófiai állásponton legyünk is egyébként, el kell ismernünk azt a tényt, hogy a természettudományos megfigyelés szempontjából bármely objektum teljesen leírható a közötte és a megfigyelő szubjektum vagy mérőműszer között lehetséges relációk összessége által. Természetesen a puszta megfigyelés még nem tudomány és nem megértés; valami szerint rendezni és interpretálni kell a megfigyeléseket. Ez a valami, ha úgy tetszik "magánvaló", nem közvetlen fizikai megfigyelés tárgya, a metafizikába tartozik. A természettudományos. módszer azonban megköveteli, hogy a későbbiek során azután minden metafizikai jellegű elemet gondosan eltávolítsunk, s kizárólag a megfigyelhető tényeket tekintsük fogalmaink és leírásaink végső forrásának. Lehet, hogy a naiv lelkesedő keserű 2*
19
csalódásnak érzi ezt a lemondást arról, hogy megértsük a "magánvalót" , megismerjük a "végső igazságot", feltárjuk a világ legbelső lényegét. Lehet, azonban ne felejtsük el, hogy az újkori gondolkodásnak éppen ez a lemondás volt az egyik leggyümölcsözőbb tette. A fizika néhány kiemelkedő eredményét éppen annak köszönhetjük, hogy bátran ragaszkodtunk a metafizika kiküszöböléséhez. Einstein úgy találta meg a kulcsot a relativitás-elmélet éhez, hogy a "különböző helyen egyidejűleg végbemenő események" fogalmát megkísérelte visszavezetni megfigyelhető jelenségekre, és metafizikai előítéletként leplezte le azt a hiedelmet, hogy ennek a fogalomnak önmagában bármiféle tudományos értelme lenne. Niels Bohr és tanítványai felismerték, hogy minden fizikai megfigyelésben szükségképpen hat a mérőműszer a megmért objektumra; így derült ki, hogy egy részecske helye és sebessége fizikai értelemben véve nem határozható meg egyidejűleg pontosan. Minden fizikus jól tudja, hogy ez a felfedezés, beépülve az újabb kvantumelméletbe, milyen messzemenő következményekhez vezetett. A XIX. században az a felfogás uralkodott, hogy a mechanikai erő fogalma és az anyagi pont térben történő mozgása nem szorul további magyarázatra, viszont az elektromosság, a fény és a mágnesesség "megmagyarázandók", azaz mechanikai jelenségekre vezetendők vissza úgy, amint az a hő esetében történt. Kitalálták az "étert" olyan hipotetikus közegként, amelyik a számunkra fény vagy elektromosság formájában jelentkező, nem teljesen megmagyarázott mechanikus mozgásokat végzi. Csak lassan látták be, hogy ez az éter szükségképpen megfigyelhetetlen : a metafizikába tartozik s nem a fizikába. Sokan búsultak ezen, mások megkönnyebbülten sóhajtottak fel, de akárhogyan is érezte k, a fény és elektromosság mechanikai magyarázatát s ezzel együtt az étert, végleg el kellett vetni. Hasonló a helyzet, csak még élesebb, a matematikában. A matematikusok tudományuk tárgyait, mint amilyenek a számok, pontok stb. mind ez idáig mindig valami magán valónak, önmagukban értelmes dolognak tekintették. Csak miután ezek a dolgok folyton kibújtak valamilyen kielégítő leírás lehetősége alól, a XIX. század matematikusainak kezdett lassanként derengeni, hogy talán egyáltalán nem is lehet ezeket a dolgokat a matematikán belül önmaguktóllétező dolgoknak tekinteni. A rájuk érvényes megállapítások nem vonatkoznak semmiféle szubsztanciális realitásra; matematikailag "definiálatlan objektumok" közötti összefüggéseket szögeznek le ezek a megállapítások, és a definiálatlan objektumokkal végezhető műveletek szabályait rögzítik. Nem lehet, és nem is kell a matematikában arról beszélni, hogy mik a pontok, egyenesek, számok "valójában". Ami fontos a matematikában, s ami "igazolható" tényeknek felel meg az a struktúra és az összefüggés: pl. az a tény, hogy két pont meghatároz egy egyenest, hogy a számok megadott műveleti szabályok szerint újabb számokká kapcsolhatók stb. A modern posztulációs szemlélet egyik legfontosabb és leg20
gyümölcsözőbb eredménye éppen annak a belátása volt, hogy a matematika alapvető elemi fogalmainak nem szabad önálló jelentést tulajdonítani, "deszubsztancializálni" kell őket. Szerencsére, az alkotó elmék tüstént elfelejtik a dogmatikus filozófiai fogalmakat, mihelyst a hozzájuk való ragaszkodás gátolja a teremtő fejlődést. Egyedül az aktív matematikai tapasztalás, nem a filozofálgatás, válaszolhat tudósnak és be nem avatottnak egyaránt arra a kérdésre, hogy mi a matematika?
I. fejezet
A természetes számok Bevezetés A szám a modern matematika alapja. De mi maga a szám? Mit jelent az, hogy 11
2"+2 =
1,
111,
2'2 = "4 es (-1)(-1)
.
"
= l? Azt megtanuljuk az iskolában,
hogyan kell számolni törtekkel és negatív számokkal, de ha valóban meg akarjuk érteni a számrendszert, egyszerűbb elemekig kell visszamennünk. A görögök a pont és az egyenes geometriai fogalmát választották matematikájuk alapjául, a modern matematika vezérelve ezzel szemben az, hogy végső soron minden matematikai állítás a természetes számokra (1, 2, 3, ... ) legyen visszavezethető. "A természetes számokat Isten teremtette, minden egyéb az ember műve." Ezekkel a szavakkal jelölte ki Leopold Kronecker (1823 - 1891) azt a biztos alapot, amire a matematika struktúrája felépíthető. A számokat az emberi elme azért hozta létre, hogya legkülönfélébb együttesekben megszámolhassa a bennük foglalt tárgyakat, s így a számoknak semmi köze sincs a megszámlált tárgyak egyedi tulajdonságaihoz. A hatos szám pl. minden hat dolgot tartalmazó valóságos összesség absztrakciója, nem függ a dolgok vagy a használt jelölések semmilyen specifikus tulajdonságától. Meglehetősen magas intellektuális szint szükséges ahhoz, hogy a számnak ez az absztrakt jellege nyilvánvalóvá váljon. A gyerek mindig megfogható tárgyakhoz, pl. ujjakhoz vagy gyöngyszemekhez társít ja a számokat, a primitív nyelvek is a szám konkrét felfogását árulják el azáltal, hogy különböző fajta tárgyakra különféle számneveket használnak. Szerencsére a matematikusnak nem kell törődnie azzal, miféle filozófiai természetű átmenet vezet át a tárgyak konkrét megszámlálásáról az absztrakt számfogalomra. Egyszerűen adottnak vesszük a természetes számokat, az összekapcsolásukra szolgáló két alapművelettel: az összeadással és aszorzással együtt.
23
l. § Számolás
egész számokkal
1. Az aritmetika törvényei
A természetes számok vagy pozitív egész ;zámok matematikai elméletét ar itnevezik. Az aritmetika azon a tényen alapul, hogy az. egész számok összeadására és szorzás ára meghatározott törvények érvényesek. Ha ezeket a törvényeket teljesen általánosan akarjuk kimondani, nem használhatunk konkrét egész számokra vonatkozó jelöléseket, mint pl. 1, 2, 3. Az az állítás, hogy metikának
1+2=2+1 csupán speciális esete annak az általános törvénynek, hogy két egész szám öszszege független az összeadás sorrendjétől. Ha azt akarjuk kifejezni, hogy egy egész számok között fennálló összefüggés attól függetlenül érvényes, hogy milyen konkrét egész számok szerepelnek benne, jelképesen a, b, c, ... betűkkel jelöljük az egész számokat. Ebben megállapodva, .öt, az olvasó által ismert alaptörvényt mondunk ki az aritmetikában: l) a+b = b+a, 2) ab i=ba, 3) a+(b+c) = (a+b)+c, 4) a(bc) = (ab)c, 5) a(b+c) = ab-s-ac.
Az első kettő, az összeadás illetve a szorzás kommutatív törvénye, azt állítja, hogy az összeadás ban illetve a szorzásban szereplő elemek sorrendje felcserélhető. A harmadik, az összeadás asszociatív törvénye azt mondja ki, hogy három szám összeadása ugyanarra az eredményre vezet, akár az első kettő összegéhez adjuk hozzá a harmadikat, akár az elsőhöz adjuk hozzá a második és a harmadik összegét. A negyedik a szorzás asszociatív törvénye. Az utolsó, az ún. disztributív törvény, azt a tényt fejezi ki, hogy valamely egész számmal egy összeget úgy lehet megszorozni, hogy az összeg minden tagját megszorozzuk az egész számmal, és a szorzatokat összeadjuk. Az aritmetikának ezek a törvényei olyan egyszerűek, hogy maguktól értetődőnek látszhatnak. De nem feltétlenül szükséges, hogy az egész számokon kívül más dolgokra is érvényesek legyenek. Pl. ha a és b nem egész számokat, hanem kémiai anyagokat jelölnek, és ha az összeadáson "hozzátevést" értünk, akkor nyilvánvaló, hogy a kommutatív törvény nem mindig érvényes. Mert ha pl. kénsavat adunk hozzá vízhez, híg oldatot kapunk, míg vizet adva tiszta kénsavhoz, pórul járhat a kísérletező. Hasonló példán lehetne bemutatni, hogy egy ilyen jellegű "aritmetikában" az összeadás asszociatív és disztributív törvénye nem feltétlenül érvényes. Így el lehet képzelni olyan aritmetikákat, amelyekben a fenti 1)- 5) törvényből egy vagy több nem érvényes. A modern matematikában valóban tanulmányoztak ilyen rendszereket. 24
A természetes szám absztrakt fogalmának egy konkrét modellje megmutatja, milyen egyszerűen szemléltethetők az 1)- 5) törvények. Ahelyett, hogya szokásos 1,2, 3 stb. számjeleket használnánk, jelöljük egy adott összességben (lehet ez pl. egyalmafán levő almák összessége) levő tárgyak számából adódó egész számot egy négyszögletes dobozba zárt pontok halmazával úgy, hogy minden tárgynak éppen egy pont feleljen meg. Az egész számok aritmetikájának a.törvényeit ezekkel a dobozokkal végzett műveletekben fogjuk tanulmányozni. Két a és b egész számot úgy adunk össze, hogy végükkel egymás mellé illesztjük a dobozokat és eltávolítjuk a közfalat.
,·····,+1····,=1·········.1 I. ábra. Összeadás
Két számot, a-t és b-t úgy szorzunk össze, hogy a megfelelő két dobozban sorokba rendezzük a pontokat, és egy új dobozt képezünk, amelyikben a pontok a sorban és b oszlopban helyezkednek el. Látjuk hogy az 1)- 5) törvények megfelelnek azoknak a műveleteknek, amelyeket a dobozokkal közvetlen szemlélet alapján végeztünk.
1·····lxl····I:: 2. ábra. Szorzás
LJ
-"'=..,
·
··
Két egész szám összeadásának a definíciója alapján most már definiálhat juk a kisebb, ill. nagyobb relációt. Annak a két ekvivalens állításnak, hogy a-eb (olv. a kisebb, mint b) és bv-a (olv. b nagyobb, mint a) mindegyike azt jelenti, hogy b
~X(~+I
..... I)=
L..---L
...J
3. ábra. A disztributív törvény
dobozt meg lehet kapni a dobozból egy megfelelőképpen választott harmadik c doboz hozzáadásával, jelekben: b = a+ c. Ebben az esetben feIírhatjuk, hogy c
= b-a,
ami a kivonás műveletét definiálja. 25
Az összeadást és a kivonást egymás inverz műve/etének nevezik, mivel ha egy d egész szám a egész számhoz való hozzáadása után az összegből kivonjuk a d egész számot, az eredmény az eredeti a egész szám lesz: (a+d)-d
=
a.
Jegyezzük meg, hogya b - a egész számot csak arra az esetre definiáltuk, ha b s-a. A b-a egész számnak negatív egész számként való értelmezését abban az esetben ha b-e a, később tárgyalj uk (75. és következő oldalak).
1·········1-1····1=1·····1 4. ábra. Kivonás
Ha az as-b állítást akarjuk tagadni, sokszor kényelmesebb a b ss a (olv. b nagyobb vagy egyenlő a) vagy a§. b (olv. zz-kisebb vagy egyenlő b) jelölések egyikét használni. Így pl. 2?E 2 és 3?E 2. Kissé kibővíthetjük a dobozba zárt pontokkal ábrázolt egész számok tartományát, ha bevezetjük a nulla egész számot, amit üres dobozzal fogunk ábrázolni. Ha ezt az üres dobozt a szokásos Ojellel jelöljük, az összeadás s a szorzás definíciója szerint: a+O = a, a·O
=
O,
minden a egész számra. Hiszen az a+O azt jelenti, hogy az üres dobozt adjuk hozzá az a dobozhoz, O·a pedig egy oszlop nélküli dobozt jelent, ami nem más, mint az üres doboz. Természetes módon kínálkozik a kivonás definícióját kibővíteni a-a minden
a
= O-val
egész számra. Ezek a nulla jellegzetes aritmetikai tulajdonságai.
Ilyenféle geometriai modelleket, mint a pontos dobozok, amilyen pl. az ókori abacus is volt, sokféleképpen használtak a numerikus számítások elvégzéséhez egészen a.középkor végéig, amikor lassan kezdték kiszorítani őket a tízes számrendszeren alapuló sokkal magasabb rendű jelölés módszerek. 2. Pozitív egész számok jelölése
Gondosan meg kell különböztetnünk egymástól magát az egész számot és azt az 5, V,.. stb. jelet, amit jelölésére használunk. A tízes számrendszerben tíz számjegyet használunk a nulla és az első kilenc pozitív egész szám jelölésére: 26
0,1,2, 3, ... , 9-et. Valamely nagyobb egész szám, mint pl. "háromszázhetvenkettő", a következőképpen fejezhető ki: 300+70+2
=
3 • 102+7 • 10+2,
és a tízes számrendszerben ezt a 372 jellel jelöljük. Ebben a jelölési módban az a lényeg, hogya 3,7,2 számjegyek értéke a helyüktől függ, attól, hogy az egyesek, a tízesek, vagy százasok helyén állanak-e. Ebben a "helyi érték"-rendszerben bármely egész számot felirhatunk mindössze tíz számjegy különféle elrendezésével. Az általános szabály szerint egy egész szám a következő alakban írható: z
=
a • 103+b
• 102+C . 10+d
ahol a, b, c, d a nullától kilencig terjedő számjegyek valamelyike. Ebben az esetben a z egész szám az abcd
rövidített szimbólummal írható fel. Megjegyezzük, hogy ad, c, b, a együttható k nem egyebek, mint a z tízzel való egymás utáni osztásainak a maradékai. Pl. 372 : 10 37 maradék 2 37 : 10 3 maradék 7 3 : 10 O maradék 3. A z-re fent megadott kifejezés csak tízezernél kisebb egész számokra érvényes, ennél nagyobb egész számok öt vagy több számjegyet igényelnek. Ha z valamely tízezer és százezer közötti szám, akkor
alakban fejezhető ki, és az abcde jellel jelölhető. Hasonlóan írhatók le a százezer és millió közötti egész számok, és így tovább. Igen hasznos valamennyi egész számot egyetlen, általános formulával.kifejezni. Jelöljük ebből a célból a különböző e, d, c, ... együttható kat különbözó "indexekkel" ellátott egyetlen a betűvel ao, al> a2, a3' ... Jelölje továbbá IOn,ahol n tetszőleges természetes szám lehet, azt a tényt, hogy 10 hatvány ai szükségszerinti nagyok lehetnek, s nem kell, mint a fenti példákban, megállani 103 vagy 104-nél. Ezzel az általános módszerrel egy z egész számot a tízes számrendszerben így írjuk le: (1)
vagy szimbólummal Akárcsak a fenti speciális esetben, most is azt látjuk, hogy az ao, al' a2' ... , an számjegyek a z ismételt lO-zel való osztásánál kapott maradékok. 27
A tízes számrendszerben a tízes számot választottuk a számrendszer alapjául. A nem szakember talán nem veszi rögtön észre, hogy ez a választás egyáltalán nem lényeges, nemcsak tíz, bármely egynél nagyobb egész szám szolgálhat ugyan erre a célra. Pl. a hetes (az alap 7) számrendszer t a következőképpen kellene használni. Ebben a számrendszerben egy egész számot a (2)
ón·
7n+bn_1
•
7n-1+
... +b1 ·7+bo
kifejezés írja le, ahol a b-k nullától hatig terjedő számjegyek. A (2) által kifejezett számot
jellel jelöljük. Pl. "egyszázkilenc" hetes számrendszerben a 214 jellel lenne jelölhető, aminek a jelentése
Az olvasóra bízzuk, hogy gyakorlásképpen bizonyítsa be: a tízes alapú számrendszerről valamely más B alapú számrendszerre áttérni úgy lehet, hogy z számot ismételten elosztjuk B-vel; az így kapott maradékok lesznek a B alapú számrendszerben a szám számjegyei. Pl.: 109 : 7 15: 7 2 :7 109 (tízes számrendszerben)
15 maradék 4 2 maradék l O maradék 2
= 214 (hetes számrendszerben)
Természetesen kérdéses, hogy vannak-e különleges előnyei az alap valamilyen speciális megváltoztatásának. Látjuk majd, hogy túl kicsi alap több szempontból előnytelen, túl nagyalapnál meg túl sok számjegyet kell megtanulni és a szorzótábla is bonyolult. Ajánlották a tizenkettes alap választását, mert tizenkettő maradék nélkül osztható kettővel, hárommal, néggyel, hattal, és ennek következtében az olyan feladatok, ahol osztás vagy törtek szerepelnek, jóval egyszerűbbé válnak. Ha egy tetszőleges egész számot tizenkettes alappal akarunk kifejezni (tizenkettes számrendszerben), akkor két új számjegyet kell bevezetnünk a tíz és a tizenegy számára. Jelöljük a tízet z-val, a tizenegyet p-val. Akkor a tizenkettes számrendszerben "tizenkettő" lO-zel jelölhető, "huszonkettő" Iz-val, "huszonhárom" Ip-val és "százharmincegy" a;p-val. A helyértékrendszer, aminek a felfedezését a suméroknak vagy a babilóniaknak tulajdonítják, és amit a hinduk tökéletesítettek, óriási jelentőségű volt a kultúra történetében. A korai számrendszerek tisztán az összeadás elvén alapultak. Pl. a római jelölésben CXVIII = száz-l-tíz-í-öt-j-egy-j-egy-í-egy. 28
Az egyiptomi, héber, görög számrendszerek mind ugyanezen a szinten állottak. Minden tisztán additív jelölési módnak egyik hátránya, hogy amint a számok növekednek, újabb jeleket kell bevezetni. (Természetesen a régi tudósoknak még nem kellett a mi csillagászati vagy atomi nagyságrendjeinkkel bajlódni.) De az antik rendszerek, például a római írásmód fő hibája, hogy annyira nehéz volt velük a számolás, hogyalegegyszerűbb probléma megoldására is csak külön specialisták mertek vállalkozni. Ezzel szemben a hindu helyértékrendszernek, amit ma használunk, óriási előnyei vannak. (Ezt a számrendszert a középkorban honosították meg Európában az olasz kereskedők, akik az araboktól tanulták.) A helyértékrendszernek először is az az előnye, hogy bármely szám, akár nagy, akár kicsi, leírható benne viszonylag kis számú jel segítségével (a tízes számrendszerben ezek az "arab számok": O, 1,2, ... ,9). Ezzel együtt jár az a sokkal fontosabb előny, hogy könnyű benne a számolás. A helyértékrendszerben felírt számok esetében a számolás szabályai az összeadó- és szorzótáblákban foglalhatók össze, a könnyen emlékezetben tartható számjegyekre. A számolás ősi művészetét, ami egykor csupán néhány beavatott titka volt, ma az elemi iskolában tanítják. Nem sok egyéb példát lehetne felhozni ezenkívül arra, hogy a tudomány haladása ilyen mélyen áthatotta s ennyire megkönnyítette a mindennapi életet.
3. Számolás nem tízes számrendszerekben A tízes alap használata megtalálható már a civilizáció hajnalán és kétségkívül annak a ténynek köszönhető, hogy tíz ujj unk van. De sok nyelv számnevei utalnak más alapokra is, mint pl. a tizenkettő (angol, német) vagy húsz (csaknem minden nyelvben). Az angol és a német például a ll-et és a 12-t (eleven, elf; twelve, zwölf) nem a tízes elv alapján nevezi el, tehát nem úgy, mint például a 13-at vagy a l4-et, a 10 szóhoz függesztve a megfelelő számjegyet, hanema 11, 12 szavak nyelvileg függetlenek a tíz szótól. Franciában a 20 és 80 elnevezése: "vingt" és "quatrevingt" mutatja, hogy egykor egyes célokra olyan rendszert használhattak, amelyben húsz volt az alap. Dán nyelvben a 70 neve "halvfjerds", félutat jelent, a négyszer húszhoz (ti. a háromszor húsztól). A babilóniai csillagászok számrendszere részben a hatvanas volt (alap 60), és úgy tartják, hogy innen ered az óra és a fok 60 percre való osztása. Valamilyen nem tízes számrendszerben a számolási szabályok ugyanazok, mint a tízesben, de más összeacló- és szorzó (egyszeregy) táblákban mások a számjegyek. Annyira megszoktuk a tízes számrendszert, és nyelvünk számnevei is anynyira ehhez kötnek, hogy ezt először meglehetősen zavarónak találhat juk. Próbáljunk elvégezni egy szorzást pl. a hetes számrendszerben. Mielőtt hozzákezdenénk, tanácsos lejegyezni a használandó összeadó- és szorzótáblát :
29
Szorzás
Összeadás 1 2 2 3 3 4 4 5 5 6 610
2 3 4 5 6 10 11
3 4 5 6 10 11 12
4
5 6
5 6 10 61011 10 11 12 11 12 13 12 13 14 13 14 15
2 3 4 5 6
1 1 2 3 4 5 6
2 2 4 6 11 13 15
3 3 6 12 15 21 24
4 4 11 15 22 26 33
5 5 13 21 26 34 42
6 6 15 23 33 42 51
Szorozzuk most meg 265-öt 24-gyel, a számjegyek itt hetes számrendszerben felírva értendők. (A feladat tízes számrendszerben felírva 145 szorozva 18-cal lenne.) A szorzás szabályai ugyanazok, mint a tízes számrendszerben. Először 5-öt szorozzuk meg 4-gyel, ez, amint a szorzótábla mutatja, 26. Leírjuk a 6-ot az egyesek helyére, "továbbvisszük" a 2-t. A következő lépésben azt találjuk, hogy 4·6= 33, és 33 + 2 = 35. Leírjuk az 5-öt, és így haladunk, míg minden részletszorzást el nem végeztünk. Összeadva 1456-ot és 563-at, az egyesek helyén 6 + O= 6-ot kapunk, a hetesek helyén 5+3 = ll-et. Újbólleírjuk az l-et és l-et továbbviszünk a negyvenkilencesek helyére, ahol 1+ 6+ 4 = 14-et kapunk. A végeredmény 265·24 = 10416. 265·24 1456 563 10416 Az eredmény próbájaként végezzük el ugyanezt a szorzást a tízes számrendszerben is. 10416 (hetes számrendszer) tízes számrendszerbe való átírásához lejegyezzük 7 hatványait anegyedikig: 72=49, 73= 343, 74=2401. Tehát a tízes számrendszerben 10416=2401+4·49+7+6. Összeadva ezeket a számokat, azt találjuk, hogy azt a számot, amit a hetes számrendszerben 10416-tal jelöltünk, a tízes számrendszerben 2610-zel kell jelölni. A tízes számrendszerben 145-öt megszorozva 18-cal, az eredmény valóban 2610, a számolás tehát helyes volt. Gyakorlatok: 1. írjuk fel a tizenkettes számrendszer összeadó- és szorzótábláját, végre néhány fentihez hasonló szorzás t. 2. Fejezzük ki "harmincat" ben az alap 5, 7, ill. 12.
és "százharminchármat"
olyan számrendszerekben.
és hajtsunk amelyek-
3. Mit jelent a 11111 és a 21212 jel ezekben a számrendszerekben ? 4. Képezzünk összeadó- és szorzótáblát
5, 11, 13 alapok esetében.
Kitüntetett helyet foglal el elméleti szempontból a 2 a1apú számrendszer, ugyanis 2 a lehető legkisebb alap. A kettes vagy diadikus számrendszerben O és 1 az egyedüli számjegyek. Minden egyéb z számot ennek a két jelnek valamilyen 30
sorozata fejez ki. Az összeadó- és szorzótáblák az 1+1 = 10 és 1·1 = 1 szabályokból állanak. A rendszer nyilvánvaló hátránya, hogy már kis számok jelölésére is hosszú kifejezések szükségesek. Így pl. hetvenkilenc, ami 2 hatványaival 1.26 +0.25+0.24+ 1.23+ 1.22 + 1·2+ l-ként allítható elő, a kettes számrendszerben 1001111 alakú lesz. A kettes számrendszerben nagyon egyszerű a szorzás, példaként szorozzuk meg hetet öttel. Hét és öt kettes számrendszerben felírva 111 illetve 101. Emlékezzünk rá, hogy ebben a rendszerben 1 + 1 = 10, tehát 111·101 111 100011 azaz valóban
=
25+2+
1,
harmincöt öt kaptunk.
Gottfried Wilhelm Leibniz (1646-1716), korának egyik legnagyobb elméje, nagyra becsülte a kettes számrendszert. Laplace-t idézve, "Leibniz a diadikus aritmetikát a teremtés tükörképének tekintette. Úgy képzelte, hogy az Egység az Istent jelöli, a nulla az űrt, és hogya Legfelsőbb Lény mindent a semmiből teremtett, éppen úgy, ahogy az egységgel és a nullával minden más számot ki lehet fejezni a kettes számrendszerben". Gyakorlat,' Vizsgáljuk meg azt a problémát, hogyan kell jelölni az egész számokat az a alapú számrendszerben. Az egész számok elnevezéséhez ebben a rendszerben külön nevet kell találni a 0,1, ... , a-l számjegyeknek és a különböző a, a2, a8, ••• hatványainak. Hány külön szó szükséges a nullától ezerig menö számok elnevezésére a = 2, 3, 4, 5, ... , 15 esetében? Melyik alapnál van a legkevesebb számnévre szükség? (Példák: ha a= 10, tíz szó szükséges a számjegyek elnevezésére és további három a 10, 100, 1000 kimondására, ami összesen 13. a= 20 esetében húsz szó szükséges a számjegyek és további kettő a 20 és 400 elnevezésére, ami összesen 22 szó. Ha a= 100, 100+ 1 szóra van szükség.)
*2. § A számrendszer A matematikai
végtelen voltáról indukció
l. A matematikai indukció elve A természetes számok 1,2, 3, 4, ... sorozatának soha nincsen vége, mert bármely n egész szám után felirhatjuk a következő számot, n+ l-et. A természetes számok sorozatának ezt a tulajdonságát szavakban úgy fejezzük ki, hogy végtelen sok természetes szám van. A természetes számok összessége a legegyszerűbb és legközönségesebb példája a matematikai végtelennek, ami igen fontos szerepet játszik a modern matematikában. Ebben a könyvben lépten-nyomon foglalkozunk majd olyan összességekkel vagy "halmazok"-kal, amelyek végtelen sok 31
matematikai tárgyat tartalmaznak. Ilyen pl. az egyenes pont jainak halmaza vagy az egy síkban fekvő összes háromszög halmaza. A természetes számok végtelen sorozata legegyszerűbb példa végtelen halmazra. Az az eljárás, amellyel a természetes számok végtelen sorozata előállítható, az ui., hogy lépésrőllépésre térünk át n-ről n+ l-re, egyben az egyik legfontosabb matematikai bizonyításmódnak, a matematikai indukciónak is alapja. Az "empirikus indukció" a természettudományokban az az eljárás, amikor valamilyen jelenség egy adott megfigyeléssorozatából olyan általános törvényre következtetnek, amely az illető jelenség előfordulásának minden esetében érvényes. Az így megállapított törvény bizonyosságának mértéke a megfigyelt esetek számától és bizonyító erejétől függ. Az induktív bizonyításnak ez a módja sok esetben teljesen meggyőző. Az a megállapítás például, hogy a Nap holnap reggel keleten felkél, olyan biztonsággal mondható ki, mint amilyen biztos egyáltalán lehet valami, ennek az állításnak a jellege mégis merőben más, mint egy olyan tételé, amit szigorú logikai vagy matematikai következtetéssel bizonyítottak be. Egészen más értelemben alkalmazzák a matematikai indukciát, amely azáltal bizonyítja egy matematikai tétel igaz voltát, hogy megállapítja a tétel érvényességét az első, második, harmadik, és így tovább, végtelen sok esetre, kivétel nélkül minden esetre. Jelöljön A valamely állítást, amelyben egy tetszőleges n egész szám szerepel. Legyen pl. A az az állítás, hogy "egy n+ 2 oldalú konvex sokszög szögeinek összege n-szer 180 fok". Vagy legyen A' az az állítás, hogy "egy sík n egyenessel nem osztható 2n-nél több részre." Ha egy ilyen tételt minden II természetes számra be akarunk bizonyítani, nem elegendő az első 10, 100 vagy akár 1000 n értékre bebizonyítani azt. Az ilyen eljárás felelne meg az empirikus indukciónak. A matematikában azonban szigorú, nem empirikus jellegű következtetést kell alkalmazni. Ennek jellegét a fenti A és A' példa esetében mutatjuk be. Vegyük először A példát. Tudjuk, hogy ha n= l, akkor háromszögről van szó. Az elemi geometriában ismeretes, hogyaháromszögben a szögek összege 1·180°. Négyszög esetében, amikor n=2, húzzunk egy átlót, ami a négyszöget két háromszögre bontja. Közvetlenül adódik, hogy a négyszög szögei nek összege egyenlő a két háromszög szögeinek összegével: 180°+180° = 2·180°. Következik az ötszög, ennél n = 3. Bontsuk fel ezt egy háromszögre és egy négyszögre; mivel utóbbiban, mint azt éppen most bizonyítottuk, a szögek összege 2 .180°, a háromszögben pedig 180°, iz 5-szög szögei nek összege 3 ·180° . Nyilvánvaló, hogy ezen a módon megállás nélkül haladhatunk tovább, bebizonyítva a tételt n = 4, azután n = 5 esetére és így tovább, a végtelenségig. Mindegyik állítás ugyanolyan módon következik a megelőzőből, úgyhogy A általános tételt bizonyítottnak tekinthetjük minden n-re. Hasonlóan bizonyíthatjuk be A' tételt. n = l-re nyilvánvalóan igaz, mivel egy egyenes a síkot két részre osztja. Vegyünk most egy második egyenest hozzá. Ez 32
az egyenes az előző két rész mindegyikét újból két részre osztja, feltéve, hogy nem párhuzamos az elsővel. Ha n=2, egyik esetben sem kapunk 4= 22-nél több részt. Vegyünk most egy harmadik egyenest is. Az előbbi' tartományok mindegyike újból vagy két részre osztódik, vagy érintetlen marad. Így a részek összege nem nagyobb, mint 22.2 = 23. Ezt bebizonyítva, ugyanígy haladhatunk a következő esetre, és így tovább, a végtelenségig. A fenti meggondolásnak az a lényege, hogy a minden n-re érvényes általános A tétel speciális Al' A2, ••• eseteinek sorozatos, egymás utáni igazolásával bizonyítjuk be. Ennek a bizonyításnak a lehetősége két dolgon alapul: a). Megadható egy általános módszer annak az igazolására, hogy ha valamely Ar állítás igaz, akkor a közvetlenül következő Ar+l állítás is igaz. b). Az első Al állításról tudjuk hogy igaz. Az már, hogy ez a két feltétel elegendő minden Al' A2, A3, ... állítás igaz voltának bizonyítására, logikai elv, s éppen olyan alapvető a matematikában, mint a klasszikus arisztotelészi logika szabályai. Ez az elv a következőképpen fogalmazható meg: Be kell bizonyítani az A általános tételt alkotó
matematikai állítások végtelen sorozatát. Ha a) valamilyen
matematikai meggondolással kimutattuk, hogy az r tetszőleges egész szám, és ha az Ar állításról tudjuk.hogy igaz, akkor ebből következik az Ar+l állítás igaz volta és b)ha a legelső Al állításról tudjuk, hogy igaz, akkor a sorozat minden állításának igaznak kell lennie, és A bizonyítást nyert.
Ezt az elvet éppen úgy el kell fogadnunk a matematikai érvelés alapelveként, mint ahogyan a közönséges logika egyszerű szabályait elfogadjuk. Ugyanis minden An állítás igaz voltát be tudjuk bizonyítani az Al igaz voltát kimondó b J állításból kiindulva aj állítás ismételt alkalmazásával egymás után igazolva A2, A3, A4 stb. állításokat, amíg el nem jutunk An-ig. A matematikai indukció elve tehát azon a tényen alapul, hogy minden r egész szám után következik r+ 1, a következő egész szám, és hogy minden n egész szám elérhető véges számú lépéssel, kiindulva az 1 egész számból. A matematikai indukció elvét gyakran alkalmazzák anélkül, hogy explicite hivatkoznának rá, vagy csupán egy odavetett "stb." -vel, vagy "és így tovább"- bal jelzik. Különösen gyakran járnak el így az elemi bevezetésekben. Bonyolultabb bizonyításokban azonban elengedhetetlen az induktív érvelés explicit használata. A következőkben néhány példát mutatunk be az elv egyszerű, de nem egészen triviális alkalmazására.
3 Mt a matematika?
33
2. Számtani sor
Az első n egész szám 1 + 2 + 3 + ...
+ n összege bármely
n-re egyenlő n(n + 1) . 2
A tételt matematikai indukcióval bizonyít juk : ki kell mutatni, hogy az alábbi Ali állítás n(n+ 1) (1) 1+2+3+ ... +n = 2 minden n-re igaz. a) Ha r valamely egész szám, és ha igaz, azaz ha, tudjuk, hogy r(r+ 1) 1+2+3+ ... +r= 2 '
Ar
állításról tudjuk, hogy
akkor az egyenlet mindkét oldalához hozzáadva (r+ 1)-et, 1+ 2 + 3 +
...
_ r(r+1) +r+ (r+ 1) 2
+
(
r+
1) _ r(r+1)+2(r+1) 2
_ (r+1)(r+2) 2
egyenletet kapjuk, amely nem más, mint Ar+l állítás. b) Az A l állítás nyilvánvalóan 1·2 . igaz, mivel 1 = --o Tehát a matematikai indukció elve alapján An állítás min2
den n-re igaz, ami bizonyítandó volt. Rendszerint úgy szokták ezt kimutatni, hogy az l + 2 + 3 + ... különböző,
+n
összeget két
Sn = 1+2+ ... +(n-l)+n és S"
= n+(n-l)+
... +2+1
alakban írják. Összeadva látjuk, hogy minden azonos oszlopban álló két szám összege n+ 1, és mivel összesen n oszlop van, következik, hogy 2Sn
= n(n + 1),
ami a kívánt eredményt adja. (1)-ből azonnallevezethetjük azt a képletet, amely bármely számtani sor első (n+ l) tagjának az összegét megadja: (2) 34
Pn
=
a+(a+d)+(a+2d)+
... +(a+nd)
=
(n + 1)(2a + nd) 2
;
mivel Pn=(n+l)a+(1+2+ 2(n
+ l)a + n(n + l)d
(n
+ l)d 2
=
+ 1)(2a + nd)
2 a=ü,
n(n
... +n)d=(n+l)a+
2
d= l esetére ez az egyenlet ekvivalens
(l)-gyel.
3. Geometriai sor Az általános geometriai sorral hasonlóan tani, hogy n minden értékére (3)
2
Gn = a+aq+aq
+ ...
lehet
+aq
eljárni.
"l_qn+ = a-l
Be fogjuk
bizonyí-
1 --o
-q
(Feltételezzük, hogy q~ l, ebben az esetben ugyanis (3) jobb oldala nincs értelmezve.) Az állítás bizonyosan igaz n= l esetére, amikor is azt állítja, hogy Gl
-
És ha feltesszük,
_a(1-q2) a + aq 1 _q hogy Gr=a+aq+
akkor következésképpen Gr+1 = (a+aq+ =a
_a(l+q)(l-q) (l-q)
azt találjuk,
,+1 1-q =a 1 ' -q
r
... +aq
- (1 ) - a +q .
hogy
=
... +aqr)+aqr+l
(l_qr+l)+qr+l(l_q)
=a
l-q
G,+aq'+l
=
1 r+1 a l-!q +aqr+1 =
l_qr+1+qr+l_q'+2
l-q
l_qr+2 =a--"--
l-q
Azonban ez pontosan (3) állítás n = r+ 1 esetére. Ezzel a bizonyítás teljes. Elemi tankönyvekben az alábbi bizonyítás szokásos. Legyen adva Gli szorozzuk
= a+aq+
meg az egyenlet mindkét qGn
... +aq",
oldalát q-val:
= aq+aq2+
... +aqn+l.
A két egyenlet megfelelő oldalait kivonva egymásból
G;
=
a
1-q n+1 1 . -q 35
4. Az első n egész szám négyzetének összege
A matematikai indukció elvének egy további érdekes alkalmazása az első n egész szám négyzetének az összegére vonatkozik. Behelyettesítéssel - legalábbis kis n értékekre azt találjuk, hogy (4)
22232
+ + + ...
1
+n
2_n(n+1)(2n+1) 6
'
és sejteni lehet, hogy ez a figyelemre méltó képlet minden n természetes számra érvényes. Ennek a sejtésnek a bizonyítására ismét a matematikai indukció elvét alkalmazzuk. Először is meg kell állapítanunk, hogy ha az An állítás, amelyik jelen esetben (4) egyenlet, igaz n=r esetére, úgy hogy 2
1
22
.32
+ + + ...
2_r(r+1)(2r+1) +1' 6
'
akkor az egyenlet mindkét oldalához (r+ 1)2-ent adva, az 12 + 22 + 32 + 1'(1'+1)(2r
...
+1'
2
+ ( r+
1)2
+ 1) + 6(r + 1)2
= r(r+1)(2r+1) 6
+ ( r+
1)2
=
(1'+ 1)[r(21" + 1) + 6(r+ 1)J
6
6
(1'+1)(21'2+71'+6) 6
(r+ 1)(1'+2)(21'+3) 6
egyenletet kapjuk, amelyik jelen esetben éppen az Ar+l állítás, ugyanis r+ l-et helyettesítve n helyébe kapható (4)-ből. A bizonyítás teljessé tételéhez még csak azt kell megjegyezni, hogy az Al állítás, jelen esetben az 12 = 1(1 + 1)(2+ 1) 6
egyenlet nyilvánvalóan igaz. Tehát (4) egyenlet minden
11
esetére igaz.
Hasonló képleteket lehet levezetni az egész számok magasabb hatványösszegeire, lk + 2k + 3k + ... + nk esetében, ahol k tetszőleges pozitív egész szám. Bizonyítsuk be gyakorlatként matematikai indukcióval, hogy (5)
13+23+33+
... +n3=[ncn;Jlr
Megjegyzendő, hogy jóllehet a matematikai indukció elve elegendő (5) igazoha már egyszer ez a képlet fel van írva, azonban semmiféleképpen nem magyarázza meg, hogyan jutottunk éppen ehhez a képlethez. Miért lására,
36
, eppen az
[n(n+l)]2 2 k·r.,
.... , azt, h ogy mega d'Ja az e l"so n szam írn köbé nejezesro "l sejtjük o e-
nek az összegét, s nem például az [
n(n+ 3
1)]2 vagy
(19n2--4In
2
+
24) vagy
bár-
mely egyéb hasonló típusú kifejezés ről ? Az a tény, hogy valamely tétel bizonyítása egyszerű logikai szabályok alkalmazásából áll, nem teszi nélkülözhetővé a matematikában a teremtő elemet, ami éppen a vizsgálandó lehetőségek közötti választásban áll. Az a kérdés, hogy honnan ered az (5) hipotézis, olyan tartományba vezet, ahol nem adhatók meg általános szabályok. Kísérletnek, analógiának, konstruktív intuíciónak egyaránt megvan itt a szerepe. Ha azonban sikerült a helyes hipotézist formulába önteni, akkor a bizonyításra már gyakran elegendő a matematikai indukció elve. Figyelembe véve azonban, hogy ilyen bizonyítás semmi felvilágosítást sem ad magára a felfedezésre vonatkozóan , helyesebb lenne ebben az esetben igazolásról beszélni. *5. Egy fontos egyenlőtlenség A következő
fejezetek egyikében
szükségünk
lesz az
(6) egyenlőt1enségre, amelyik minden p> - 1 számra és minden n pozití v egész számra érvényes. (Az általánosság kedvéért p-re minden -l~nél nagyobb számot megengedve, negatív és nem egész számokat is használunk, holott ezeket még nem vezettük be. Az általános eset ugyanis pontosan úgy bizonyítható, mint amikor p valamely pozitív egész szám.) Ismét matematikai indukciót használunk. a) Ha igaz, hogy (1+p)'~I+rp, akkor ennek az egyenlőtlenségnek mindkét oldalát megszorozva a pozitív 1 +p számmal, (1 + p),+l ~ 1+ rp+ p+rp,i egyenlőtlenséget kapjuk. Ha elhagyjuk az rp2 tagot, ezáltal az egyenlőtlenség élesedik, úgyhogy (1 +p),+1 ~ 1+(r+ l)p,
csak
látjuk tehát, hogya (6) egyenlőtlenség a következő egész számra, (r+ 1)-re is érvényes. b) Nyilvánvaló igaz, hogy(l +p)1~ l+p. Ezzeligazoltuk, hogy (6) minden n-re igaz. A p> -1 számokra való szorítkozás lényeges, ugyanis ha P'< -1, akkor 1 +p negatív, és az a) alatti érvelés hamis, mivel ha egy egyenlőtlenség mindkét oldalát szorozzuk egy negatív mennyiséggel, az egyenlőtlenség értelme megfordul. (Pl., ha 3>2 egyenlőtlenség mindkét oldalát szorozzuk -l-gyel, -3>-2 lesz az eredmény, ami hamis.) 37
*6. A binomiális tétel
Gyakran van szükség valamely kéttagú kifejezés n-edik hatványának, képletben (a+b)"-nek, explicit formában való megadására. A kijelölt műveletet elvégezve, azt találjuk, hogy n= 1 esetére (a+b)' = a-s-b, n=2 esetére (a+bl = (a+b)(a+b) n=3 esetére (a+b)3 = (a+b)(a+bl = a3+3a2b+3ab2+b3,
= a(a+b)+b(a+b}=a2+2ab+b2,
= a(a2+2ab+b2)+b(a2+2ab+b2)
=
és így tovább. Milyen általános képzési törvény húzódik meg az "és így tovább" szavak mögött? Vizsgáljuk meg, hogyan számoltuk ki (a+b)2 kifejezést. Mivel (a+bl = = (a+b)(a+b), úgy jártunk el, hogy az (a+b) kifejezés minden egyes tagját megszoroztuk először a-val, azután b-vel, és a szorzatokat összeadtuk. Ugyanezt az eljárást használtuk (a+b)3 = (a+b)(a+bl kiszámítására. Folytathatjuk ezt a számolási módszert (a+b)4, (a+bi kiszámítására, és így tovább a végtelenségig. Az (a+b)" kifejtését úgy kapjuk meg, hogya megelőzően nyert (a+b)"-I kifejezés mindegyik tagját megszorozzuk először a-val, azután b-vel, és összegezünk. Ez az eljárás az alábbi diagramra vezet: a+b (a+b)2 = (a+b)3 = (a+b)4 =
.~
.
ami azonnal megadja az együttható k általános képzési szabályát (a+b)" kifejtésében. Rendezzük el háromszög alakban az egész számokat az a+b együtthatóiból, l-ből kiindulva úgy, hogy mindegyik szám egyenlő legyen a megelőző sorban levő két vele szomszédos szám összegével. Ezt az elrendezést Pascal-féle háromszögnek hívják. 1 1 1 2 1 3 3 1 4 1 4 1 6 1 5 10 10 5 1 6 1 15 20 15 6 1 1 7 21 35 35 21 7 38
Ennek az e/rendezésnek az n-edik sora megadja (a + b)"- nek az együtthatóit csökkenő és b növekvő hatványai szerinti kifejtésében. Pl. (a+bf
= a7 + 7a6b+21a5b2+35a4b3+ 35a3b4+21a2b5+ 7ab6+b7•
Rövidített alsó- és felsőindexes jelölést használva, következőképpen a Pascal-féle háromszög n-edik sorának a számait:
C~ = 1, C~, C~, C;, ... , C:-1, Ezekkel ajelölésekkel
(7)
az (a+bt-re
megadott
háromszög
képzési törvénye
(8)
C:
jelölhet jük
1.
=
képlet a következőképpen
(a+b)"= a"+C~a"-lb+C~a"-2b2+
A Pascal-féle
Írható:
... +C:_1abn-1+bn• szerint
C"i -- C"-l+c"-l i-l I
.
A gyakorlottabb olvasó feladatképpen használja fel ezt a képletet és a Có = cf összefüggést annak matematikai indukcióval való bizonyítására, hogy C~ =n(n-1)(n-2)
(9)
a
,
(n-i+1)
1·2:3
=l
nl
=
il(n-i)l·
i
(Az n l (olv.: "n faktoriális") jelölé(bármely n pozitív egész számra az első n egész szám szorzatát jelöli: n l = l· 2·3· ...• n. Célszerű a Ol-t úgy definiálni, hogy Ol = l legyen, így (9) érvényes lesz i=O és i=n esetére is.) A kéttagúak kifejtésében az együtthatókra adott explicit képletet gyakran nevezik binomiális tételnek. (Lásd még 467 o.) Gyakorlatok: l. 20
Bizonyítsuk
be matematikai
1
1
1.2+2."3+ ... + 1
1+2q+3q2+
·4.
(l +q)(1
s. 6.
7.
...
1 n(n+l)
=
n
n+ 2
+nq,,-1 =
+ q2)(1+ q')
n+l .
l)q"+nq~+l (1-q)2 1
... (I +qZ") =
1
l+xl + (1+x2)Z+.00 + X
n
l-(n+
meg a következö geometriai haladványok 1
a következőket:
+2>' = 2-----zn.
2+22+···
·3.
Határozzuk
2
indukcióval
x!
.
2,,+1
~q -q
összegét: 1 (1+x2)"0 x"
1+ 1+ X2 + (l + X2)! + ... + (I + x2)" . xl_y2
~+~
+ (xz-y!)! ~+~
+ ... + (x!_y2)" ~+~
. 39
Bizonyítsuk be (4) és (5) képletek felhasználásával az alábbiakat: *8.
12
+ 32 + ... + (2 n+
1)2 _ Cn+ 1)(2n + 1)(2n + 3) 3
*9. 10. Igazoljuk ugyanezt az eredményt közvetlenül, matematikai indukcióval
*7. További megjegyzések a matematikai indukcióról A matematikai indukció elve általánosítható egy kissé a következőképpen: "Ha adva van valamilyen állítások As> A,+ l' A,+ 2' ... sorozata, ahol s valamely pozitív egész szám, továbbá ha a) bármely r""'- s értékre Ar+l következik Ar-ből, és b) A,-ről tudjuk, hogy igaz, akkor az összes A:, A.+ l' A,+ 2' ••• állítás igaz; azaz An igaz minden n""'- s-re." Pontosan azt a matematikai érvelést alkalmazhatjuk itt is, amit a közönséges matematikai indukció elvének a bizonyításában használtunk, azzal a különbséggel, hogy az l, 2, 3, ... sorozatot s, s+ l, s+2, s+ 3, ... sorozattal helyettesítjük. Ebben az alakjában használva az elvet, élesíthet jük a 37. oldalon megadott egyenlőtlenséget, kiküszöbölve az ,,=" jel lehetőségét. Azt állítjuk, hogy minden p'" O és :> - l számra és minden n""'-2 egész számra (10) A bizonyítást az olvasóra bízzuk. A matematikai indukció elvének közeli rokona a "legkisebb egész szám elve", amely azt állítja, hogy pozitív egész számok minden nem üres C halmazában van egy legkisebb szám. Egy halmazt akkor mondunk üresnek, ha egyetlen eleme sincs, pl. az egyenes körök halmaza vagy az olyan n egész számok halmaza, amelyekre n:>n. Magától értetődően az ilyen halmazokat kizárjuk tételünk állításából. A C halmaz lehet véges, mint pl. az l, 2, 3, 4, 5 halmaz, vagy végtelen, mint pl. a páros számok halmaza: 2, 4, 6, 8, 10, .... Bármely nem üres C halmaz ban kell lennie legalább egy természetes számnak,legyen ez n, és a C-be tartozó 1,2,3, ... , n egész számok közül a legkisebb lesz a legkisebb C-be tartozó egész szám. Ennek az elvnek a jelentőségét leginkább az mutatja, hogy nem alkalmazható minden, tetszőleges számokat tartalmazó C halmazra. Ha a halmaz például az összes O, ± l, ± 2 ... egész számokat tartalmazza, nincs legkisebb eleme. Ugyancsak nincs legkisebb eleme a pozitív törtek l, 1/2, 1/3, 1/4, ... halmazának sem. Logikai szempontból érdekes, hogy a legkisebb egész szám elvét fel lehet használni a matematikai indukció elvének mint tételnek a bizonyítására. Tekintsünk ebböl a célból bármely olyan Al, A2, Aa, ... állítássorozatot, amelyben a) Ar+ l következik Ar-ből, r bármely pozitív egész szám és b) Al-ről tudjuk, hogy igaz. Kimutat juk, hogy az a feltevés, hogy az A-k akármelyike is hamis, tarthatatlan. Ugyanis ha csak egyetlen A hamis lenne, azoknak az n pozitív egész számoknak a C halmaza, amelyikre An hamis, nem lenne üres halmaz. így a legkisebb egész szám elve szerint C-nek kellene tartalmaznia egy olyan legkisebb p egész számot, amelyik b) miatt nagyobb, mint 1. Ezért Ap hamis lenne, Ap_ l pedig igaz, ami ellentmond aj-nak.
40
Még egyszer hangsúlyozzuk, hogy a matematikai indukció elve egészen másvalami, mint az, amit a természettudományokban indukció alatt értenek. Egy általános törvény igazolása akármilyen nagy, de véges számú esetben sohasem szolgáltathatja a törvény szigorú, matematikai értelemben vett bizonyítását, még akkor sem, ha az adott időben egyetlen kivétel ről sem tudunk. Egy ilyen törvény legfeljebb nagyon valószínű hipotézis marad, nyitva hagyva a lehetőségét későbbi tapasztalatok szerinti változtatásoknak. A matematikában viszont törvényt vagy tételt csak akkor nevezünk bizonyítottnak, ha ki lehet mutatni, hogy valamilyen érvényesnek elfogadott feltevésekbőllogikai szükségszerűséggel következik. Sok példa hozható olyan matematikai állitásra, amit minden eddig tárgyalt egyedi esetre igazoltak, azonban nem bizonyították az általános érvényességét (egy ilyen példa található az 51. oldalon). Számos példán való igazolas után sejthetjük egy tételről, hogy általánosságban igaz, s megkísérelhetjük bizonyítani matematikai indukcióval. Ha a kísérlet sikerrel jár, bebizonyítottuk a tételt, ha nem, a tétel lehet igaz vagy hamis, s egyszer még sikerülhet valamilyen más módon bebizonyítani vagy megcáfolni. Ha a matematikai indukciót használjuk, mindig meg kell győződni, hogy az a) és b) feltételek valóban teljesülnek-e. Ennek az elővigyázari szabálynak az elhanyagolása az alábbiakban bemutatandó értelmetlenséghez hasonló dolgokra vezethet. Be fogjuk "bizonyítani", hogy bármely két pozitív egész szám egyenlő, pl. 5= 10. Az olvasóra bízzuk annak a felfedezését, hol van a gondolatmenetben a hiba. Először egy definíció: Ha a és b két nem egyenlő pozitív egész szám, jelentse max (a, b) a nagyobbat a és b közül; ha pedig a= b, legyen max (a, b)= a=b. így pl. max (3,5)=max (5,3)= 5, és max (4,4)=4. Legyen most An a következő állítás: "ha a és b bármely két olyan pozitív egész szám, amelyekre max (a, b)=n, akkor a=b." Tételezzük fel, hogy Ar igaz. Legyen a és b bármely két olyan pozitív egész szám, amelyekre max (a, b)= r+ 1. Tekintsük IX = a-l és {3=b-1 egész számokat; akkor max (IX, {3)= r. Tehát IX={3, mert feltételezzük, b) A l nyilvánvalóan igaz, mivel ha max (a, b)= l, akkor I-gyel, mivel feltevésünk szerint mind a kettő pozitív egész elve szerint következik, hogy An minden n-re igaz. Mármost, ha a és b két tetszőleges pozitív egész szám, mutattuk, hogy An minden n-re igaz, azért igaz Ar is, tehát
hogy Ar igaz.
a és b egyaránt egyenlő kell legyen szám. Ezért a matematikai indukció jelöljük max (a, b)-t r-rel. Mivel kia= b.
Kiegészítés
az Lfejezethez
Számelmélet Bevezetés A természetes számok lassanként elvesztették misztikus nimbuszukat, de a matematikusok és laikusok érdeklődése sohasem csökkent a számok világának törvényei iránt. Euklidész hírneve Elemeinek geometriai részén alapul; az Elemek a mai napig erősen hat az iskolai geometriaoktatásra. Pedig Euklidész geometriája lényegileg régebbi eredmények összefoglalása, míg a számelméletben valószínűleg önálló eredményeket ért el. Alexandriai Diophantosz (i. sz. 275 körül), az algebra egyik korai nagymestere, is rajta hagyta kézjegyét a számelméleten. Pierre de Fermat (1601-1665), Toulouse-i jogász, kora egyik legnagyobb matematikusa, indította el ezen a területen a modern értelemben vett kutatást. Euler (1707-1783) minden idők legtermékenyebb matematikusa, sok számelméleti jellegű problémával is foglalkozott. A matematika annaleszeinek nagy nevei Legendre, Dirichlet, Riemann - folytatják a sort. Gauss (1777-1855), az újkor egyik legnagyobb és legsokoldalúbb matematikusa, aki a matematika számos ágával foglalkozott, állítólag azt mondotta volt, hogya "matematika a tudományok királynője, a matematika királynője pedig a számelmélet".
1. § Primszámok l. Alapvető tények
A számelmélet állításai, mint egyébként a matematika állításai általában, nem egyetlen objektumra - mondjuk az 5-ös vagy 32-es számra - vonatkoznak, hanem az objektumok egy egész, valamilyen közös tulajdonsággal rendelkező osztályára, amilyen pl. az összes páros szám osztálya: 2,4,6,8,
... ,
vagy az összes hárommal osztható számból álló osztály: 3, 6, 9, 12, ... , 42
vagy az egész számok négyzeteinek az osztálya: 1, 4, 9, 16, ... ,
és így tovább. Alapvető fontosságú a számelméletben a prímszámok osztálya. A legtöbb egész szám kisebb tényezőkre bontható fel: 10=2·5, 111=3·37,144=3·3·2. ·2·2·2 stb. Azokat a számokat, amelyek nem bonthatók fel további tényezőkre, prímszám oknak vagy prímeknek nevezzük. Ponto sabba n, az olyan egynél nagyobb p egész számot nevezzük prfmszámnak, amelyiknek egyen és önmagán kívül nincs más osztája. (Egy a egész számot akkor mondunk egy másik b egész szám osztójának vagy faktorának, ha létezik egy olyan c egész szám, amelyik kielégíti a b = =acegyenlőséget.)A2, 3, 5, 7,11,13,17, ... számokprímszámok, míg pl. 12 nem az, mert 12= 3 ·4. A prímszámok osztályának a fontossága annak köszönhető, hogy minden egész szám kifejezhető prímszámok szorzataként: ha valamely szám maga nem prím, lépésenként faktorizálható, míg minden faktora prímszám lesz: így pl. 360= 3 ·120=3 ·30·4=3·3 ·10·2·2= 3.3.5.2.2.2=23.32.5. Valamely 0tól és l-től különböző egész számot, amely nem prím szám, összetett számnak nevezünk. Egyik legelső kérdés a prímszámok osztályával kapcsolatban az, hogy véges sok prímszám létezik-e, vagy pedig a prímszámok osztályának ugyanúgy végtelen sok eleme van, mint az egész számok osztályának, amelynek a prímszámok osztálya egy részét képezi. A felelet az, hogy végtelen sok prímszám létezik. A prímszámok halmazának végtelenségét bizonyító euklidészi következtetésmód örök példaképe a matematikai bizonyítás nak. Euklidész az indirekt bizonyítást alkalmazta. Abból a feltevésből indulunk ki, hogy a tétel nem igaz. Jelen esetben ez a feltevés annyit jelent, hogy csak véges sok prímszám létezik, talán nagyon sok - egy billió akár, vagy még több - vagy, általános és meg nem kötött módon kifejezve: n, ami meghatározott véges szám. Indexeket használva, jelöljük PI, P2' .•. ,Pn-nel ezeket a prímszámokat. Minden más szám összetett szám, s így osztható nak kell lennie a Pl' P2' ... , Pn prímszámok közül legalább eggyel. Ki fogjuk mutatni, hogy ez az állitás ellentmondásra vezet, mert előállithatunk egy olyan A számot, amelyik a PI, P2' ... , Pn prímszámok mindegyikétől különbözik, mert mindegyiküknél nagyobb, s mégsem osztható egyikőjükkel sem. Ez a szám A
= PIP2 ... P« + 1,
azaz l-gyel nagyobb az összes feltételezett prímszám szorzatánál. A nagyobb, mint a p számok bármelyike, ezért összetett számnak kell lennie. De ha A-t elosztjuk pl-gyel vagyP2-vel, vagy bármelyik P számmal, mindig marad 1, ezért egyik P szám sem osztója A-nak. Mivel azonban ez ellentmond annak a feltevésünknek, hogy 43
csak véges sok prímszám létezik, a feltevés abszurd, s az ellenkezője kell, hogy igaz legyen. Ezzel bebizonyítottuk tétel ünket. Bár ez a bizonyítás indirekt, mégis könnyen módosítható úgy, hogy - legalábbis elméletben - módszert kapjunk a prímszámok egy végtelen sorozatának az elöállítására. Induljunk ki valamilyen prímszámból, legyen pl. PI = 2, és tételezzük fel, hogy ismerünk n prímszámot : Pl> P2' ... , Pn-et. Megjegyezzük (mint fentebb), hogya PIP2 ... Pn+ l szám vagy maga is prím, vagy van egy prímosztója, amely különbözik a már ismertektöl. Mivel ez a prímosztó próbálkozással mindig egyszerűen megtalál ható, bizonyosak lehetünk, hogy minden esetben található legalább egy új Pn+ 1 prímszám. Ezen a módon haladva belátható, hogy az előállítható prímszámok sorozata sehol sem ér véget. Gyakorlat: Állítsunk elő a fentiek alapján Pl=2 és P2=3-ból kiindulva további 5 prímszámot.
Prímszámok szorzataként előállított számban a prímtényezők tetszőleges sorrendbe írhatók. Rövid próbálgatással beláthatjuk, hogy ettől az egy önkényességtől eltekintve, valamely N szám prímtényezőkre való felbontása egyértelmű: minden l-nél nagyobb N egész szám egy és csakis egyféleképpen bontható fel prímtényezők szorzatára. Ez az állítás első pillanatra annyira nyilvánvalónak látszik, hogyanem szakember kész minden további nélkül elfogadni. Mégsem trivialitás, és a bizonyítása - jóllehet teljesen elemi eszközökkel oldható meg - egy kis éleselméjűséget követel. A klasszikus bizonyítás, amit Euklidész erre az "aritmetika alaptételév-nek nevezett tételre ad, két szám legnagyobb közös osztójának a megkeresésére szolgáló "algoritmus" -on alapul. Ezt a módszert a 63. oldalon fogjuk tárgyalni. Itt ehelyett egy újabb bizonyítást adunk, ami valamivel rövidebb és talán szellemesebb, mint az Euklidészé. A levezetés tipikus példája az indirekt bizonyításnak. Először is feltételezzük, hogy létezik olyan természetes szám, amelyet két, lényegesen különböző módon lehet prímtényezők szorzatára bontani, és ebből a feltevésből vezetjük le az ellentmondást. Ez az ellentmondás azt mutatja, hogy tarthatatlan feltevés a két lényegesen különböző prímtényezőre való felbontás lehetősége, tehát minden szám prímtényezőkre való felbontása egyértelmű. *Ha létezik olyan pozitív egész szám, amely két lényegesen különböző módon bontható prímtényezők szorzatára, akkor kell lennie egy legkisebb ilyen tulajdonságú számnak (1.40. o.), legyen ez m: (1)
ahol a p-k és a q-k prímszámok. Ha a p és q számokat szükség szerint átrendezzük, feltehetjük, hogy
Pl nem lehet egyenlő ql-gyel, mivel ha egyenlő lenne, az (1) egyenlet mindkét ol-
dalán elhagyhatnánk az első tényezőt, és így olyan egész számnak kapnánk két 44
lényegesen különböző prím felbontását, amelyik kisebb, mint m, holott feltevésünk szerint m a legkisebb ilyen tulajdonságú egész szám. Tehát vagy Pl < ql' vagy ql 4 esetére az F(n) számok között prim. Egy másik figyelemre méltó és egyszerű, sok prímszámot előállító kifejezés a következő:
n = l, 2,3, ... ,40 esetére f(n) prímszám, n=41 esetében azonban f(n)=412, ami már nem prímszám. Az n2 -79n
+ 1601
kifejezés csupa prímszám ot ad egészen n=79-ig, de ha n=80, már nem. Egészében véve, csupa prímszámot szolgáltató egyszerű kifejezések keresése hiábavaló munkának bizonyult. Még reménytelenebb vállalkozás lenne olyan algebrai képletet keresni, amelyik az összes prímszámot megadná. b) Prímszámok a számtani sorokban
Egyszerű volt annak az igazolása, hogy az egész számok l, 2, 3, 4, ... sorozatában végtelen sok prímszám van. Sokkal nehezebb lépés volt már ennek a tételnek az általánosítása olyan sorozatokra, mint pl. 1, 4, 7, 10, 13, ... vagy 3, 7, 11, 15, 19, ... , vagy általánosságban, bármely olyan a, a-s-d, a-s-Ld, ... , a+nd, ... számtani sorra, amelyben a és d számoknak nincs közös osztója. Minden megfigyelés arra utalt, hogy az ilyen számtani sorokban éppen úgy végtelen sok prímszám van, mint a természetes számok l, 2, 3, ... sorozatában. Az általános tétel bizonyítása azonban nagyon fáradságos volt. A XIX. század egyik legkiválóbb matematikusa, Lejeune-Dirich/et (1805-1859) oldotta meg a kérdést a matematikai analízis akkoriban leghaladottabbnak számító eszközeivel. Eredeti közleményei ma is a matematika kiemelkedő eredményei közé tartoznak, de száz év alatt sem sikerült bizonyítását annyira egyszerűsíteni, hogy az az infinitezimális számításban és a függvénytanban kevésbé járatosak számára is hozzáférhető legyen. Nem kísérelhet jük meg e helyen Dirich/et általános tételének a bizonyítását, viszont egyes speciális számtani sorokra, mint amilyen pl. 4n + 3 vagy 6n + + 5, könnyen általánosíthat juk Euklidész prímszámok végtelenségére vonatkozó bizonyítását. Vegyük a 4n + 3 esetet. Minden 2-nél nagyobb prímszám páratlan (egyébként osztható lenne 2-vel) és így vagy 4n + 1 vagy 4n + 3 alakú, ahol n 47
tetszőleges egész szám. alakú szám, mivel (4a+1)(4b+1)
Továbbá
két 4n+ l alakú
= 16ab+4a+4b+1
szám szorzata
újból ilyen
= 4(4ab+a+b)+1.
Tételezzük fel már most, hogy véges számú 4n + 3 alakú Pl' P2' ... , Pn prímszám létezik, és tekintsük az N = 4(PIP2'"
P,,) -1 = 4(PI ... P« -1)+3
számot. Vagy N maga prímszám, vagy felbontható a Pl, ... , P» számoktól különböző prímszámok szorzatára, ugyanis a Pl, ... , Pn prímszámok bármelyikével osztva -1 maradékot kapunk. Továbbá N minden prímtényezője nem lehet 4n + 1 alakú, mivel N nem ilyen alakú, és láttuk, hogy 4n + l alakú számok szorzata újból 4n + 1 alakú. Kell tehát lenni legalább egy 4n + 3 alakú prímtényezőnek N felbontásában, de ez lehetetlen, hiszen láttuk, hogy a p számok egyike sem lehet N prímtényezője, márpedig feltevésünk szerint a P számokon kívül nincs több 4n + 3 alakú prímszám. Tehát az a feltevés, hogy véges sok 4n + 3 alakú prímszám létezik, ellentmondásra vezetett, és így végtelen sok 4n + 3 alakú prímszámnak kell lenni. Gyakorlat. Bizonyítsuk
be a megfelelő tételt a 6n+5 számtani haladványra.
c) A prímszámtétel A prímszám ok eloszlását megadó törvény keresésében döntő lépés volt, hogy a matematikusok feladták az összes prímszámot vagy az első. n egész szám között található prímek pontos számát megadó, egyszerű matematikai képlet megtalálásának hiú reményét, és ehelyett a prímszámok egész számok közötti átlagos sűrűsége iránt kezdtek érdeklődni. Jelölje An bármely n természetes szám esetén az l, 2, 3, ... , n egész számok között előforduló prímek számát. Aláhúzva az első természetes számok sorozatában aprímeket: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, megállapíthatjuk Al
= 0,
A2
AII=A12=S,
An néhány
=
1, A3
első értékét :
= A4 = 2,
As
= A6 = 3, A7 = As = A9 = AIO = 4,
A13=A14=AIS=AI6=6,
AI7=AIS=7,
A19=8
és így tovább. Ha vesszük az n értékeinek mondjuk
48
bármely,
minden határon
túl növekvő sorozatát,
sorozatot, akkor a megfelelő An értékek
sorozata is minden határon túl növekszik (bár lassabban), Tudjuk, hogy végtelen sok prímszám létezik, így az An értékei előbb-utóbb bármely véges számon A
túlhaladnak. A prímszámok első n egész szám közötti "sűrűségét" az _n arány n adja meg. Ez az arány prímszámtáblázatokból n-nek néhány nagy értékére empirikusan kiszámítható. n 103 106
109
An
I
n
0,168 0,078498 0,050847478
............ A táblázat utolsó bejegyzése pl. úgy tekinthető, mint annak a valószínűsége, hogy egy, az első 109 egész szám közül véletlenszerűen választott egész szám prím lesz, ugyanis a 109 lehetséges választás közül AI09 számú választás vezet prímszámra. Az egyes prímszámoknak a természetes számok közötti eloszlása roppant A
szabálytalan. De ez a "kicsiben" észlelhető szabálytalanság eltűnik, ha az ----;arány által megadott átlagos prímszám sűrűséget tekintjük. A matematika egyik legmeglepőbb felfedezése, hogy milyen egyszerű törvény szabja meg ennek az aránynak a viselkedését. Ennek a primszámtételiies: a kimondásához azoriban szükségünk van n egész szám "természetes logaritmusá" -nak a definiálására. Vegyünk fel a síkban két egymásra merőleges tengelyt, és tekintsük a sík azon pontjainak az összességét, amelyekre a tengelyektől vett x és y távolságok szorzata l-gyel egyenlő. Ezt a "geometriai hely"-et x és y ko- 5. ábra. A hiperbola alatti vonalordinátákban kifejezve az xy = 1 egyenlet defi- kázott rész területe definiálja ln n·et niálja, s a neve "egyenlő szárú hiperbola". Mármost definíciószerűen ln n az a terület, amit az 5. ábrán az egyenlő szárú hiperbola, az x-tengely és az x= 1, x=n függőleges ek határolnak. (A logaritmus bővebb tárgyalása a nyolcadik fejezetben található.) Gauss a prímszámtáblázatok empi4 M: a maternati ka?
49
rikus tanulmányozásából
arra a következtetésre jutott, hogy az An arány megn
l
közelítően egyenlő --nel, és hogy ez a megközelítés n növekedtével egyre ponln n "An/n, az l/ln n aranya d'Ja meg, mel yne k erte'k'et tosa.bb A meg köozel"ítés pontossagat é
n = 1000, 1 OOO000, l OOOOOOOOOesetében az alábbi táblázatban közöljük: n 103 106 109
l/ln n
An/n 0,168 0,078498 0,050847478
.........
0,145 0,072382 0,048254942
.
An/n
l/ln n 1,159 1,084 1,053
..........
Ilyen empirikus adatok alapján Gauss azt a sejtést mondotta ki, hogy az
~n
arány "aszimptotikusan egyenlő" 1/ln n értékével. Ezen azt kell érteni, hogy növekvő n értékek valamely, mondjuk a fenti 10, 102, 103, 104,
•••
sorozatát tekintve, az egymás utáni n értékekre számított An/n
l/1n n arány egyre inkább megközelíti l-et, és az arány l-től való különbsége tetszőlegesen kicsinnyé tehető, ha elegendően nagynak választ juk n értékét. Ezt a tényt szimbolikusan jellel fejezzük ki: rv
An n
rv--
ln 11
tehát azt jelenti, hogy
n növekedtével l-hez tart. Abból a tényből is nyilvánvaló, hogya rv jelet nem szabad a közönséges = egyenlőségjellel felcserélni, mert míg An mindig egész szám, n/ln n nem az.
Igen figyelemre méltó felfedezés, hogyaprímszámok eloszlása leírható a logaritmus függvénnyel. Meglepő ugyanis, hogy két látszólag annyira távol álló matematikai fogalom ilyen szoros kapcsolatban van egymással. A Gauss sejtésében kimondott állítást könnyű megérteni, de a sejtés szigorú matematikai bizonyítása messze meghaladta a Gauss-korabeli matematika lehetőségeit. Jóllehet a tétel csak a legelemibb matematikai fogalmakat tartalmazza, bizonyítása a modern matematika leghaladottabb módszereit igényelte. Csak50
nem száz évig tartott, amíg az analízis odáig fejlődött, hogy Hadamard Párizsban (1896) és de la Vallée Poussin Louvainban (1896) a prímszámtétel teljes bizonyítását tudták adni. Később von Mangoldt és Landau egyszerűsítették és jelentősen módosították a bizonyítást. Jóval Hadamard előtt Riemann (1826--1866) végzett ezen a területen döntő úttörő munkát, kijelölve egy híres értekezésében a támadás fő stratégiai vonalait. Újabban Norbert Wiener amerikai matematikusnak sikerült kiküszöbölni a bizonyításból a gondolatmenet egy fontos lépésében addig használt komplex számokat. De a prímszámtétel bizonyítása még így sem könynyű, felsőéves matematika szakos hallgatónak sem. A 474. és következő oldalakon még visszatérünk majd a kérdésre. d) Két, prímszámokra
vonatkozó
megoldatlan probléma
Míg a prímszámok átlagos sűrűségének problémája kielégítően megoldódot addig sok más olyan sejtés van a számelméletben, amelyet alátámaszt ugyan a tapasztalat, de amelyet még a mai napig nem sikerült bebizonyítani. Ezek közé tartozik a híres Goldbach-sejtés. Goldbach (1690-1764), azzal vált jelentőssé a matematika történetében, hogy 1742-ben, Eulerhez írott levelében felvetette ezt a problémát. Megfigyelte, hogy az általa kipróbált esetekben bármely páros számot elő lehetett állítan i két prímszám összegeként (a 2 kivételével, amelyik maga is prímszám). Pl.: 4 = 2+ 2, 6 = 3 + 3, 8 = 5+ 3, 10 = = 5+5,12 = 5+7,14 = 7+7,16 = 13+3,18 = 11+7,20 = 13+7, ... ,48 = = 29+19, ... ,100 = 97+3 és így tovább. Goldbach azt kérdezte Eu!ertől, be tudja-e bizonyítani, hogy ez a tétel minden páros számra áll, vagy tud-e ellenpéldát adni. Euler erre sohasem válaszolt, s mostanáig senki sem találta meg a bizonyítást vagy az ellenpéldát. A tapasztalat igen erősen amellett szól, hogy minden páros szám előállítható ilyen módon, amint azt bárki számos példán kipróbálhatja. A probléma azért olyan nehéz, mert a prímszámokat szorzás útján definiáljuk, míg itt összeadásról van szó. Az egész számok multiplikatív és additív tulajdonságai között pedig egyébként is nehéz összefüggéseket találni. Goldbach sejtése egészen a legutóbbi időkig teljesen megközelíthetetlen volt a bizonyítás szempontjából. Ma a megoldás nem látszik többé reménytelennek. Az első váratlan és minden hozzáértő számára megdöbbentő eredményt 1931-ben érte el egy akkoriban fiatal és ismeretlen orosz matematikus, Snirelmann (19051938), bebizonyítva, hogy minden pozitív egész szám előállítható 300 OOO~nél nem több prímszám összegeként. Lehet, hogy ez az eredmény nevetségesen szerénynek látszik a Goldbach-sejtés eredeti céljához képest, mégis ez volt a legelső lépés a bizonyítás irányába. Snirelmann bizonyítása direkt, konstruktív, bár nem ad gyakorlati módszert tetszőleges egész szám prímfelbontására. Újabban L M. Vinogradov orosz matematikusnak sikerült - Hardy, Littlewood és 4·
51
indiai munkatársuk, Ramanujan eredményeinek a felhasználásával - lecsökkenteni ezt a számot 300 OOO-ről4-re. Vinogradov azonban csak minden "elegendően nagy" egész számra bizonyította be tételét, pontosabban azt bizonyította be, hogy létezik olyan N egész szám, amely nél nagyobb minden n egész szám előállítható legfeljebb 4 prímszám összegeként. Vinogradov bizonyítása alapján nem lehet megbecsülni N-et, ellentétben Snirelmann tételével, Vinogradové lényege szerint indirekt, nem konstruktív bizonyítás. Vinogradov voltaképpen azt a tételt bizonyította be, hogy a következő állítás: "nem lehet végtelen sok egész számot legfeljebb 4 prímszám összegére felbontani", ellentmondásra vezet. Íme egyjó példa a két bizonyítástípus, direkt és indirekt közötti lényeges különbségre. (L. általános tárgyalását a 105. oldalon.) Végül említsünk meg még egy megoldatlan problémát, amely legalább olyan érdekes, mint a Goldbach-sejtés, s amelynek megoldása még sehol sem tart. Megfigyelték, hogyaprímszámtáblázatokban gyakran fordulnak elő p és p+2 alakú párok. Ilyenek pl. 3 és 5, 11 és 13,29 és 31 stb. Nyilvánvalónak látszik az a feltevés, hogy végtelen sok ilyen pár létezik, de eddig még nem történt döntő lépés a bizonyítására. 2_ § Kongruenciák 1. Alapfogalmak
Mindenütt, ahol egész számok valamely rögzített d egész számmal való osztásáról van szó, a (Gausstól származó) "kongruencia"-fogalom használatos a tárgyalás tisztábbá és egyszerűbbé tételére. A fogalom bevezetése kedvéért vizsgáljuk, hogy milyen maradékokat kapunk, ha az egész számokat rendre 5-tel osztjuk: 0=0·5+0 1=0·5+1 2 = 0-5+2 3 = 0-5+3 4 = 0-5+4 5 = 1-5+0 6=1-5+1
7 = 1-5+2 8 = 1-5+3 9 = 1-5+4 10 = 2-5+0 11 = 2-5+1 12 = 2-5+2 és így tovább
-1=-1·5+4 -2 = -1-5+3 -3=-1-5+2 -4=-1-5+1 -5 = -1·5+0 -6 = -2·5+4 és így tovább ..
Láthatjuk, hogy bármely egész számot 5-tel elosztva, a maradék a O, 1, 2, 3, 4 egész számok egyike. Ha két egész szám, a és b 5-tel osztva ugyanazt a maradékot adja, akkor azt mondjuk, hogy a két szám "kongruens modulo 5". Így pl. 2, 7, 12, 17, 22, ... , - 3, - 8, -13, -18, ... valamennyi kongruens modulo 5, mivel 5-tel osztva mindegyik 2-t ad maradékul. Általában, azt mondjuk, hogy két egész szám a és b kongruens modulo d, ahol d meghatározott egész szám, 52
ha a és b d-vel osztva ugyanazt a maradékot adják, azaz ha létezik olyan n egész szám, amelyik kielégíti az a-b=nd egyenletet. Pl. 27 és 15 kongruens modulo 4, mivel 27 = 6·4+ 3, 15=3·4+3. A kongruencia fogalma annyira hasznos, hogy kívánatos rövid jelölést bevezetni rá. Jelölje a == b (mod d) azt a tényt, hogya és b kongruens modulo d. Ha a modulust illetően nem lehet kétség, a "mod d" elhagyható a formulából. (Azt a tényt, hogyanem kongruens b-vel modulo d, a következőképpen jelöljük: a ~ b (mod d).) Kongruenciákkal gyakran találkozunk mindennapi életünkben. Például az óra mutatói modulo 12 mutatják az időt, az autó kilométerjelzője modulo 100 OOOmutatja a megtett kilométereket. Mielőtt rátérnénk a kongruenciák részletes tárgyalására, kérjük az olvasót, figyelje meg, hogy az alábbi állítások ekvivalensek: 1. a kongruens b-vel modulo d.
2. van olyan n egész szám, amelyre a = b + nd. 3. d osztója (a ~ b)-nek. A Gauss-féle kongruencia-jelölés azért olyan hasznos, mert valamely rögzített modulus szerint vett kongruencia formális szempontból sok tekintetben hasonlít a közönséges egyenlőséghez. Az a = b reláció legfontosabb formális tulajdonságai a következők: l) Bármely a-ra a = a. 2) Ha a = b, akkor b =a. 3) Ha a = b és b = c, akkor a Továbbá, ha a
= a'
=
c.
és b = b', akkor
4) a-i-b = a' +b'. 5) a - b = a' - b'. 6) ab = a'b', Ezek a tulajdonságok igazak maradnak akkor is, ha az a = b egyenlőséget az a == b (mod d) kongruenciával helyettesítjük. Tehát 1') Bármely a-ra a == a(mod d). 2') Ha a := b(mod d), akkor b := a(mod d). 3') Ha a := b(mod d) és b := c(mod d), akkor a
:=
c(mod d).
Ezeknek a tényeknek az igazolása triviális, az olvasóra bízzuk.
Továbbá, 4') a-i-b 5') a-b 6') ab
ha a
== ==
==
a'(mod d) és b
==
b'(mod d), akkor
a' -s-b' (mod d). a' -b' (mod d). a'b' (mod d).
Tehát ugyanazon modulus szerint vett kongruenciák összeadhatók, kivonhaták és szorozhaták, Ennek a három állításnak a bizonyítására elég a következőt megemlíteni: Ha b=b'+sd,
a = a' +rd, akkor
a-i-b =a'+b'+{r+s)d, a -b ab amiből
= a' -b' +(r -s)d,
=
a'b' +(a's+
b'r+ rsd)d,
fenti állítás unk következik.
Jobban megvilágosítja a kongruencia fogalmát geometriai interpretációja. Ha az egész számokat geometriailag akarjuk ábrázolni, általában veszünk egy -3
-2
o
2
3
6. ábra. Az egész számok geometriai ábrázolása
egységnyi hosszúságú szakaszt, s ezt mindkét irányban meghosszabbítva, ismételte n felmérjük az így kapott egyenesre. Az így nyert pontok mindegyikét megfeleltethet jük egy-egy egész számnak, amint az a 6. ábrán látható. Ha azonban modulo -4 -5 2 1 d tekintjük az egész számokat, akkor bár8 7 mely két kongruens számot azonosnak kell tekinteni a d-vel való osztás szempontjából, mivel ugyanazt a maradékot adják. Ezt a tényt geometriailag d egyenlő részre osztott -3 3 ~ körrel ábrázolhatj uk. Bármely egész számot 9 12 osztva d-vel a 0, l, ... , d-l számok valamelyikét kapjuk maradékként, ezeknek feleltetjük meg a d egyenlő részre osztott kör osztási pontjait. Minden egész szám kon-2 -1 gruens modulo d a 0, l, ..., d -l számok 4 5 10 JI valamelyikével, és így geometriailag a kör osztáspontjainak valamelyikével ábrázol7. ábra. Egész számok geometriai ábható; két szám akkor kongruens, ha rázolása modulo 6
.
54
ugyanaz a pont ábrázolja. A 7. ábra d = 6 esetre érvényes. Az óra számlapja a mindennapi életből vett illusztráció a d= 12-re A kongruenciák 6') multiplikatív tulajdonságának a felhasználására szolgáló példaként határozzuk meg a maradékot 10 hatványainak valamely adott számmal való osztásaiban. PI.: 10= -1 (mod 11), mivel 10 =
l + ll. Szorozva ezt a kongruenciát egymás után önmagával:
-
102 = (-1)( -1) = 1
(mod 11),
103 = -1
(mod 11), (mod 11) stb·
Kimutathatjuk
ennek alapján, hogya tízes számrendszerben kifejezett bármely z
= aO+al . 10+a2' 102+ ... +an'
IOn
egész szám ll-gyel osztva ugyanazt a maradékot adja, mint váltakozó előjellel vett számjegyeinek összege: Ugyanis
= al' 11+az(102-1)+a3(103+1)+a4(104-1)+
.... 2 3 Mivel pedig a ll, 10 -1, 10 + l, ... számok mind kongruensek O-val modulo ll, kongruens z-t is, és így z-t osztva ll-gyel ugyanazt a maradékot kapjuk, mint ha t-t osztjuk ll-gyel. Következésképpen valamely szám akkor és csakis akkor osztható ll-gyel (azaz akkor lesz a maradék O),ha a számjegyeinek váltakozó előjellel vett összege osztható ll-gyel. PI. mivel 3 -1 + 6- 2 + 8 -1 + 9 = 22, a z=3 162819 szám osztható ll-gyel. Még könnyebb a 3-mal vagy 9-cel való oszthatóság szabályát megtalálni, mivel 10 = 1 (mod 3 vagy 9), tehát IOn = 1 (mod 3 vagy 9) bármilyen egész szám is n. Következésképpen z szám akkor és csak akkor osztható 3-mal vagy 9-cel, ha számjegyeinek z-l
s = aO+al +a2+a3+'" összege osztható 3-mal, illetve 9-cel.
+an
Modulo 7 vett kongruenciák esetében 10 = 3, 102 =2, 103= -1, 104= -3,105=
-2,106
= 1.
A további maradékok azután ismétlődnek. Tehát z akkor és csak akkor osztható 7-tel, ha az r = aO+3al +2a2 -a3 -3a4 -2as +a6 +3a7 + ... kifejezés osztható 7-tel. Feladat: Keressünk
hasonló szabályt a l3-mal való oszthatóságra.
55
Tekintsünk rögzített modulusú kongruenciákat, legyen pl. d= 5. Ebben az esetben a kongruenciák összeadásánál és szorzásánál mindig elkerülhetjük a nagy számokat, ha valamely a számot egy vele kongruens számmal helyettesítjük a Ü, 1, 2, 3, 4
számok közül. Így a modulo 5 vett egész számok összegeinek és szorzatainak a kiszámítására csupán az alábbi összeadó- és szorzótáblára van szükség. a+b 1 2 3 b=ü a=ü ü 1 2 3 l l 2 3 4 2 2 3 4 ü 3 3 4 ü l 4 4 ü l 2
a-b l 2 3 b=ü a=ü ü ü ü ü l ü l 2 3 2 ü 2 4 l 3 ü 3 l 4 4 ü 4 3 2
4 4 ü l 2 3
4 ü 4 3 2 l
A második táblábóllátszik,
hogy valamely ab szorzat akkor és csak akkor kongruens ü-val (mod 5), ha vagy avagy b = ü (mod 5): Ez a tény az alábbi általános szabályra utal: 7) ab = ü (mod d) akkor és csak akkor, ha vagy a = ü vagy b = ü (mod d). Ez a szabály általánosítása az egész számokra érvényes ama szabálynak, hogy ab = ü akkor és csak akkor igaz, ha vagy a=ü vagy b=ü. A 7) szabály akkor és csak akkor igaz, ha d modulus prímszám. Ugyanis az ab = ü
(mod d)
kongruencia annyit jelent, hogy d osztója ab-nek, és láttuk, hogy d prímszám akkor és csak akkor osztója ab szorzatnak, ha osztója a-nak vagy b-nek: azaz ha a = ü
(mod d),
vagy
b
== ü (mod
d)~
Ha d nem prímszám, a szabály nem szükségképpen érvényes, legyen pl. d=r+s, ahol r és s kisebbek, mint d úgy, hogy r ;ié ü
de
(mod d), s;ié ü (mod d),
rs = d = ü
(mod d).
Pl. 2;iéü (mod 6) és 3;iéü (mod 6), de 2-3 = 6=ü (mod 6). Gyakorlat: .Mutassuk
ki, hogy prím modulusú kongruenciákra
érvényes
az alábbi
egy-
szerüsltési szabály: Ha
ab e ac
és
a •• O,
Gyakorlatok: l) Melyik O és 6 közötti 11·18·2322·13·19 szorzat modul o 7?
56
akkor
bEc.
számmal (ezt a kettőt is beleértve) kongruens
a
2) Melyik O és 12 közötti számmal (O-t és 12-t is beleértve) kongruens a 3·7 ·11·17 ·19·23· ·29 ·113 szorzat modulo 13 ? 3) Melyik O és 4 közötti számmal (O-t és 4-et is beleértve) kongruens modulo 5 az 1 + 2+ +22+ ... +219 összeg?
2. A kis Fermat-tétel A modern számelmélet megalapítója, Fermat, aki a XVII. században élt, a következő igen fontos tételt fedezte fel: Ha egy tetszőleges p prímszám nem
osztója az a egész számnak, akkor aP-1
=1
(mod p).
Ez a tétel azt állítja, hogya szám (p - 1)-edik hatványát p-vel osztva a maradék
1.
Fenti számításaink egynémelyike megerősíti ezt a tételt; pl. azt találtuk, hogy 106= 1 (mod 7), 102= 1 (mod 3) és 1010= 1 (mod 11). Hasonlóképpen kimutathatjuk, hogy 212 1 (mod 13) és 510 1 (mod 11). Az utóbbi két kongruencia ellenőrzésére nem szükséges ténylegesen kiszámítanunk a bennük szereplő magas hatványokat, mivel a kongruenciák multiplikatív tulajdonságát figyelembevéve:
24 28 212
= 16 = 3 = 9 = -4 = -4, 3
=
=
=
(mod 13), (mod 13), 1 (mod 13),
-12
=
• Fermat tételének bizonyítására
52
5~ 58 510
tekintsük
=3 = 9 = -2 =4 = 3 . 4 = 12 = 1
a többszöröseit
ml = a, m2 = 2a, m3 = 3a, ... , mp-1
(mod (mod (mod (mod
11), 11), 11), 11) .
:
= (p -l)a.
Ezen egész számok között nem lehet kettő kongruens modulo p, mivel akkor lenne olyan egész szám pár r, s 1 ;2r-·=n n+ 1 ' q q
q
s ezzel a tételt bebizonyítottuk. A legutóbbi néhány évtized alatt sokkal messzebb jutottak az algebrai számok racionális számokkal való megközelítésének a lehetőségében. Például A. Thue (1863 -1922) norvég matematikus bebizonyította, hogya (3) alatt megadott Liouville-féle egyenlőtlenségben az n+ l kitevő felcserélhető (n/2) + l + e-nal, (ahol e tetszőlegesen kicsi pozitív szám). Később C. L. Siegel kimutatta, hogya még élesebb állítás (élesebb nagy n-re) érvényes 2yn kitevővel. Legújabban K. F. Roth még azt is bebizonyította, hogy - a z algebrai szám n fokszámától függetlenül - minden 2 + e szám elfogadható kitevő a (3) egyenlőtlenségben, míg maga a 2 már nem fogadható el. A transzcendens számok felfedezésük óta rendkívül érdekelték a matematikusokat. De a legutóbbi időkig csak igen kevés, önmagában véve fontos számról sikerült csak kimutatni, hogy transzcendens. (A III. fejezetben tárgyalj uk rnajd zr transzcendens voltát, amiből következik a kör körzővel és vonalzóval való négyszögesítésének a lehetetlensége.) David Hilbert 1900-ban a párizsi nemzetközi matematikus kongresszuson tartott híres előadás ában harminc olyan egyszerűen. egyes esetekben elemi matematikai, sőt köznyelven megfogalmazható matematikai problémát vetett fel, amelyek egyszerű megfogalmazhatóságuk ellenére megoldatlanok voltak, és az akkori matematikai technika számára nem is látszottak egyhamar megoldhatónak. Ezek a "Hilbert-féle problémák" kihívásként állottak a következő korszak matematikai fejlődése előtt. Azóta majdnem mindet megoldották, s a megoldás gyakran nagy haladást jelentett a matematikai megismerés és az általános módszerek tekintetében. Az egyik legreménytelenebbnek látszó
124
probléma annak a bizonyítása volt, hogy
li: transzcendens, vagy akár csak, hogy irracionális szám. Csaknem három évtizeden át a leghalványabb remény sem mutatkozott arra; hogy valamilyen irányból meg lehetne közelíteni a problémát. Végül Siegel és tőle függetlenül az akkor ifjú szovjet matematikus, A. Gelfond, majd Siegel tanítványa, Th. Schneider új módszereket fedeztek fel számos, a matematikában fontos szerepet játszó szám
i2
transzcendens voltának bizonyítására, beleértve a Hilbert-féle számot, s általánosabban minden ab számot, ahol a olyan algebrai szám, amely nem egyenlő .Q-valvagy l-gyel és b tetszőleges irracionális algebrai szám.
Kiegészítés a II. fejezethez
A halmazalgebra elemei l. Általános elmélet
Tárgyak osztályának vagy halmazának a fogalma a matematika legalapvetőbb' fogalmai közé tartozik. Egy halmazt bármely 2{tulajdonsággal vagy sajátsággal definiálni lehet, amellyel a tekintett tárgyak mindegyikének vagy rendelkeznie kell, vagy nem. Azok a tárgyak, amelyek rendelkeznek a mondott 2{tulajdonsággal, képezik a tulajdonságnak megfelelő A halmazt. Így pl. ha az egész számokat tekintjük és az 2{tulajdonság abból áll, hogya szám prím legyen, akkor a megfelelő A halmaz az összes 2,3,5, 7, ... prím szám halmaza. A halmazok matematikai vizsgálata azon a tényen alapul, hogy a halmazok egyes műveletekkel újabb halmazokká kapcsolhatók, akárcsak a számok az öszszeadással és a szorzással. A halmazokkal végezhető műveletek alkotják a "halmazalgebrát", amelynek sok rokon vonása van a közönséges számok algebrájával, de sokban különbözik is tőle. Az a tény, hogy algebrai módszereket lehet alkalmazni nem számszerű objektumok tanulmányozásában, mint amilyenek a halmazok, a modern matematikai fogalmak nagy általánosságának egyik szép példája. Az utóbbi években kiderült, hogyahalmazalgebra segítségével a matematika számos ága, pl. a mértékelmélet és a valószínűségszámítás, áttekinthetőbbé tehető. Fontos szerepe van továbbá a halmazalgebrának abban is, hogya matematikai fogalmakat szisztematikusan vissza lehessen vezetni logikai alapjukra. A következőkbenjelentse I tetszőleges természetű tárgyak valamely meghatározott halmazát. I-t "alaphalmaz" -nak vagy "gondolkozási tartomány" -nak! nevezzük. Jelentsék A, B, C, ... I tetszőleges részhalmazait. Ha pl. I az egész számok halmazát jelenti, A jelentheti a páros egész számok halmazát, B a páratlan egész számokét, C a prímszámokét és így tovább. Vagy jelentheti I egy rögzített sík pont jainak a halmazát, A azon pontok halmazát, amelyek valamely adott körön belül feküsznek a síkon, B azon pontok halmazát, amelyek egy másik kör belsejében fekszenek ugyanezen a síkon stb. Kényelem okából I összes "részhalmazai" hoz számítjuk magát I-t is és a O "üres halmazt" is, amely egyetlen elemet sem tartalmaz. Ennek a mesterkéltnek ható kibővítésnek az a célja, hogy megtarthasl így fordíthatj uk magyarra az "universe of discourse"-t. mát és elnevezését Kőnig Gyula vezette be a halmazeIméletbe.
126
A gondolkozási tartomány fogal(A fordító megjegyzése.)
suk azt a szabályt, ami szerint minden \ll tulajdonságnak megfelel leleméinek olyan A halmaza, melynek elemei rendelkeznek a kérdéses \ll tulajdonsággal. Abban az esetben, ha \ll valamely általánosan érvényes tulajdonság, pl. olyan, amilyent az x=x triviális egyenlet fejez ki, I megfelelő részhalmaza maga Ilesz, mivel ezt az egyenletet minden objektum kielégíti, míg ha \ll valamely önmagának ellentmondó tulajdonság, pl. x ~ x, akkor a megfelelő részhalmaz egyetlen objektumot sem fog tartalmazni, és így a Ojellel jelölhet jük. A halmazt B halmaz részhalmazának nevezzük, ha A-nak egyetlen olyan eleme sincs, amely ne lenne egyúttal B-nek is eleme. Ha ez az eset áll fenn, ezt a tényt
AcB
vagy
B~A
jellel jelöljük. Például azon egész számok A halmaza, amelyek 10 többszörösei, részhalmaza azon egész számok B halmazának, amelyek 5 többszörösei, mivel 10 minden többszöröse egyben 5-nek is többszöröse. Az A c B állítás nem zárja ki a B c A állítás lehetőségét. Ha mind a két reláció érvényes, azt mondjuk, hogy az A és B halmaz egyenlő. Jelekben A =B.
Ehhez A minden elemének egyenlőnek kell lenni B egy elemével és megfordítva. úgy hogy A és B halmazok ebben az esetben pontosan ugyanazokat az elemeket tartalmazzák. Az A c B reláció sok tekintetben hasonlít a valós számok között fennálló assb relációhoz. Mindenekelőtt itt is igaz, hogy 1. AcA. 2. HaAcBés BeA, akkor A=B. 3. Ha AcB és Be C, akkor Ac C.
Épen ezért az AcB relációt "rendezési reláció"-nak is nevezik. Lényegesenkülönbözik a számokra érvényes a;!f: b relációtól abban, hogy még a számokesetében minden a, b számpárra fennáll az a;!f: b vagy b;!f: a relációk valamelyike, a halmazok esetében ez nem igaz. Pl. ha A az l. 2, 3 egész számok ból álló A = {l, 2, 3}
halmazt jelenti, B pedig a 2, 3, 4 egész számok ból álló B = {2, 3, 4}
halmazt, akkor sem A c B sem B c A nem érvényes. Éppen ezért azt mondjuk, hogy az A c B reláció parciális rendezést létesít a halmazok között, az a;!f: breláció pedig teljes rendezést a számok között; Közbevetőleg megjegyezzük, hogy az A c.B reláció definíciójából következik,
hogy 4. Oc A bármely A halmazra, és 5. AcI, ahol A az I alaphalmaz tetszőleges részhalmaza. A (4) reláció talán kissé paradoxnak látszik, azonban összhangban van a c jel szigorú értelmezésével. A Oc A állítás ugyanis csak akkor lehetne hamis, ha a O üres halmaz tartalmazna egy olyan elemet, amely nem eleme A-nak, és mivel az üres halmaz egyetlen elemet sem tartalmazhat, ez teljességgel lehetetlen, akármiféle halmaz is A. Most két olyan műveletet definiálunk a halmazokra, amelyek a számok közönséges összeadásának és szorzásának sok tulajdonságával rendelkeznek, bár fogalmilag meglehetősen különböznek ezektől a műveletektől. Legyen A és B két tetszőleges halmaz. A és B halmaz "egyesítésén" vagy "logikai összegén" azt a halmazt értjük, amelynek az elemei A és B halmaz közül legalább az egyikhez hozzátartoznak (beleértve az összes olyan elemet is, amely mind a kettőnek eleme). Ezt a halmazt A + B jellel jelöljük. A és B "közös részén" vagy "logikai szorzatán" azt a halmazt értjük, melynek az elemei mindkét halmazhoz hozzátartoznak. Ezt a halmazt A·B vagyegyszerűen AB jellel jelöljük. Vegyük példa kedvéért ismét az előbbi A és B halmazt: A={l,
2, 3},
B={2, 3, 4}.
2, 3, 4}.
AB={2,3}.
Akkor A+B={l,
Az A + B és AB műveletek fontos algebrai tulajdonságai közül az alábbiakban felsorolunk néhányat. Igazolja az olvasó ezeket a műveletek definíciója alapján. 7. 6. A+B = B+A 9. 8. A+(B+C) = (A+B)+C ll. 10, A+A = A 13. 12. A(B+C) = (AB+AC) 15. 14. A+O = A 17. 16. A+I= I 18. Az AcC reláció ekvivalens az A+B lyikével.
AB=BA A(BC) = (AB)C AA=A A+(BC) = (A+B)(A+C) AI=A AO=O = B és AB=B relációk valame-
A fenti törvények igazolása az elemi logika körébe tartozik. Pl. 10. azt állítja, hogy azon objektumokból álló halmaz, amelyek vagy A-ban vagy A-ban vannak, pontosan az A halmaz; 12. pedig azt állítja, hogy azon objektumoknak a halmaza, amelyek A-ban és egyúttal B és C halmaz közül legalább az egyikben vannak, ugyanaz, mint azon objektumoknak a halmaza, amelyek A és B közös része és A és C közös része közül legalább az egyikhez hozzátartoznak. Ennél és más ilyen törvényeknél használt logikai érvelés szemléltethető, ha az A, B, C hal128
mazokat síktartományokkal ábrázolj uk, csak ügyelni kell, hogy a szereplő halmazoknak egyaránt legyenek páronként közös és nem közös elemeik. Nyilván észrevette az olvasó, hogy a fenti 6., 7., 8., 9., és 12. törvények azonosak az algebra jólismert kommutatív, asszociatív és disztributív törvényével. Következésképpen a közönséges számalgebra minden olyan szabálya, amely a
AB
A +B 26. ábra. Két halmaz egyesített halmaza és közös része
kommutatív, asszociatív és disztributív törvény következménye, érvényes a halmazalgebrában is. A 10., ll., és 13. törvények azonban, amelyek nek nincs megfelelője a számok körében, egyszerűbb struktúrát eredményeznek a halmazalgebra számára, mint amilyen a számok algebrája. Pl. a közönséges algebra binomiális tételét a halmazalgebrában a következő egyenlőség helyettesíti: (A + B)" = (A+B)'(A+B)'
... '(A+B)
=
A+B,
amely ll. következménye. A 14.,15. és 17. törvények azt mutatják, hogy O-nak és I-nek az egyesítés és a közös rész képzés szempontjából ahhoz hasonló sajátságai vannak, mint O-nak és l-nek a közönséges összeadás és szorzás szempont• jából. A 16. törvénynek nincs megfelelője a számok algebrájában. Hátra van a halmazalgebra még egy műveletének a definiálása. Legyen A az I alaphalmaz tetszőleges részhalmaza. A halmaz I-re vonatkoztatott komplementer vagy kiegészítő halmazának azt a halmazt nevezzük, amely azon I-beli objektumok összességéből áll, melyek nem foglaltatnak benne A-ban. Ezt a halmazt A' jellel jelöljük. Így pl. ha I a természetes számok halmaza és A a prímszámok halmaza, A' l-ből és az összetett számokból áll. Az A' műveletnek, amelynek nincs pontos megfelelője a számok algebrájában, a következő sajátságai vannak. 19. 21. 23. 24. 25.
A+A'
=I
0'=1
A"=A Az A c B reláció ekvivalens a B' (A+B)' = A'B'
20. AA'=O 22. 1'=0 L A'
relációval.
26. (AB)' = A'+B'.
Ezeknek a törvényeknek az igazolását újból az olvasóra bízzuk. 9
Mi a matematika?
129
Az l-től 26. alatt felsorolt törvények képezik a halmazalgebra alapját. Figyelemreméltó sajtságuk a "dualitás", ami a következőképpen értendő: Ha a fenti 1- 26. törvények valamelyikében a benne előforduló c és ::) O és I
+
jeleket (amennyiben előfordulnak) törvények valamelyike lesz.
és mindenűtt felcseréljűk, az eredmény újból ezen
Pl. a 6. törvényből 7., a 12-ből 13., 17.-ből 16. lesz stb. Következésképpen minden tételhez, amely az l - 26. törvények alapján bebizonyítható, tartozik egy másik "duál" tétel, amelyet a most mondott felcserélés útján nyerünk. Ugyanis, mivel bármely tétel igazolása a fenti 1-26. törvény lépésenkénti alkalmazásából áll, minden egyes lépésben a duál törvényt alkalmazva, a megfelelő duál tétel igazolását kapjuk. (A hasonló geometriai dualitást a IV. fejezetben fogjuk tárgyalni.) 2. A halmazalgebra alkalmazása a matematikai logikában A halmazalgebra törvényeinek az igazolása az A c B reláció és az A + B, AB, A' műveletek logikai jelentésének az analízisen alapult. Ezt a folyamatot meg-
fordíthat juk, és a fenti 1- 26. törvényeket használhat juk a "logika algebrájá"nak a megalapozására. Pontosabban, a logika ama része, amely halmazokkal, vagy, ami ezzel ekvivalens, dolgok tulajdonságaival vagy attributumaival foglalkozik, az 1- 26. törvényeken alapuló formális algebrai rendszerre redukálható. A logika "gondolkozási tartománya" definiálja az I halmazt; a dolgok minden m: tulajdonsága vagy attributuma definiál egy A halmazt, azt, amely I ama objektumaiból áll, melyek rendelkeznek az illető A attributummal. A megszokott logikai ter-
minológia halmazalgebrai nyelvre való átírását az alábbi példák szemléltetik: "Vagy A vagy B" "A és B" "Nem A" "Sem A sem B" "Nem A és B egyszerre"
A+B AB A' (A + B)', vagy ami ezzel ekvivalens, A'B' (AB)', vagy ami ezzel ekvivalens, A'+B'
"Minden AB" vagy "Ha A akkor B" vagy "A implikálja B-t" A c B AB~O "Némely A B" AB=O "Egy A sem B" AB'~O "Némely A nem B" A=O "Nincsen A" 130
A halmazalgebra jelölési módjában pl. a "Barbara" szillogizmus, amely azt állítja, hogy: "Ha minden A B és minden B C, akkor minden A is C", egyszerűen így írható fel: (3)
Ha
AcB
és
BeC
akkor
AcC.
Hasonlóképpen az "ellentmondás törvénye", amelyik azt állítja, hogy "nem lehet, hogy valamely dolognak legyen is egy adott tulajdonsága, meg ne is legyen" egyszerűen 20. AA'=O alakban írható, a "harmadik kizárásának az elve" pedig, amely azt állítja, hogy "valamely dolog szükségképpen vagy rendelkezik egy bizonyos tulajdonsággal, vagy nem", egyszerűen 19. A+A'=I lesz. Ezek szerint a logikának az a része, amely kifejezhető a c, +, . , , szimbólumok segítségével, olyan formális algebrai rendszerként kezelhető, amely az 126. törvényeknek tesz eleget. A logikai analizisnek ez a matematikával való ötvözése új diszciplinát eredményezett, a matematikai logikát, amely jelenleg rohamosan fejlődik. Az axiomatikus felépítés szempontjából igen figyelemre méltó az a tény, hogy az 1-26. állítások, a halmazalgebra egyéb tételeivel együtt, levezethetők az alábbi három egyenletből : A+B=B+A 27. (A+B)+C>: A+(B+C) (A' + B')' +(A'+B)'
= A.
Következésképpen a halmazalgebra éppen úgy felépíthető tisztán deduktív elméletként, akárcsak az euklidészi geometria, ha ezt a három állítást tekintjük axiómának. Ebben az esetben az AB műveletet és az A c B reláció t definiálni kell A+B és A' segítségével: AB jelentse az (A' + B'Y halmazt A c B jelentse azt, hogy A + B = B. Egészen másfajta, de a halmazalgebra minden formális törvényét kielégítő matematikai rendszer példája lehet a következő nyolc szám: 1,2,3,5,6, 10, 15,30, ha a+b-t az a és b legkisebb közös többszöröseként definiáljuk, ab-t mint az a és b legnagyobb közös osztóját, ac b alatt pedig azt az állítást értjük, hogy "a oszt6ja b-nek", továbbá a 30ja számot tekintjük a'-nek. Az ilyen példák létezése vezetett a (27) törvényeket kielégítő általános algebrai rendszerek vizsgálatára. Az 9·
131
ilyen rendszereket Boole algebráknak hívják, George Boole (1815 - 1864) angol matematikus és logikus tiszteletére, akinek An Investigation of the Laws of Thought' című könyve 1854-ben jelent meg. 3. A halmazalgebra alkalmazásáról a valószínűségszámításban A halmazalgebrajelentősége a valószínűségszámításban is igen nagy. Hogy csak a legegyszerűbb esetet említsük, tekintsünk egy kísérletet, amelynek a végeredménye véges számú lehetőség valamelyike, s a lehetőségeket mind "egyformán valószínűekv-nek tételezzük fel. Állhat pl. a kísérlet abból, hogy 52 jól ősszekevert kártya közül kell kihúzni egyet. Ha a kísérlet ősszes lehetséges eredményének a halmazát I-vel jelöljük, I valamely tetszőleges részhalmazát pedig A-val, akkor annak a valószinűségét, hogy a kísérlet eredménye az A részhalmazba fog tartozni a A elemeinek a száma p(A) = I elemeinek a száma arány definiálja. Ha egy tetszőleges A halmaz elemeinek a számát n(A) szimbólummal jelöljük. akkor ez a definíció n(A) (1) p(A) = n(I) alakba írható. Ha példánkban
A a "Coeur"-kártyák
részhalmazát jelenti,
13 1 n(A) = 13, n(I) = 52 és p(A) = - = - . 52 4 A halmazalgebra fogalmai akkor lépnek be a valószínűségek számításába. ha bizonyos halmazok valószínűségeinek az ismeretében más halmazok valószínűsége it akarjuk kiszámítani. Például p(A), p(B) és p(AB) ismeretében kiszámíthatjuk (2)
p(A+B)
a p(A
+ B) valószínűséget:
= p(AHp(B)-p(AB).
A bizonyítás egyszerű. Ugyanis n(A+B) = n(AHn(B)-n(AB), mivel A és B közös elemeit, azaz AB elemeit, az n(A) + n(B) összegben kétszer vesszük figyelembe, és ezért le kell vonnunk n(AB)-t ebből az összegből, ha az n(A + B) számot akarjuk megkapni. Az egyenlet mindegyik tagját osztva n(I)-vel, megkapjuk (2) egyenletet. Érdekesebb
képlete t kapunk, ha l három, A, B, C részhalmazát tekintjük. (2)-ből: p(A+B+C)
=
p[(A+BHC]
=
A megelőző pont 12. szabálya szerint (A+B)C p[(A+B)C]
l
132
A gondolkozás
törvényeinek
= p(AC+BC)
a vizsgálata.
p(A+B)+p(C)-p[(A+B)C]. = AC+BC.
Tehát
= p(ACHp(BC)-p(ABC).
Az előbbi egyenletbe p[(A +B)CJ eme értéké t és pCA tesítve, megkapj uk a keresett képletet : (3)
p(A+B+C)
= p(AHp(BHp(C)-
+
B) (2)-ben megadott értékét behelyet-
p(AB)-p(AC)-p(BCHp(ABC).
Tekintsük példaként a következő kísérletet. Az 1, 2, 3 számjegyeket írjuk le véletlen sorrendben. Mi lesz a valószínűsége annak, hogy a három számjegy közül legalább egy a saját helyén, fordul elő? Jelölje A azon elrendezések halmazát, amelyekben az 1 számjegy áll az első helyen, B azon elrendezések halmazát, amelyekben a 2 számjegy a második helyen áll, C azon elrendezések halmazát, amelyekben a harmadik helyen a 3 számjegy áll. A pCA + B+ C) valószínűséget akarjuk kiszámítani. Nyilvánvaló, hogy 2 1 pCA) = p(B) = p( C) = - = - ; 6 3 mert ha egy számjegy a saját helyén áll, akkor a fennmaradó számjegyek számára a három számjegy összes lehetséges 3·2·1 = 6 elrendezéséből két lehetséges elrendezés marad. Továbbá 1
p(AB) = p(AC) = p(BC) = 6 és p(ABC)
l
=-
6 '
mivel csak egy eset van, amelyben A, B és C elrendezés egyszerre fordul elő. Következik (3)-ból. hogy
Feladat: Adjuk meg a megfelelő formulátp(A+B+C+D) 5 számjegy esetére. A megfelelő valószínűség - = 0,6250. 8 n részhalmaz egyesítését a (4)
számára,
pCA,-t-A2+ ... +An} = 2>CA,} - 2>CA,Aj} + 2>CA,AjAk} l
általános képlet adja meg, ahol a
I, I, I, ...,I 2
l
23
és alkalmazzuk négy
-
•••
8
jelek az A" A2,
•••
,
±PCA,A2 •••
An}
An halmazok összes
ft-I
lehetséges kombinációinak az összegét jelentik, egyszer, kétszer, háromszor, ... , (n -1) egyszer véve egy-egy alkalommal. Ezt a képletet matematikai indukcióval lehet ugyanúgy bizonyítani, mint ahogyan (3)-at vezettük le (2)-ből. (4)-ből könnyű kimutatni, hogy ha az n szám ú 1, 2, 3, ... , n számjegyet véletlenszerű sorrendben jegyezzük fel, annak a valószínűsége. hogy legalább egy számjegy a saját helyén forduljon elő (5) ahol plusz vagy mínusz előjellel kell venni aszerint, hogy n páratlan vagy páros. Speciálisan, n= 5-re ez a valószínűség PS
=
1--,
1 2.
+,-,+, l
l
l
3.
4.
5.
19
=-
30
= 0,63333 ....
133
Látjuk majd a VIII. fejezetben, hogy ha n tart a végtelenhez, akkor az l l l S"=2!-TI+4!-···±n!
l
kifejezés az ~ határértékhez tart, amelynek az értéke öt tizedes pontosságig e (5)-ből p" = 1-Sn' n tart a végtelenhez esetére l p,,-I-- = 0,63212 .... e
134
0,36788. Mivel
III. fejezet
Geometriai szerkesztések.
Számtestek algebrája
Bevezetés Szerkesztési problémák mindig kedvenc tárgyai voltak a geometriának. Az olvasó még diákkorából emlékezhet, hogy számos szerkesztés végezhető el csupán körzővel és vonalzóval. így lehet pl. vonalszakaszt vagy szöget két részre osztani, lehet egy adott pontból merőlegest bocsátani egy adott egyenesre, be lehet írni hatszöget körbe stb. Mindezekben a problémákban a vonalzó szerepe csupán az egyenes élé, arra szolgál, hogy egyenes vonalakat húzzunk vele, nem pedig távol. ságok mérésére vagy kijelölésére. A körző és vonalzó egyedüli használatának a tradíciója az ókorig nyúlik vissza, bár maguk a görögök nem riadtak vissza más rajzeszközök használatától sem. A klasszikus szerkesztési problémák körében az egyik leghíresebb az ún. Apollóniosz-féle (i. e. 200 körül) érintési probléma, amelyben három tetszőleges kör van adva a síkon, és keresni kell olyan negyedik kört, amely mindhárom adott kört érinti. Speciális esetként meg van engedve, hogy az adott körök közül egy vagy több ponttá vagy egyenessé degenerálódhasson (nulla illetve "végtelen" sugarú "körré"). Pl. lehet a feladat az, hogy szerkesszünk két adott egyenest érintő és egy adott ponton átmenő kört. Az ilyen és ehhez hasonló speciális eseteket elég könnyű megoldani, de az általános probléma megoldása sokkal nehezebb. Minden körzővel és vonalzóval elvégezhető szerkesztés közül talán az n oldalú szabályos poligon szerkesztése a legfontosabb. n bizonyos értékei - pl. n = 3, 4, 5, 6 - esetében már az antik tudomány is ismerte a megoldást, amely kedvelt része az iskolában oktatott geometriának. De pl. a hétszög (n = 7) szerkesztése lehetetlennek bizonyult. Van három további klasszikus görög pobléma is, amelynekhiábakeresték a megoldását: tetszőleges szög harmadolás a, adott kocka megkettőzése (azaz olyan kocka élének a megkeresése, melynek térfogata kétszerese az adott élű kocka térfogatának) és a kör négyszögesítése vagy kvadratúrája (azaz szerkeszteni egy olyan négyzetet, amelynek területe egyenlő egy adott kör területével). Mindezen problémák megoldásához csak körző és vonalzó használata van megengedve. Az ilyenfélemegoldatlan problémákkal való foglalkozás figyelemre méltó új fejlődésre vezetett a matematikában. Évszázadokig tartó meddő próbálkozások után felmerült annak a gyanúja, hogy ezek a problémák talán véglegesen meg135
oldhatatlanok. Így a matematikusok kezdték vizsgálni azt a kérdést, hogy hogyan lehet bebizonyítani
valamely problémárál
azt, hogy megoldhatatlan?
Az algebrában az ötöd- és magasabb fokú egyenletek megoldásának a kérdése vezette be ezt az új gondolkozási módot. A XVI. század folyamán rájöttek a matematikusok arra, hogyan kell a harmad- és negyedfokú egyenleteket a másodfokú egyenletek megoldására használt módszerhez hasonló, egyszerű elemi módszerekkel megoldani. Ezeknek a módszereknek közös jellemzője az, hogy az egyenlet megoldása vagy "gyöke" mindig felírható az egyenlet együtthatóiból racionális műveletek - összeadás, kivonás, szorzás, osztás - és négyzet-, köb-, vagy negyedik gyökvonás útján kapott algebrai kifejezés formájában. Azt szoktuk éppen ezért mondani, hogy az algebrai egyenletek a negyedfokú egyenletekkel bezárólag megoldhatók "gyökvonás" útján. Mi sem látszott természetesebbnek, mint hogy ezt az eljárást az ötöd- és magasabb fokú egyenletekre is kiterjesszék, a megfelelő magasabb fokú gyökvonás alkalmazásával. Azonban minden ilyen kísérlet meghiúsult. A XVIII. században még elsőrendű matematikusok is áltatták magukat azzal, hogy megtalálták a megoldást, míg végül a XIX. század elején Ruffini (1765-1822) olasz matematikus és a nagy norvég géniusz, N. H. Abel (1802-1829) arra az akkor forradalmi gondolatra jutottak, hogy bebizonyítsák, az általános n-edfokú algebrai egyenletet lehetetlen gyökvonás útján megoldani. Értsük meg világosan: nem az a kérdés, vajon van-e az n-ed fokú algebrai egyenletnek megoldása. Gauss 1799-es doktori értekezésében bebizonyította, hogy van. Így egy egyenlet gyökeinek a létezéséhez nem férhet semmi kétség, kiváltképpen mivel ezeket a gyököket alkalmas számítási módszerekkel tetszőleges pontosságig meg lehet adni. Az egyenletek numerikus megoldásának a kérdése igen fontos, és nagyon fejlett elmélet kialakulását eredményezte. Azonban Abel és Ruffini problémája egészen más valami volt: ők azt kérdezték, vajon megkapható-e a megoldás pusztán a racionális műveletek és gyökvonások segítségéve!? Az az óhaj, hogy ebben a kérdésben tisztán lássanak, vezetett a modern algebra és a csoportelmélet nagyszerű felvirágzására, Ruffini, Abel és Galois (1811-1832) úttörő munkája nyomán. Az algebra ezen irányzatának a legegyszerűbb példáit az egyes geometriai szerkesztések lehetetlenségének a bizonyítása szolgáltatja. Ebben a fejezetben be fogjuk bizonyítani algebrai fogalmak használatával, hogy lehetetlen a szögharmadolást, a szabályos hétszög szerkesztés t és a kockamegkettőzést pusztán körző és vonalzó segítségével megszerkeszteni. (A kör négyszögesítésének problémáját sokkal nehezeb belintézni, 1.157.o.) Nem annyira azegyes szerkesztések lehetetlenségének a negatív kérdéséből fogunk kiindulni, hanem abból a pozitív kérdésből, hogy hogyan lehet tökéletesen jellemezni a megszerkeszthető problémák összességét? Ha azután erre a kérdésre megfeleltünk, akkor már könnyű lesz kimutatni, hogy a fentebb említett problémák nem tartoznak ebbe a kategóriába. 136
Tizenhét éves korában Gauss a szabályos p-szög (p-oldalú szabályos sokszög) megszerkeszthetőségének a kérdését vizsgálta abban az esetben, ha p prímszám. A szerkesztés csak p = 3 és p = 5 esetében volt ismeretes. Gauss felfedezte, hogya szabályos p-szög akkor és csak akkor szerkeszthető meg, ha a p prímszám "Fermat-féle szám".
Az első Fermat-féle számok 3, 5, 17, 257, 65537 (l. 46. o.). Az ifjú Gauss ennek a felfedezésnek annyira megörült, hogy elhatározta, nem lesz, mint akarta, filológus, hanem a matematikának és a matematika alkalmazásainak szenteli az életét. Későbbi éveiben is mindig igen büszkén emlegette volt ezt az első nagy felfedezését. Halála után bronz szobrot állítottak neki Göttingában, s a hódolatot keresve sem tudták volna jobban kifejezni, mint úgy, hogya szobrot szabályos 17-szög alakú talapzatra állították. Ha geometriai szerkesztésekről tárgyalunk, sohasem szabad elfelejteni, hogy nem az a kérdés, vajon megrajzolható-e valamely ábra a gyakorlatban adott pontossággal, hanem az, hogy található-e pusztán körzőt és vonalzót igénybe vevő elméleti megoldás, tökéletesen pontos eszközök feltételezése mellett. Gauss szerkesztéseinek elvi kivitelezhetőségét bizonyította. Elmélete mit sem törődik a tényleges kivitelezéssel, vagy azokkal a módszerekkel amik egyszerűsíthetnék az eljárást, vagy csökkenthetnék a szükséges lépések számát. Az utóbbi kérdések elméleti szempontból sokkal kevésbé fontosak. Gyakorlati szempontból Gauss eljárása korántsem adna olyan jó eredményt, mint amilyent pl. egy jó szögmérővel el lehet érni. Ennek ellenére állandóan felbukkan egész sereg makacs szögharmadoló és körnégyszögesítő, aminek éppen az az oka, hogy félreismerik a geometriai szerkesztések elméleti jellegét, és nem ismerik el a kétségtelen tudományos tényeket. Azok, akik közülük hajlandók megérteni az elemi matematikát, haszonnal forgathatják ennek a fejezetnek a lapjait. Még egyszer hangsúlyozni kívánjuk, hogy a geometriai szerkesztésről alkotott fogalmunk valamilyen módon mesterkéltnek látszik. Körző és vonalzó kétségkívül a legegyszerűbb rajzeszközök, de az ezekre való szorítkozás semmiképpen sem tartozik a geometria belső lényegéhez. A görög matematikusok már régesrégen felismerték, hogy egyes problémák - mint pl. a kocka megkettőzése megoldhatók, ha engedélyezzük egy derékszög alakú vonalzó használatát. Ugyanígy nagyon könnyű a körzőn kívül másféle eszközöket kitalálni, olyanokat, amelyeknek a segítségével ellipszist, hiperbolát és még bonyolultabb görbéket lehet rajzolni, amely görbéknek a használata igen jelentékenyen kiterjeszti a megszerkeszthető alakzatok világát. A következőkben mégis ragaszkodni fogunk a geometriai szerkesztés standard, csak körző-vonalzó használatát megengedő fogalmához. 137
I. rész
A megoldhatatlanság
bizonyítása és az algebra
l. § Alapvető geometriai szerkesztések l. A négyalapművelet
és a gyökvonás mint szerkesztések
Tekintsünk a megalapozás kedvéért néhány klasszikus szerkesztés t. A mélyebb megértés kulcsa a geometriai problémák algebrai nyelvre történő átírásában keresendő. Bármely geometriai szerkesztési probléma visszavezethető arra az egyszerű formára, hogy ha adva vannak valamely a, b, c vonalszakaszok, keressünk más x, y, ... vonalszakaszokat. Mindig lehetséges ily módon megfogalmazni a problémát, még ha első pillanatra teljesen eltérőnek látszik is. A keresett vonalszakaszok lehetnek egy megszerkesztendő háromszög oldalai, körök sugarai, vagy egyes pontok derékszögű koordinátái (l. pl. 154. o.). Az egyszerűség kedvéért tételezzük fel, hogy csak egyetlen x vonalszakaszt keresünk. Akkor a geometriai szerkesztés ekvivalens lesz a következő algebrai problémával: először találni kell valamely összefüggést (egyenletet) a keresett x mennyiség és az adott a, b, c mennyiségek között, azután megoldva ezt az egyenletet, meg kell határozni az ismeretlen x mennyiséget, végül el kell döntenünk, vajon ez a megoldás megkapható-e olyan algebrai eljárásokkal, amelyek a körzővel és vonalzóval történő geometriai szerkesztések algebrai megfelelői. Az egész elmélet alapjául a valós számkontinuum bevezetése szolgál, ezen alapul ugyanis a geometriai objektumok valós számokkal való jellemzése, az analitikus geometria alapelve. Először is, vegyük észre, hogyalegegyszerűbb algebrai műveletek egynémelyike elemi geometriai szerkesztéseknek felel meg. Ha adva van két, a és b hoszszúságú vonalszakasz (a hosszúságot egy adott "egységszakasz"-szal mérve), igen könnyű a+b, a-b, ra (ahol r tetszőleges racionális szám), a/b és ab megszerkesztése. Rajzoljunk a+b megszerkesztésére (27. ábra) egyenes vonalat, és jelöljük ki rajta körzővel az OA=a és AB =b szakaszokat. Akkor" OB =a+b. Hasonlóképpen, mérj ünk fel a-b megszerkesztésére OA=a és AB=b szakaszokat, de ezúttal AB-t OA-val ellenkező irányban. Akkor OB = a-b. 3a megszerkesztésére
r--a.b~B 14--0
.1, b-o-l
27. ábra. a+b és a-b megszerkesztése
138
28. ábra. a/3 megszerkesztése
egyszerűen az a+a+a összeadást végezzük el, hasonlóan szerkeszthet jük meg pa-t, aholp tetszőleges egész szám. a/3-at a következőképpen szerkeszthet jük meg (28. ábra): mérjük fel OA= a távolságot egy egyenesre és húzz unk O ponton keresztül egy másik, tetszőleges egyenest. Mérjünk fel erre az egyenesre tetszőleges OC=c szakaszt és szerkesszük meg az OD=3c szakaszt. Kössük össze az A és D pontokat, húzzunk C ponton keresztül párhuzamosat AD-vel mely OA-t B pontban metszi. OBC és OAD háromszögek hasonlóak; tehát OB/a = OB/O A = =OC/OD= 1/3 és OB=a/3. Ugyanígy szerkeszthet jük meg ajq-t, ahol q tetszőleges egész szám. Ezt a műveletet pa vonalszakaszon végezve el, megszerkeszthetjük ra-t, ahol r=rt« tetszőleges racionális szám. a/b megszerkesztésére (29. ábra) tetszőleges szög O csúcsából rajzoljunk a szög száraira OB=b és OA=a távolságokat és mérj ük fel OB-re az OD= 1 egy-
29. ábra. a/b megszerkesztése
30. ábra. ab megszerkesztése
ségszakaszt. Húzzunk D ponton át párhuzamost AB egyenessel, ez C pontban metszi OA egyenest. OC hosszúsága akkor a/b lesz. A 30. ábra mutatja ab megszerkesztését, ahol AD BC-vel párhuzamosan húzott egyenes az A ponton át. Ezekből a megfontolásokból következik, hogya "racionális" algebrai műveletek - ismert mennyiségek összeadása, kivonása, szorzás a, osztása - elvégezhetők geometriai szerkesztésekkel. Ezeknek az egyszerű szerkesztéseknek az alkalmazásával bármely adott, a, b, c, ... valós számokkal mért vonalszakaszból racionális úton, azaz az összeadás, kivonás, szorzás, osztás véges számú alkalmazásával, bármely a, b, c, ... -vel kifejezhető mennyiséget megszerkeszthetünk. Az a, b, c, ... -ből ilyen módon nyerhető mennyiségek összessége úgynevezett számtestet képez, olyan számok halmazát, amely számok közül bármely kettőt a racionális műveletek (a négyalapművelet) bármelyikével összekapcsolva, újból ebbe a halmazba tartozó számot kapunk. Emlékezzünk rá, hogy a racionális számok, a valós számok, a komplex számok mind egy-egy ilyen számtestet képeznek. Jelen esetben azt mondjuk, hogya testet az adott a, b, c, ... számok B generálják. Az a döntő fontosságú szerkesztés, amely túlvisz az éppen most kapott testen, a négyzet31. ábra. Vamegszerkesztése 139
gyökvonás. Ha adva van egy a szakasz, akkor ya is megszerkeszthető pusztán körző és vonalzó használatával. Vigyünk fel egy egyenesre OA = a és AB= 1szakaszt (31. ábra). Rajzoljunk egy kört OB mint átmérő fölé, és szerkeszszünk A pontból merőlegest OB-re. Ez a merőleges C pontban metszi a kört. OBC háromszög derékszögű háromszög és a C-nél levő szög a derékszög, a geometria azon elemi tétele szerint, hogy bármely félkörívhez tartozó kerületi szög derékszög. Tehát OCA r és ha OP>r, akkor OP'4, akkor - amint azt bebizonyították - csak 3 szabályos test lehetséges: egy n+ 1 csúcsú, amit n+ 1 Rn- ebeli poliéder határol, mindegyik poliédernek n számú (n - 2) dimenziós oldala van; továbbá egy 2n csúcs Ú szabályos test, amelyet 2n számú 2n - 2 oldalú Rn_ ebeli poliéder határol; meg egy 2n csúcsú, amelyet az Rn- i 2n számú n oldalú poliéder határol. Feladat: Hasonlítsuk össze az R4-beli kocka 2. pontban adott definícióját ebben a pontban adott defíníciójával, és mutassuk meg, hogy a kocka felszínének a 2.. pontban adott "analitikus" definíciója ekvivalens ebben a pontban adott "kombinatorikus" definíciójával.
, Ebből a strukturális vagy "kombinatorikus" szempontból tekintve a O, 1, 2, 3 dimenziós terek legegyszerűbb geometriai idomai sorra a pont, az egyenesszakasz a háromszög és a tetraéder. Jelöljük ezeket az alakzatokat az egyöntetűség kedvéért To, Ti' T2 és T3 jelekkel. (Az indexek a dimenziószámot jelölik.) Mindegyik alakzat struktúráját kifejezi az az állítás, hogy mindegyik Tn n + 1 csúcsú, és hogy egy Tn bármely i+ 1 számú (i=0, 1, ... , n) csúcsa egy Trt határoz meg. Pl. T3, azaz a háromdimenziós tetraéder, 4 csúcsot, 6 egyenesszakaszt és 4 háromszöget tartalmaz. Nyilvánvaló, hogyan kell tovább haladni. T4-et, azaz a négydimenziós "tetraédert", úgy kell öt csúcs megadásával definiálni, hogy az ötből négy csúcs mindig egy T3-at határozzon meg, három mindig egy T2-t, és így tovább. T4 vázlatos diagramja a 118. ábrán látható. Látjuk, hogy T4 5 csúcsot, 10 egyenes szakaszt, 10 háromszöget és 5 tetraédert tartalmaz. 16 Mi a matematika?
241
0----00
118. ábra. Az 1-, 2-, 3-, 4-dimenzi6s tér legegyszerűbb térelemei (ún. szimplexei)
Az általánosítás n dimenzióra közvetlenül adódik. Tudjuk a kombinatorikából, hogy r adott elemből kiválasztott i elemet tartalmazó együttesek száma ponr! tosan = . Tehát egy n dimenziós tetraéderben van; i!(r-i)! .
cr
q+l
= n+1
c+
n l_ 2
Cn+l_ 3
-
(n+ l)! -3!(n-2)!
c+
n l_ 4
(n+I)! 2!(n -I)!
-
(n+I)! 4!(n -3)!
csúcs
(To),
egyenesszakasz
(Tl),
háromszög
(T2),
tetraéder
(T3),
c:!i = 1 Feladat: Rajzoljuk meg Tó diagramját és határozzuk számát j= 0, 1, ... , 5 esetére.
Tn. meg a benne foglalt különböző TI = k
V. fej ezet
Topológia Bevezetés A XIX. század közepén új irány indult el a geometriában, s csakhamar a modern matematika egyik hajtóereje lett. Ez az új irány, amelyet analysis situs-nak vagy topológiának neveznek, geometriai alakzatok olyan tulajdonságaival foglalkozik, melyek még akkor is megmaradnak, ha az alakzatokat olyan durva torzitásoknak vetjük alá, hogy minden metrikus és projektív tulajdonságukat elveszítik. A. F. Moebius (1790-1868), kora egyik legnagyobb geométere, akit szerénysége arra kárhoztatott, hogy jelentéktelen csillagászként éljen Németország egyik másodrendű csillagvizsgálójában, hatvannyolc éves korában egy értekezést küldött be a Francia Akadémiának az "egyoldalú" felületekről. Ez az értekezés ennek az újfajta geometriának néhány legmeglepőbb tényét tartalmazta. Hasonlóan annyi más régebbi fontos felfedezéshez, ez az értekezés is évekig hevert az Akadémia valamelyik fiókjában, mig végül aztán maga a szerző publikálta. Hasonló felfedezésre jutott, Moebius-tól függetlenül, J. B. Listing (1808-1882) göttingai csillagász, és eredményeit 1847-ben Gauss javaslatára egy kis könyvben közölte, melynek címe Vorstudien zur Topologie (Előtanulmányok a topológiához) volt. Mikor Bernhard Riemann (1826-1866) a göttingai egyetemre került diaknak, azt találta, hogy a városka egyeteme telítve volt ezek iránt az új, különös geometriai eszmék iránti érdeklődés sel. Csakhamar felismerte, hogy itt kell keresni a kulcsot a komplex változós analitikus függvények mélyebb megértéséhez. Talán semmi sem mozdította annyira elő a topológia későbbi fejlődését, mint Riemann függvénytanának nagyszerű struktúrája, amelyben a topológiai fogalmak abszolút alapvetőek. Az új terület módszereinek újdonsága miatt a matematikusoknak eleinte nem volt idejük arra, hogyeredményeiket az elemi geometria tradicionális posztulaciós köntösébe öltöztessék. A nagy úttörők, mint pl. Poincaré, elsősorban a geometriai szemléletre bizták magukat. Még ma is azt érzi, aki elmélyed a topológiaban, hogy ha túlságosan ragaszkodik az előadásmód szigorához, könnyen szem elöl veszítheti a formális részletek tömegében a geometriai lényeget. Mégis nagy érdeme az újabb munkáknak, hogya topológiát a szigorú matematika keretei 243
közé szorították, ahol az intuíció az igazság forrása, de nem végső igazolása. Ezt a törekvést L. E. J. Brouwer munkái indították el, s a topológia fontossága fejlődésével párhuzamosan a matematika csaknem minden ágában erősen megnőtt. Fontos szerepük volt a topológia fejlesztésében amerikai matematikusoknak. Elsősorban O. Veblen, J. W. Alexander és S. Lefschetz nevét kell ezzel kapcsolatban megemlíteni.' Jóllehet a topológia rendszeres fejlődése alig százéves, van néhány idetartozó korábbi felfedezés, amit később beillesztettek a szisztematikus felépítés be. Meszsze legfontosabb ezek közül az a formula, amely egy egyszerű poliéder csúcsainak, éleinek és lapjainak a száma közötti összefüggést fejezi ki. Már Descartes felismerte 1640-ben, s azután Euler 1752-ben újra felfedezte, s rendszeresen alkalmazta. Azt, hogy ez az összefüggés tipikusan topologikus jellegű, sokkal később ismerték fel, Poincaré vette észre, hogy "Euler képlete" és általánosításai a topológia egyik központi tételét alkotják. Így történeti és matematikai okokból egyaránt, Euler képletével kezdjük a topológia tárgyalását. Mivel a tökéletes szigorúság ideálja sem nem szükséges, sem nem kívánatos akkor, ha valaki egy addig ismeretlen területen teszi meg első lépéseit, nem restellünk majd időnként az olvasó geometriai szemléletére hivatkozni.
1. §Euler poliéder tétele Noha a poliéderek tanulmányozás ának fontos szerepe volt a görögök geometriai gondolkozásában, mégis csak Descartes és Euler fedezték fel a következő tényt: jelentse Vegy egyszerű poliéder csúcsainak számát, E az éleinek számát és F az oldallapjainak számát; akkor minden esetben érvényes, hogy (1)
V-E+F=
2.
Poliéder az olyan test, melynek felülete sokszögtartományokból áll. Szabályos testek esetében a határoló sokszögtartományok egybevágóak, és a csúcsoknál levő szögek mind egyenlőek. A poliéder egyszerű, ha nincsenek benne "lyukak", azaz ha felülete folytonos deformációval gömbfelületté alakítható át. A 120. ábrán látható egyszerű poliéder, amely azonban nem szabályos test, a 121. ábrán pedig olyan poliéder, amely nem egyszerű. Feladatképpen ellenőrizzük azt az állitást, hogy Euler képlete érvényes a 119. és 120. ábrán közölt egyszerű poliéderekre, de nem érvényes a 121. ábrán közölt poliéderre. l A topológia későbbi fej lődésében igen fontos a szovjet topo16giai iskola szerepe, különösen P. Sz. Alekszandrov és L. Sz. Pontrjagin munkássága. (Ford.)
244
~ ~ '"~ ~ v.l
ci
~
-----,
'"........
245
Euler képletének igazolására, képzeljük az adott egyszerű poliédert üresnek, s a felületét vékony gumi ból levőnek. Ha az üres poliéder oldallapjai közül kivágunk egyet, akkor a megmaradó felületet valamilyen deformációval kinyújtóztathatjuk a síkra. Természetesen a poliéder oldallapjainak a területe és az élei közötti szögek eközben megváltoznak. Azonban a csúcsok és élek hálója a síkon ugyanannyi szamú csúcsot és éltfogtartalmazni, mint amennyit az eredeti poliéder tartalmazott, a sokszögek száma pedig eggyel kisebb lesz, mint az eredeti poliéderen volt, hiszen egy oldallapot eltávolítot120. ábra. Egyszerű poliéder tunk. Kimutat juk, hogy erre a V-E+F = 9-18+ II = 2 síkhálóra V-E+F = 1, s ha hozzászámoljuk az eltávolított oldallapot, V- E + F = 2 érvényes az eredeti poliéderre. Először is a síkhálóban "háromszögelést" vezetünk be a következőképpen: A háló valameI 1 lyik sokszögében, amelyik erede __---z, mínusz B-nek lx bal oldalára eső területe. Tegyük fel, hogy az A-t felező 10 egyenes P R iránya PR, és hogy B-ből több van ennek az 173. ábra. Két adott terület megfeleegyenesnek a jobb oldalán mint baloldalán. zéseegyszerre Akkor erre az x=O irányra y pozitív. Növekedjék most x 180°-ig. Akkor az 1180 egyenes, amely RP irányú, éppen úgy felezi A-t, mint 10, csak ellenkezően irányított, ami által a jobb és a bal felcserélődnek. Tehát y értéke x= 180°-ra numerikusan ugyanaz, mint x=Oo-ra, de ellenkező előjelű, azaz negatív. Mivel y az x folytonos függvénye, miközben lx körbe fordul, létezik 0° és 180° között az x olyan IX értéke, amelyre y nulla. Következésképpen I egyenes egyszerre felezi A-t és B-t. Ezzel a bizonyítást befejeztük. Jegyezzük meg, hogy bár bebizonyítottuk a kívánt tulajdonságú egyenes létezését, nem adtunk semmiféle határozott eljárást megszerkesztésére; megint látjuk a matematikai egzisztenciabizonyítások jellegzetességét, ami ezeket megkülönbözteti a szerkesztésektől. Hasonló probléma a következő: legyen adva a síkban egyetlen A tartomány, vágjuk ezt két egymásra merőlegesegyenessel négy egyenlő darabra. A bizonyításban az előbbi probléma azon lépéséből indulunk ki, amelyben definiáltuk lx-et bármely x-szögre, de a B tartományt elhagyjuk. E helyett az lX+90 egyenest veszszük, amelyik merőleges lx-re és szintén felezi A-t. Ha a 174. ábrán látható módon számozzuk meg A négy darabját, felírhat juk, hogy
--
:&0
és
Al +A2 =A3+A4
A2 +A3 = Al +A4, 319
amiből
(a második
egyenletet
kivonva Al -A3
az elsőből) következik, =
hogy
A3 -Al'
azaz tehát
Az
Így, ha ki tudjuk mutatni
= A4'
egy olyan x=lX-szög létezését, hogy A l (a) = Az(a),
akkor tétel ünket bebizonyítottuk, mivel ilyen szögre mind a négy terület egyenlő lesz. Ennek a bizonyítására definiáljuk azzal az v=Es) függvényt úgy, hogy minden x-szöghöz megrajzolva gondoljunk 'x-et és az f(x) = A l (x) - A2(x)-et írjunk be. Legyen x=Oo-raf(O)=AI(O)-AzCO) pozitív. Ebben az esetben x=90o-ra -Az(90) = AiO)-A3(0) = A2(0) -AI(O) negatív lesz. Tehát, mivel
AI(90)x foly-
174. ábra.
tonosan változik amint x OO-tól 900-ig nő, lesz valahol 0° és 90° között egy olyan IXérték, amelyrej'(«) = A1(1X)- A2(1X) = O. Az/és /ot+90egyenesek akkornégy egyenlő darabra osztják a tartományt. Érdekes, hogy ezek a problémák három és háromnál több dimenzióra is általánosíthatók. Három dimenzió esetében az első probléma így hangzik: legyen adva három tartomány a térben, keressünk síkot, mely mindhármat egyszerre felezi. Annak a bizonyítása, hogy ez mindig lehetséges, Bolzano tételén alapul. Háromnál több dimenzió esetében is igaz a tétel, de a bizonyítás bonyolultabb matematikai módszereket igényel. 320
*2. Egy mechanikai probléma Ezt a fejezetet egy látszólag nehéz mechanikai probléma tárgyalás ával zárjuk, amelyet könnyű megoldani a folytonosság fogalmán alapuló érveléssel. (A probléma H. Whitney ötlete.) Tegyük fel, hogy A állomásról B állomásra egyenes pályaszakaszon megy a vonat. Nem szükséges, hogy egyenletes sebességgel vagy hogy egyenletes gyorsulással haladjon. Mehet akárhogyan: gyorsíthat, lassíthat, megállhat, sőt még tolathat is egy ideig, mielőtt elérne B-be. De azt kiköt jük, hogy előre tudjuk a vonat mozgását; azaz meg van adva az s=f(t) függvény, ahol s a vonat A állomástól való távolsága, t pedig az idő, az elindulás pillanatától mérve. Az egyik kocsi padlójára csuklósan rudat erősítünk úgy, hogy súrlódásrnentesen mozog.A B hasson előre vagy hátra, 175. ábra. egész a padlóra fekvéséig. Feltesszük, hogy amint érintette a padlót, attól kezdve már fekve marad; ez a helyzet, ha a rúdnak nincs rugalmassága. Lehet-e a rudat olyan helyzetbe hozni, hogy az elindulás pillanatában elengedve, pusztán a nehézségi erő és a vonat mozgása hatva rá, az egész A-tól B-ig tartó utazás alatt ne érints e a padlót? Roppant valószínűtlennek látszik, hogy a nehézségi erő és a tehetetlenség összjátéka megengedi bármely előre adott mozgási terv esetében ezt a kiegyensúlyozást, feltéve, hogya rúd kezdeti helyzetét alkalmasan választottuk. Mégis azt állítjuk, hogy ilyen helyzetet mindig lehet választani. Bármilyen paradoxnak hat ez az állítás, könnyen bebizonyítható, ha az ember lényegében topologikus jellegét észreveszi. Nem kell a bizonyításhoz ismerni a dinamika törvényeit. Csupán a következő egyszerű fizikai feltételre van szükség: a rúd mozgása folytonos fűggvénye kezdeti helyzetének. Jellemezzük a rúd kezdeti helyzetét azzal az x kezdeti szöggel, amelyet a rúd a padlóval képez, jelentse y azt a szöget, ami az utazás végén van rúd és padló között, amikor a vonat elérte B pontot. Ha a rúd közben érintette a padlót, akkor vagy y=O vagy y=n lesz. Feltevésünk szerint adott x kezdőhelyzet mellett az y véghelyzetet teljesen meghatározza valamely folytonos y=g(x) függvény, amelynek az értéke j-=D, ha x=O és y=n, ha x=n (utóbbi egyenlőségek csak azt fejezik ki, hogy ha elinduláskor a padlón feküdt a rúd, végig fekve marad). Emlékeztessünk rá, hogy g(x), mint a O~ c ~n intervallumban folytonos függvény, g(O) = O és g(n) =n között minden 21 Mi a matematika?
321
értéket felvesz; következésképpen minden ilyen y értékhez, pl. y
n
= - -hez, tar-
2 tozik x valamely speciális értéke úgy, hogy g(x) = y legyen; speciálisan van olyan kezdeti helyzet, amelyikhez tartozó végső helyzetben a rúd merőleges a padlóra B-ben. (Megjegyzés: az érveléshez tartozik, hogy a vonat mozgását egyszer s mindenkorra rögzítettük.) Az érvelés természetesen teljesen teoretikus. Ha az utazás sokáig tart, vagy ha a vonat s=f(t) által kifejezett mozgási terve nagyon szabálytalan, akkor az a kezdeti x helyzet, amelyhez tartozó g(x) véghelyzet különbözik O-tól vagy n-től, nagyon keskeny változási tartományba van beszorítva, amint azt mindenki tudja, aki megpróbált hosszabb ideig egyensúlyozni hegyére állított tűt sima lemezen. Mégis, a gyakorlati ember részére is hasznos lehet gondolatmenetünk, mert látható belőle, hogyan lehet a dinamikában egyszerű érveléssel, technikai mesterkedések nélkül, kvalitatív eredményeket elérni. Fe/adatok: 1) Mutassuk ki a 317. oldalon közölt tétel felhasználásával, hogy a fenti érvelés általánosítható végtelen hosszú ideig tartó utazás esetére. 2) Általánosítsunk arra az esetre, amikor a vonat tetszőleges görbe mentén mozoghat a síkban, és a rúd tetszőleges irányba eshet le. [Útmutatás: Körlemezt nem lehet folytonosan leképezni kerületére olyan leképezéssel, amelyik a kerület minden pontját fixpontnak hagyja (1. 260. o.)]. 3) Bizonyítsuk be, hogy egyenletes sebességgel mozgó kocsi esetében, ha a kezdeti helyzet, amelyben a rudat szabadon engedjük, s-szöggel tér el a függőlegestől. az az idő, amire a rúdnak szüksége van, hogy a padlóra essen, a végtelenhez tart, ha e tart a null ához.
Kiegészités a VI. fejezethez
További példák a határértékre
és a folytonosságra
l. § Példák ahatárértékre 1. Általános megjegyzések
Az an sorozat konvergens voltát sokszor olyan jellegű érveléssel lehet bizonyítani, mint a következő. Keresünk két másik, b; és cn sorozatot, melynek tagjai egyszerűbb szerkezetűek, mint az eredeti sorozaté, és minden n-re teljesül, hogy (1) Ha be tudjuk bizonyítani, hogy b; sorozat és cn sorozat azonos iZ határértékhez kon. vergál, ebből következik, hogyan is ugyanehhez az iZ határértékhez konvergál. Az
állítás formai bizonyítását az olvasóra bízzuk. Nyilvánvaló, hogy az eljárás alkalmazása egyenlőtlenségek használatávaljár. Nem árt azért, ha emlékezetbe idézzük az egyenlőtlenségekre vonatkozó aritmetikai műveletek néhány elemi szabályát. 1. Ha a s-b, akkor a+c>b+c (az egyenlőtlenség mindkét oldalához hozzá lehet adni ugyanazt a tetszőleges számot). 2. Ha ar-b és c pozitív szám, akkor ac »bc (az egyenlőtlenség megszorozható bármely pozitív számmal). 3. Ha a-eb, akkor -b< -a (az egyenlőtlenség értelme megfordul, ha mindkét oldalát szorozzuk -·l-gyel). Így pl. 2 b azonos előjelűek és ha a-eb, akkor lia> l/b. 5·la+bl:§lal+lbI. 2. (t határértéke
Ha q l-nél nagyobb szám, a q71 sorozat minden határon túl nő, mint pl. a 2, 22, 23, ... sorozat q=2 esetében. A sorozat a "végtelenhez tart" (l. 295. o.). A bizonyítás az általános esetben (2)
(l+h)"~l+nh>nh
fontos egyenlőtlenségen alapul (l. 37. o.), ahol h tetszőleges pozitív szám. Legyen q= l+h, ahol h>O; akkor qn 21-
= (1+h)n>nh. 323
Ha k bármely, tetszőlegesen nagy pozitív szám, akkor minden n s-klh-t« következik, hogy q">nh>k;
tehát q"--- oo , Ha q= l, akkor a q" sorozat minden tagja l, tehát a sorozat határértéke 1. Ha q negatív, akkor q" váltakozva lesz pozitív és negatív előjelű, s ha q ~ -1 a sorozatnak nincs határértéke. Feladat: Bizonyítsuk be szigorúan az utolsó állítást.
Láttuk a 84. oldalon, hogy ha -l < q< l, akkor q"---O. Ennek a ténynek itt másik, igen egyszerű bizonyítását adhat juk. Tekintsük először azt az esetet, ha Ob>0?
_
7) Mi ya"+b"+c" 4
V n+ l határértéke
határértéke,
ha a>b>c>O?
_
8) Mi Va"b"+a"c"+b"c"
határértéke,
ha a=b=c=ts'l
9) Később (440. o.) látjuk majd, hogy e = lim
(1 + : ) ".
Mennyi akkor Jim
(1 +
nl2 )
fl
?
2. § Példa a folytonosságra A függvény folytonosságának precíz igazolás ához explicit módon kell bizonyítani a 311. oldalon közölt definíció érvényességét. Ez sokszor hosszadalmas eljárás, de szerencsére, mint a VIII. fejezetben látni fogjuk, a folytonosság a differenciálhatóság következménye, az utóbbi pedig szisztematikusan megállapítható minden elemi függvény esetében, és így a folytonosság fárasztó esetenkénti bizonyítását mellőzhetjük, amint azt általában szokásos. De vizsgáljunk meg még egy példát az általános definíció megvilágítására : az f(x) 328
= --
1
1 +x2
függvényt.
Korlátozhat juk x-et az Ixl;§ M rögzített intervallumra, ahol M tetszőlegesen vá-lasztott szám. Felírva, hogy f(xl)-f(x)
1
1
= -----
1+xi
= (x -Xl)
1+X2
=
X2 -xi (1+x~)(l
2
+XI)
(x+x1) (1+x2)(1+xi)
azt találjuk, hogy ha Ixl;§ M és Ixll;§ M, akkor I!(xl) -f(x)
I::§ lx -xllix
+xll
::§ lx
-xll·2M.
Nyilvánvaló tehát, hogy a bal oldalon álló különbség kisebbé tehető bármely pozitív
li
számnál, valahányszor lXI - xl
li
-< b = --.
2M Megjegyzendő, a becslés elég nagylelkű. Nagy x és Xl értékekre, amint könynyen igazolható, sokkal nagyobb b elegendő.
VII. f e j e z e t
Szélső értékek Bevezetés Az egyenesszakasz a legrövidebb összeköttetés két végpontja között. A legnagyobb gömbi kör íve a gömbfelület két pontját összekötő legrövidebb gömb-felületi görbe. Azonos hosszúságú síkgörbék közül a kör zár be legnagyobb terüJetet. Azonos felszínű zárt felületek által bezárt térfogatok között a gömb térfogata a legnagyobb. Ilyenféle maximum és minimum tulajdonságokat jól ismertek a görögök, ha az eredményeket sokszor anélkül mondották is ki, hogy a valódi bizonyítást megkísérelték volna. Az egyik legjelentősebb görög felfedezést Héronnak tulajdonítják aki az i. sz. I. században élt, Alexandriában. Régen tudták már akkor, hogy egy P pontból kiinduló fénysugár, amely az L síktükröt R pontban éri, olyan Q pont irányában verődik vissza, hogy PR és QR egyenlő szöget zárnak be a tükörrel. Héron fedezte fel, hogy ha R' a tükör bármely más pontja, PR' +R'Q távolságösszeg nagyobb lesz, mint a PR+RQ távolság. Ez a tétel - amelyet azonnal be fogunk bizonyítani - a fény P és Q pont közötti tényleges PQR útját, mint a tükör közvetítésével P-ből Q-ba vezető lehetséges legrövidebb utat tünteti ki. Ez a felfedezés tekinthető a geometriai optikának nevezett elmélet csírájának. Természetes, hogy a matematikusokat érdekelték az ilyen jellegű kérdések. De az élet mindennapi problémái között is állandóan jelen vannak a maximumminimumproblémák a "legjobb" és "legrosszabb" kérdésének formájában. Nagyon sok gyakorlati szempontból fontos probléma jelentkezik ebben az alakban. Pl. milyen alakú legyen a hajó, hogy legkisebb legyen vele szemben a víz ellenállása? Adott anyagmennyiségből készült milyen hengeres tartónak lesz legnagyob a térfogata? A szélső értékek általános elmélete a XVII. században indult el, s a természettudomány egyik nagy rendszerező és egységesítő elve lett belőle. Fermat első lépéseit a differenciálszámítás területén az a kívánság vezette, hogy általános módszert találjon maximum-minimumkérdések tárgyalására. A következő évszázadban nagymértékben növelte ezeknek a módszereknek a birodalmát a "variaciószámítás" felfedezése. Egyre inkább nyilvánvalóvá lett, hogy a természet fizikai törvényei minimumelvek formájában fejezhetők ki legadekvátabb módon, ezek 330
képviselik 'a speciális problémák többé-kevésbé teljes megoldásának természetes útját. A jelenkori matematika egyik legfigyelemreméltóbb elmélete, a stacionáeius folyamatok elmélete, amelyben az analízis és a topológia kapcsolódik, a szélső érték fogalmának az általánosításából keletkezett. A jelen fejezetben meglehetősen elemi szinten fogjuk tárgyalni az egész problémakört.
l. ~Elemi geometriai
feladatok
1. Háromszög maximális területe, ha a háromszög két oldala adott Legyen adva két szakasz, a és b, Keressünk maximális területű háromszöget, melynek a és b két oldala. A megoldás egyszerű derékszögű háromszög, a és b a két befogó. Ugyanis tekintsünk bármely háromszöget, melynek két oldala a és b, amint az a 176. ábrán látható. Ha h az a alaphoz tartozó magasság, a hároml l szög területe A = - ah. Mármost - ah nyilvánvaló2 2 an akkor maximális, ha h legnagyobb, és ez akkor következik be, ha h egybeesik b-vel; azaz derékszögű l Go háromszög esetében. A maximális terület tehát - ab. 2 176, ábra. 2. Héron tétele. A fénysugarak szélső érték tulajdonsága Legyen adva egy L egyenes és két pont, P és Q,L ugyanazon oldalán. L melyik nézve lesz a PR + RQ távolságösszeg P-ből L-en át Q-ba vezető legrövidebb út? Ez Héron fénysugárproblémája. (Ha L folyópart lenne, s valakinek P-ből Q-ba kellene menni a lehető leggyorsabban, közben egy vödör vizet hozva L-ből, ugyanezt a problémát kellene megoldania.) A megoldás megkeresésére tükrözzük P-t L egyenesre vonatkozóan, mint valami tükörben, ami által p' pontot .kapjuk, és L egyenes a PP' szakasz felező merőlegese. P'Q egyenes a kívánt R .pontban metszi L-et. Könnyű bebizonyítani, hogy PR + RQ kisebb, mint L bármely más R' pont jával képezett PR' +R'Q. UgyanisPR=P'R ésPR'=P'R'; tehát PR+RQ = P'R+RQ = P'Q és PR'+R'Q = P'R'+R'Q. Azonban P'R'+R'Q nagyobb, mintP'Q (mivel a háromszög bármely két oldalának az összege nagyobb mint a harmadik oldal), tehát PR' +R'Q nagyobb, mint PR+RQ, ami bizonyítandó volt. A következőkben feltételezzük, hogy sem P sem Q nincs rajta L egyenesen. Látjuka 177. ábrából, hogy 34=24 és 24=14, úgy, hogy 14=34. Más szóval R az a pont, amelyre PR és QR egyenlő szöget zár be L-lel. Ebből következik, hogy az L-en visszavert fénysugár (amelyről kísérlet alapján tudjuk, hogy .R pontjára
331
p
egyenlő beesési és visszaverődési szöget zár be) valóban a legrövidebbutatfutja be P-ből L-en keresztül Q-ba, mint azt abevezetésben állítottuk. A pro bléma általánosítható több L, M, ... egyenes esetére. Legyen pl. két L és M egyenes és két pont, P és Q 177. ábra. Héron tétele adva, a 178. ábrán látható elrendezésben. Keressük meg. QH a legrövidebb utat, amely P" I ből L-hez, onnan M-hez, vé~/ I· ;' I gül Q-ba vezet. Legyen O' " rI ,/ pont Q pont M egyenesre voR,,," I natkozó tükörképe, Q" pedig Q' pont L-re vonatkozó tükörképe. Húzzuk meg a PQ'tegyenest, amely R pontban metszi L-et és RQ' egyenest, amely M-et S pontban met178. ábra. Tükrözéskét tükörben szi. R és S a két keresett pont, amelyekkel képzett PR + RS + + SQ távolságösszeg a legrövidebb P-ből L-en és M-en keresztül Q-ba vezető út. Ennek a ténynek a bizonyítása igen hasonló a megelőző prob-lémáéhoz, s feladatként az olvasóra bízzuk. Ha L és M tükör lenne, P-ből kiinduló, 179. ábra. L-en és M-en Q pontba visszaverődő fénysugár L-et R-ben, M-et S-ben találn á, tehát megint a legrövidebb úton haladna a fény. Kereshetnénk, mi lesz a legrövidebb út, ha P-ből M-hez, onnan L-hez, végül innen Q-ba megyünk. Így az előbbi PRSQ pályához hasonló módon meghatározott PRSQ pályát kapnánk (l. 179. ábra). Lehet a két pálya egyenlő, vagy lehet az egyik nagyobb, mint a másik. Q
,,",
L----~~----~~----------~O
"Feladat: Bizonyítsukbe, hogyaz elsőpályamindigkisebb,mint a második,valahányszor O és R a PQ egyenesazonos oldalán feküsznek.Mikor lesz a két pálya egyenlőhosszúságúl'
332
3. A Héron-tétel alkalmazása háromszög-feladatokra
Az alábbi két feladat könnyen megoldható Héron tétele segítségével. a) Legyen adva a háromszög A területe és e=PQ oldala. Keressük meg az ezáltal meghatározott háromszögek között azt, amelyikben a másik két oldal: a és b összege a legkisebb. A háromszög e oldalának és A területének az előírása ekvivalens azzal, ha a e oldalt és a e oldalhoz tartozó h magasságot adjuk meg, l
ugyanis A =- he. Azért a 180. ábra szerint az a probléma, hogy egy olyan R pon2 tot kell találni, amely a PQ egyeR' R nestől az adott h távolságban van, és az R által meghatározott a-s-b ... összeg minimum. Az első feltételo.,, IhI ből következik, hogy R-nekaPQ-val , I párhuzamos h távolságban levő I egyenesen kell lennie. Ekkor a megI oldás következik Héron tételének p Q azon speciális esetéből, amikor P 180. ábra. Adott alapú és területű háromszög és Q egyenlő távolságra vannak legkisebb kerülete L-től: a keresett P RQ háromszög egyenlő szár ú háromszög. b) Legyen adva a háromszög e oldala és a másik két oldal, a+b összege. Keressük meg az ezáltal meghatározott háromszögek közül azt, amelyiknek legnagyobb a területe. Ez a probléma éppen megfordított ja az a)-nak. A megoldás ismét egyenlő szárú háromszög, amelyre a=b. Éppen most láttuk, hogy ebben a háromszögben az a+ b legkisebb értéke adott területnél van, bármely más e alapú és ugyanekkora területű háromszögre a-s-b értéke nagyobb. Nyilvánvaló továbbá a)-ból, hogy bármely e alapú és az egyenlő szárúénál nagyobb területű háromszögre is nagyobb a+b értéke. Tehát minden más háromszögnek, amelyben ugyanekkora az a + b oldalszög és a e oldal, kisebb kelllegyen a területe, úgyhogy adott e és a-s-b mellett az egyenlő szárú háromszögnek legkisebb a területe.
---,.,---,I" '
4. Az ellipszis és hiperbola érintési tulajdonságai. Megfelelő szélső érték tulajdonságok
Héron problémája összefügg néhány fontos geometriai tétellel. Bebizonyítottuk, hogy ha R az L egyenes azon pontja, amelyre PR + RQ minimum, akkor PR és RQ egyenlő szöget zár be L-lel. Nevezzük ezt a minimális távolságösszeget 2a-nak. Jelölje p és q a sík bármely pontjának P-től és Q-tól való távolságát, és tekintsük a sík mindazon pont jainak geometriai helyét, amely pontokra p + q = = 2a. Ez a geometriai hely az ellipszis, melynek P és Q a fókuszai és az L egyenes 333
R pontján megy át. Továbbá L-nek R pontban érintenie kell az elitpszist. Ha ugyanis L az ellipszist még egy R-től különböző pontban metszené, lenne L-nek olyan szakasza,
amely az ellipszis belsejében feküdne; p+ q ennek a szakasznak minden pontjára kisebb mint 2a, miR vel könnyű belátni, hogy az ellipszisen belül p + q kisebb, mint 2a, az ellipszisen kívül pedig nagyobb. Tudjuk azonban, hogy L egyenesen p + q ~ 2a, így ez lehetetlen. L-nek tehát érintenie kell az ellipszist R pontban. De azt is tudjuk, hogy P R ugyanakkora 181. ábra. Az ellipszis érintési tulajdonsága szöget zár be L-lel, mint RQ; ezzel Q
p
182. ábra. IPR-QRI=maximum
L
egyúttal bebizonyított uk a következő fontos tételt: az ellipszis érintője egyenlő szöget zár be az érintési pontot a két fókusszal összekötő két egyenessel. Közeli rokona az előzőnek a következő probléma: Legyen adva L egyenes és két oldalán két pont, P és Q (l. 182. ábra). Keressünk L egyenesen olyan R pontot, amelyre a Ip-ql mennyiség, azaz P és Q pont R-től való távolságából képzett különbség abszolút értéke, maximum. (Feltesszük. hogy L nem felező merőlegese a PQ szakasznak; mert akkor p-q nulla lenne L minden R pontjára, s a problémának nem lenne értelme.) A megoldás érdekében tükrözzük P-t L egyenesre, a P pont P' tükörképe L ugyanazon oldalán lesz, mint Q. L minden R' pontjára p=R'P=R'P', q=R'Q.
Mivel R', Q és P' egy háromszög három csúcsának tekinthetők, Ip-ql = IR 'P' -R'QI mennyiség sohasem nagyobb, mint P'Q, mert a háromszög két oldalának különbsége sohasem nagyobb, mint a harmadik oldal. Ha R', p' és Q kollineárisak, Ip-ql egyenlő lesz P'Q-val, amint az az ábrából látható. Tehát a keresett R pont L-nek a p' és a Q ponton áthaladó egyenessel való metszéspont ja. Mint az előbbi esetben, itt is könnyen beláthatjuk, hogy az RP 183. ábra. A hiperbola érintési tulajdonsága
334
és L, valamint az RQ és L által bezárt két szög egyenlő, mivel RP R' és RP' RI" háromszögek kongruensele A probléma összefügg a hiperbola érintési tulajdonságával, éppen úgy, mint a megelőző az ellipszisével. Ha a IPR-QRI különbségmaximum értéke 2a,. tekinthetjük a sík mindazon pont jainak geometriai helyét, amelyekre p - q abszolút értéke 2a. Ez a geometriai hely hiperbola, mely R ponton halad át, és két fókusza P és Q. Mint könnyen kimutatható, a p - q abszolút érték a hiperbola két ága közötti tartományban kisebb mint 2a, s nagyobb mint 2a a hiperbola bármelyik ágának azon oldalán, amelyiken valamelyik fókusz is fekszik. Ebből - lényegében hasonló érveléssel mint az ellipszisnél - következik, hogy L-nek érintenie kell a hiperbolát R pontban. Az, hogy L a hiperbola melyik ágát érinti attól függ, hogy P van-e közelebb L-hez vagy Q. Ha P van közelebb, L a P köré hajló ágat érinti,s ugyanez áll Q -ra (l. 183. ábra). Ha P és Q egyforma távolságra van L-től, akkor L a hiperbola egyik ágát sem érinti, hanem egyike lesz a görbe. két aszimptotájának. Ez az eredmény plauzibilis, ha meggondoljuk, hogy ebben az esetben a fenti szerkesztés egyetlen (véges) R pontot sem szolgáltat, mivel P'Q egyenes párhuzamos lesz L-lel. Ugyanúgy mint az előbb, ez az érvelés bizonyítja azt a jól ismert tételt, hogy a hiperbola érintője felezi az érintési pont és a két fókusz által meghatározott szöget. Különösnek látszhat, hogy ha P és Q pontok L egyenes ugyanazon oldalán vannak, akkor minimumproblémát kell megoldanunk, ha meg az egyenes két különböző oldalán, akkor maximumproblémát. De rögtön látható, hogy ez így természetes. Az első problémában mindkét távolság, p és q, s így összegük is, minden határon túl nő, ha L mentében bármelyik irányba minden határon túl haladunk. Lehetetlen lenne tehát maxim um ot találni p + q számára, a minimumprobléma az egyetlen lehetőség. Egészen más a második eset, mikor P és Q az L különböző oldalán van. Itt, a zavar elkerülése végett, különbséget kell tenni p-q különbség, negatívja q-p és Ip-ql abszolút érték között; az utóbbi az, aminek maximum nak kell lenni. A helyzetet legjobban úgy lehet megérteni, ha R pontot L egyenesen különböző RI' R2, Ra, ... helyzetekbe mozgat juk. Van egy pont, amelyre a p - q különbség nulla: a PQ szakasz felező merőlegesének és az L egyenes nek a metszéspont ja. Ebben a pontban lesz azért Ip- ql abszolút érték minimum. De ennek a pontnak egyik oldalán p nagyobb, mint q, a másikon pedig kisebb; ezért a p - q mennyiség a pont egyik oldalán pozitív, és negatív a másikon. Következésképpen maga p-q se nem maximum, se nem minimum abban a pontban, amelyikben Ip- ql = O. Azonban az a pont, amelyben Ip - ql maximum, tényleg szélső érték helye (p - q)-nak. Ha p >- q, (p - q)-nak maximuma van ezen a helyen; ha q>-p, (q-p)-nek van maximuma, s ezért (p-q)-nak minimuma. Azt, hogy maximuma vagy minimuma van (p-q)-nak, a két adott Q ésp pont L egyeneshez viszonyított helyzete dönti el. 335·
Láttuk, hogyamaximumproblémának nincs megoldása, ha P és Q' egyenlő távolságra van L-től, mivel akkor a P'Q egyenes a 182. ábrán párhuzamos L-lel. Megfelel ez annak a ténynek, hogy Ip- ql mennyiség határértékhez tart, ha R pont L egyenes mentén valamelyik irányban tart a végtelenhez. Ez a határérték egyenlő PQ szakasz L-re való s vetületével (feladatként igazolja az olvasó ezt az állítást). Ha P és Q azonos távolságra van L-től, akkor Ip-ql mindig kisebb lesz, mint ez a határérték, s nincs maximum, ugyanis akármilyen messze is van R pont az L egyenesen, mindig találhatunk egy még messzebbit, amelyre Ip-ql nagyobb, de még mindig nem egyenlő s-sel.
* 5. Adott görbék extrém távolságai Határozzuk meg először egy P pontnak adott görbétől való legrövidebb és távolságát. Egyszerűség kedvéért tegyük fel, hogy az adott C görbe egyszerű zárt görbe, melynek mindenütt van érintője, mint ahogy az pl. a 184. ábrán látható. (A görbe érintőjének a fogalmát itt a szemlélet alapján fogadjuk el, a következő fejezetben analizáljuk majd.) A válasz igen egyszerű: a C görbe olyan R pontjára van a PR távolságnak legkisebb vagy legnagyobb értéke, amely R pontban a C görbéhez húzott érintő merőleges PR egyenesre; más szóval PR merőleges C görbére. A bizonyítás a következő: A kör, melynek középpontja P és R ponton halad át, szükségképpen érinti a görbét. Ugyanis, ha R a távolságminimum pontja, C-nek teljesen a körön kívül kell feküdnie, s így nem metszheti azt R pontban, míg ha R a távolságmaximum pontja, a C-nek teljesen a kör belsejében kell feküdni, s így megint csak nem metszheti azt R pontban. (Következik ez abból a nyilvánvaló tényből, hogy bármely pontnak P-től való távolsága kisebb, mint RP, ha a pont a körön belül van, és nagyobb, mint RP, ha a pont a körön kívül van.) Tehát a kör és a C görbe érintik egy184. ábra. Két görbe egymástól való távolmást, s közös érintőjük van R pontságának szélsö értékei ban. Mármost PR a kör sugara, s így merőleges a kör R pontbeli érintőjére, s ezért R pontban C görbére is. Mellékesen, egy ilyen zárt C görbe átmérőjének, azaz leghosszabb húrjának, mindkét végpont jában merőlegesnek kell lennie C-re. A bizonyítást feladatként az olvasóra bízzuk. Fogalmazzuk meg a három dimenzióra érvényes hasonló állítást, és bizonyítsuk be. leghosszabb
336
Feladat: Bizonyítsuk be, hogy két egymást nem metsző zárt gőrbét összekötő legrövidebb és leghosszabb szakasz végpontja inál mindkét görbére merőleges.
Ezek alapján általánosíthat juk a megelőző pontban tárgyalt, távolságok összegére és különbségére vonatkozó problémát. Tekintsünk az L egyenes helyett egy C egyszerű zárt görbét, amelynek minden pontjában van érintője, és legyen adva két pont, P és Q, amelyek nincsenek rajta a C görbén. A C azon pontjait kívánjuk jellemezni, amelyekre p + q összeg és p - q különbség szélső értékét veszi fel. Itt p a C görbe bármely pontjának P ponttól, q pedig C görbe bármely pontjának Q ponttól való távolságát jelenti. Most nem lehet egyszerű tükrözésen alapuló szerkesztést alkalmazni, mint abban az esetben, amikor C egyenes volt. De a probléma megoldására alkalmazhatjuk az ellipszis és a hiperbola tulajdonságait. Mivel C zárt görbe, s így nem terjed a végtelenbe, itt már értelme van a maximumproblémának éppen úgy, mint a minimumproblémának, ugyanis bizonyos, hogya p + q és p - q mennyiségeknek van legnagyobb és legkisebb értékük valamely görbe bármely véges szakaszára, kiváltképpen pedig zárt görbére (I. 7. §). Tételezzük fel p + q összes esetében, hogy R a C görbének az a pontja, amelyre p + q értéke maximum, és jelölje 2a ebben az R pontban p + q értékét. Tekintsük azt az ellipszist, melynek P és Q a fókuszai és azon pontoknak a mértani helye, amelyekre p + q = 2a. Ennek az ellipszisnek R pontban kell érintenie C-t (a bizonyítást gyakorlatként az olvasóra bízzuk). Láttuk azonban, hogy P R és QR egyenesek egyenlő szöget zárnak be az ellipszis R-beli érintőjével; mivel az ellipszis érinti C görbét az R pontban, P R és QR egyeneseknek egyenlő szöget kell bezárniuk R pontban C görbével is. Ha p + q minimum R-re, ugyanígy láthatjuk be, hogy R pontban P R és QR egyenlő szöget képez C görbével. Így kimondhatjuk a következő tételt: Ha adva van egy C zárt görbe és két pont,
p
I
I
I 185. ábra. PR+QR legnagyobb és legkisebb értéke 22
Mi a matematika?
186. ábra. PR - QR legkisebb értéke
337
P és Q, C ugyanazon oldalán, továbbá ha R olyan pont C-n, amelyre a p+q összeg legnagyobb vagy legkisebb értékét veszi fel, akkor ebben az R pontban p R egyenes ugyanakkora szöget zár be C görbével (azaz a C görbe R pontbeli érintőjével), mint QR egyenes. Ha P a C görbén belül van és Q rajta kívül, akkor a tétel csak p + q legnagyobb értékére érvényes, legkisebb értékére nem, mivel ebben az esetben az ellipszis egyenessé fajul el. Teljesen hasonló eljárással, az ellipszis helyett a hiperbola tulajdonságait használva, bizonyítsa be az olvasó a következő tételt: Legyen adva egy C zárt görbe és két pont, P és Q, C két különböző oldalán. Ha R olyan pont C-n, amelyre p - q legnagyobb vagy legkisebb értékét veszi fel, P R egyenes ugyanakkora szöget zár be C-vel, mint QR egyenes. Újból hangsúlyozzuk, hogy a probléma más zárt C görbére, mint végtelen egyenesre, amennyiben utóbbi problémában Ip - ql abszolút érték maximumát kerestük, míg most létezik p - q maximuma is (akárcsak minimuma).
2. § Szélső érték problémák
egyik általános
alapelve
1. Az elv A fenti problémák speciális esetei egy általános kérdésnek, amelyet legalkalmasabban analitikus nyelven fogalmazhatunk meg. Jelölje a p+q szélső értékének megkereséséből álló problémában x, y az R pont koordinátáit, XI' YI a rögzített P pontét, X2, y2 a Q-ét, akkor
és a probléma
az, hogy meg kell keresni f(x, y)
=
p+q
függvény szélső értékeit. Ez a függvény a síkban mindenütt folytonos, de az a pont, melynek a koordinátái X, Y, az adott C görbére van korlátozva. Ezt a görbét valamely g(x, y) egyenlet definiálja: pl. x2+y2_1 = 0, ha a görbe az egység sugarú kör. Meg kell tehát találni f(x, y) szélső értékeit, ha x-et és y-t a g(x, y) feltétel korlátozza. A következőkben problémánknak ezt az általános típusát tárgyaljuk. Tekintsük a megoldás jellemzésére azt a görbesereget, melynek görbéit az f(x, y) = c egyenletek adják meg, ahol a c állandó bármely értéket felvehet, de értéke a sereg egyes görbéinek a pont jaiban azonos. Tegyük fel, hogy a sík minden pontján az f(x, y) = c görbeseregnek egy és csak egy görbéje halad át, 338
legalább is akkor, ha a C görbe szomszédságára szorítkozunk. Akkor, amint c változik, az f(x, y) = c görbe hiánytalanul kisepri a sík egy részét, és eközben ebben a síkrészben egyetlen pontot sem érint kétszer. (Az x2_y2 = c, x+y = c és x=c görbék például ilyen tulajdonságúak.) A sereg egy görbéje át fog haladni speciálisan azon az RI ponton is, ahol f(x, y) legnagyobb értékét veszi fel C-n, egy másik görbe pedig azon az R2 ponton, ahol f(x, y) legkisebb értékét veszi fel. Nevezzük a legnagyobb értéket a-nak, a legkisebbet b-nek. Az f(x, y) = a görbe egyik oldalánf(x, y) értéke kisebb lesz, mint a, a másik oldalán pedig nagyobb. Mivel 187. ábra. A függvény valamely görbére vonat- . C-n f(x, y);:§ a, C-nek teljesen az koztatott szélső értéke f(x, y)=a görbe egyik oldalán kell feküdnie; tehát érintenie kell ezt a görbét RI pontban. Hasonlóképpen, R2 pontban érintenie kell C-nek f(x, y) = b görbét. Így kimondhatjuk a következő általános tételt: Ha a C görbén levő R pontban valamely f(x, y) függvénynek a szélső értéke van, akkor az f(x, y) = a görbe érinti C-t R pontban. 2. Példák Könnyen belátható, hogy az előző pont eredményei speciális esetei ennek az általános tételnek. Ha p + q szélső értéké t keressük, azf(x, y) függvény egyenlő
188. ábra. Konfokális ell ipszisek 22*
189. ábra. Konfokális
hiperboJák
339
+ q-val és az f(x, y) = c görbék konfokális ellipszisek, P-vel és Q-val mint fókusszal. Amint az általános tételből látható, azok az ellipszisek, melyek C azon pont jain haladnak át, ahol f(x, y) szélső értéket vesz fel, érintik C-t ezekben a pontokban. Abban az esetben, mikor p - q szélső értékét keressük, az f(x, y) függvény p-q, azf(x, y)=c görbék konfokális hiperbolák, P-vel és Q-val mint közös fókusszal, és azok a hiperbolak, melyek C-nekf(x, y) szélső értékeihez tartozó pont jain haladnak át, érintik C-t ezekben a pontokban. Másik példa: Legyen adva PQ szakasz és a szakaszt nem metsző L egyenes. L melyik pont jából látszik PQ a legnagyobb szög alatt? A maximalizálandó függvény itt az a () szög, amelyet PQ szakasz két végpontja határoz meg, L egyenes egy-egy pontját véve a szög csúcsának. Az a szög, amely alatt PQ a sík tetszőleges R pont jából látszik, R pont koordinátáinak valamilyen () =f(x, y) függvénye. Tudjuk az elemi geometriából, hogya ()=((x, y)=c görp
-------
"
"
'-,, , \ \ \
\ I
I I
I
I I
----~~----~~----~\~~~~----------~~
'. ,
,,
,,
L
'--
190. ábra. L egyenes azon pontja, ahonnan PQ szakasz legnagyobbnak
látszik
békből álló görbesereg P és Q ponton átmenő körök serege, mivel egy-egy körben a PQ húr hoz tartozó íven nyugvó kerületi szögek egyenlők, a körkerület PQ azonos oldalán levő pont jaiból PQ azonos szög alatt látszik. Látható a 190. ábrából, hogy ezek közül a körök közül általában kettő érinti az L egyenest, a két kör középpontja PQ két különböző oldalán van. A két érintési pont egyike adja az abszolút maximumot () számára, a másik pedig "relatív" maximumot határoz meg (azaz ()értéke kisebb lesz ennek a pontnak valamely környezetében, mint magában a pontban). Az az érintési pont szolgáltatja a két maximum közül a nagyobbat, az abszolút maximumot, amely az L és PQ meghosszabbítása által képzett hegyesszöghöz tartozik, a relatív maximumot szolgáltató érintési pont 340
pedig az, amelyik a mondott két egyenes által alkotott tompaszöghöz tartozik. (Az a pont, amelyben PQ szakasz meghosszabbítása metszi L egyenest, adja () legkisebb értékét, nullát.) A probléma általánosításaként helyettesíthet jük L-et valamely C görbével, és kereshetjük C azon R pontját, amelyből egy adott (C-t nem metsző) PQ szakasz legnagyobb vagy legkisebb szög alatt látszik. Itt megint a P, Q, R pontokon áthaladó körnek kell érinteni C-t R pontban.
3. § Stacionárius
pontok és a differenciálszámítás
1. Szélső értékek és stacionárius pontok Eddigi meggondolásainkban nem használtuk a differenciálszámítást. Valóban elemi módszereink sokkal egyszerűbbek és közvetlenebbek voltak azoknál, amelyeket a differenciálszámításban használunk. A természettudományos gondolkozásban általában jobb a kérdések individuális vonatkozásait tekinteni, s nem bízni túlságosan általános módszerekben, de az individuális próbálkozásokat mindig olyan elvnek kell vezetnie, amelyik megvilágítja a használt speciális eljárás értelmét. Éppen ez a differenciálszámítás szerepe szélső érték problémákban. A modern törekvés az általánosságra, csak egyik oldala a dolognak, a matematika életrevalósága ugyanis leghatározottabban a problémák és az alkalmazott módszerek egyéni, individuális színétöl és ízétől függ. Történetét tekintve, a differenciálszámítás kialakulására és fejlődésére igen nagy hatással voltak individuális maximum=-minimumproblémak. A szélső értékek és a differenciálszámítás között ugyanis az alábbiakban vázolt összefüggés van. A VIII. fejezetben részletesen tanulmányozzuk majd egy f(x) függvény f'(x) derivált jának fogalmát és geometriai jelentését. Egyelőre röviden annyit jegyezzünk meg, hogy azf'(x) derivált az y= f(x) görbéhez (x, y) pontban húzott érintő irány tangense. Világosan látszik a geometriai ábrázolásból, hogy egy y=f(x) sima! görbe maximumában vagy minimumában a görbéhez húzott érintőnek vízszintesnek kell lennie, azaz az iránytangensének itt egyenlőnek kell lenni null ával. így f(x) szélső értékeire azf'(x)=0 feltételt kapjuk. Vizsgáljuk meg a 191. ábrán látható görbét, hogy lássuk, mit is jelent f'(x) eltűnése. A, B, C, D, E betűkkel jelölt öt pontban vízszintes az ehhez a görbéhez húzott érintő; legyen ezekben a pontokban f(x) értéke sorra a, b, c, d, e. f(x) maximuma a rajzolt intervallumban D-nél van, minimuma A-nál. B pont is
l "Sima" görbének nevezzük az olyan görbét, amelynek minden pontjában van érintője, tehát nincsenek pl. csúcsai.
341
maximum abban az értelemben, hogy B közvetlen környezetében f(x) értéke mindenütt kisebb b-nél, de már pl. a D pont közelében levő pontoknál f(x) nagyobb, mint b. Éppen ezért nevezzük B-tf(x) relatív maximumának, D-t pedig abszolút maximumának. Hasonló értelemben mondjuk, hogy C relatív, A pedig abszolút minimum. Végül E-nél f(x)-nek se maximuma, se minimuma nincs, jóllehetf'(x) = itt is. Látjuk tehát, hogy f'(x) eltűnése szűkséges, de nem elegendő feltétele annak, hogy egy f(x) sima függvény nek szélső értéke legyen; más szóval
°
A
191. ábra. A függvény stacionárius
pontjai
rnindenütt, ahol a függvénynek relatív vagy abszolút szélső értéke van, minden szélső pontban f'(x)=O, de nem kell minden pontnak szükségképpen szélső pontnak lenni, ahol f'(x)=O. Azokat a pontokat, ahol a függvény derivált ja eltűnik, akár szélső pontok, akár nem, stacionárius pontoknak nevezzük. Részletesebb analízissel többé-kevésbé bonyolult feltételeket kaphatunk f(x) magasabb derivált jaira, amelyek tökéletesen jellemzik a maximumot, minimumot és egyéb stacionári us pontokat. 2. Több váItozós függvények maximuma és minimuma. Nyeregpontok Vannak olyan maximum-minimumproblémák, amelyek nem fejezhetők ki egyváltozós függvények segítségével. A legegyszerűbb ilyen eset akkor adódik, ha meg kell keresni egy z =f(x, y) kétváltozós függvény szélső értékeit. Ábrázolhat juk f(x, y)-t egy felület x, y sík felett vett z magasságértékeivel, képzelhetjük pl. a felületet hegyvidéki tájnak. f(x, y) maximuma hegycsúcsnak 342
felel meg, rrumrnuma egy katlan fenekének vagy egy tónak. Mindkét esetben, feltéve, hogy a felület sima, vízszintes lesz a felülethez simuló érintősík helyzete. Vannak azonban más pontok is hegycsúcsokon és völgykatlan ok fenekén kívül, ahol az érintősík vízszintes. Ilyen pontok pl. a hágók legmagasabb pontjai. Vizsgáljuk meg ezeket a pontokat közelebbről. Tekintsük egy hegylánc két A és B csúcsát, amint az a 192. ábrán látható, s két C és D-vel jelölt pontot a hegylánc két oldalán, s tegyük fel, hogy C pontból D pontba akarunk jutni. Tekintsük először azokat az utakat, amelyeket valamely C és D ponton átmenő sík vág ki a felületből. Minden ilyen úton lesz egy legmagasabb pont. A sík helyzetét változtatva változnak az utak, s lesz egy olyan út, amelynek legmagasabb pontja
-,
\.
D
c 192. ábra. Hágó
193.. ábra ....
és a megfelelő szintvonalak
az utak legmagasabb pontjai közüllegalacsonyabban van. Ennek az útnak legmagasabb pontját nevezik hágónak, matematikai nyelven pedig nyeregpontnak. Jelöljük ezt a pontot E-vel. Nyilvánvaló, hogy E se nem maximum, se nem minimum, hiszen tetszés szerint találhatunk E közelében pontokat, amelyek magasabban vagyalacsonyabban feküsznek mint E. Tekinthetünk a síkok által kimetszett utak helyett tetszőleges utakat a felületen, az E nyeregpontnak ez a jellemzése nem változik. Hasonlóképpen ha A csúcsról akarunk menni B csúcsra, bármelyik útnak lesz egy legalacsonyabb pontja; ha megint csak síkmetszeteket tekintünk, lesz megint egy AB út, melynek legalacsonyabb pontja legmagasabban fekszik, s ennek az útnak a minimuma megint a fent talált E pont lesz. Ez az E nyeregpont így egyszerre maximum és minimum tulajdonságú, azaz maxi-minimum vagy mini-maximum. Az érintősík vízszintes E-ben, ugyanis, mivel E az AB út minimumpontja, AB érintőegyenesének E-ben vízszintesnek kell lennie, és hasonlóképpen, mivel E a CD maximumpontja, CD E-beli érintőegyenesének is vízszintesnek kell lennie. Az érintősíknak, amelye két egyenes által meghatározott sík, szintén vízszintesnek kell tehát lennie. Így három különböző típus ú pontot találtunk, melyeknek vízszintes érintősík felel meg: maximum-, minimurn- és nyeregpont. Ennek a három különböző ponttípusnak f(x, y) különböző típusú stacionárius értékei felelnek meg. f(x, y) függvény másik ábrázolási módja a szintvonalakkal történő ábrázolás, ahogyan a térképeken használják a magasság megadására (I. 288 - 9. o.). A szint343
vonal az x, y sík olyan görbéje, amely mentén az f(x, y) értéke állandó; így a szintvonalak rendszere azonos az f(x, y)=c görbesereggel. A sík valamely közönséges pontján egy és csak egy szintvonal halad át; maximumot vagy minimumot zárt szintvonalak vesznek körül; a nyeregpontban pedig több szintvonal metszi egymást. A 193. ábrán megrajzoltuk a 192. ábrán látható táj szintvonalait, a rajzból azonnal látszik E pont maximum-minimum tulajdonsága: minden útnak, amely A-t és B-t összeköti, és nem halad át E-n, olyan tartományban kell haladnia, aholf(x, y)x, tehát x nem lehet a legnagyobb egész szám. Következésképpen x-nek egyenlőnek kell lennie I-gyel. Ez az ellentmondás, amin ez a téves érvelés nyugszik, természetesen azon a hallgatólagos feltevésen alapul, hogy létezik legnagyobb egész szám.
363
után sikerült végre Hilberttses: utat törni azoknak a kérdéseknek teljes megválaszolása felé, melyeket Riemann 'dolgozata elintézetlenül hagyott. Az a fejlődés. pedig, amit a matematika és matematikai fizika ezen a területen elért a modern matematikai analízis történetének egyik legnagyobb diadala lett. Riemann dolgozatában a kritizálható pont egy minimum létezésének a kérdése. Riemann elméletének nagy részét arra alapította, amit ő Dirichlet-féle elvnek nevezett (Dirichlet Riemann tanára volt Göttingában, erről az elvről előadott, de sohasem írt le róla semmit). Tegyük fel pl., hogy a sík vagy bármely más felület egy részét vékony ónlemezzel fedjük, és az ónlemez' két pontját: galvánelem pólusaival kötve össze, egyenáramot bocsátunk át rajta. Semmi, kétség afelől, hogy a fizikai kísérlet meghatározott eredményre vezet. De mit mondjunk a megfelelő matematikai problémáról, amelyik elsőrendű fontosságli a függvénytanban és a matematika más területén is? Az elektromosságtan szerint a fizikai jelenséget mint "egy parciális differenciálegyenlet peremértékfeladatát" írják le. Ebben a matematikai alakjában érdekel minket; a probléma fizikai jelenséggel feltételezett ekvivalenciája plauzibilis sá teszi a megoldást, azonban semmiképpen sem jelenti matematikai bizonyítását. Riemann két lépésben intézteel a matematikai kérdést. Először megmutatta, hogy a probléma minimumproblémával ekvivalens: egy mennyiség, amely az elektromos áram energiáját fejezi ki, a ténylegesen fellép ő árameloszlásban minimum azokhoz a többi árameloszlasokhoz képest, amelyek az előírt feltételek között még lehetségesek. A következő lépésben azután" Dirichlet-féle elvként" mondotta ki, hogy ilyen minimumproblémának van megoldása. Riemann a legcsekélyebb kísérletet sem tette második állítása bizonyítására, és éppen ez volt az a pont, amit Weierstrass megtamadott. A minimum létezése nemcsak, hogy nem volt evidens, hanem, amint késöbb kiderült, kiváltképpen kényes kérdés volt, amelyre az akkori idők matematikája még nem is volt felkészülve, és amelyet csak sok évtized intenzív kutatásának az árán sikerült végül megoldani. 2. Példák
Az alábbiakban két példával illusztráljuk, miféle természetű nehézségről van itt szó. 1. Egy L egyenesen két pontot jelölünk ki A-tés B-t, egymástól dtávolságr!l. és keressük azt a legrövidebb sokszög vonalat, amely A-ból L-re merőleges irányban kiindulva B-ben végződik. Mivel minden lehetséges út között AB egyenes szakasz a legrövidebb összeköttetés A és B pont között, bizonyosak lehetünk, hogy a versenyben engedélyezett minden út hosszabb lesz d-nél, mivel az egyetlen d hosszúságú út AB szakasz, amely megsérti az A-ban érvényes irányra kikötött megszorítást, és így a probléma keretei között nem megengedhető. Tekintsük másrészről a 222. ábrán feltüntetett AOB megengedhető utat. Ha O-t A-hoz elegendően közel fekvő O' ponttal helyettesítjük, kaphatunk olyan megengedhető 364
pályát, amelyik tetszőlegesen kicsiny értékkel tér el d-től; tehát ha létezik legrövidebb megengedhető út, nem lehet hosszabb d-nél, és így pontosan d hosszúságú kell legyen. De az egyetlen d hosszúságú pálya, amint láttuk, nem megengedhető. Így nem létezhet legrövidebb megengedhető út, és az állított minimumproblémának nincs megoldása. 2. Legyen C, amint az a 223. ábrán látható, egy kör és legyen S a kör középpontja felett egységnyi távolságban levő pont. Tekintsük mindazoknak a felületeknek az osztályát, amelyeket C határol, s keresztülmennek S ponton, és C
s
o
-----'--O'~_~L A
222. ábra.
B 223. ábra.
felett nincs két pontj uk, melynek C síkjára való vetülete egybeesne. Melyik felület nek lesz ezek közül legkisebb területe? Bármilyen természetesnek látszik a probléma, nincs megoldása: nincs minimális felszínű megengedhető felület. Ha nem tűztük volna ki azt a feltételt, hogy a felület haladjon át az S ponton, a megoldást nyilvánvalóan a C kör által határolt sík körlemez szolgáltatná. Jelöljük ennek a területét A-val. Bármely más C által határolt felület felszínmértékének nagyobbnak kell lennie A-nál. Található azonban olyan megengedhető felület, amely tetszőlegesen kicsiny értékkel haladja túl A-t. Vegyük ebből a célból azt az egységnyi magasságú kúpfelületet, amelyik olyan karcsú, hogy palást jának területe bármely előre megadott értéknél kisebb. Helyezzük ezt a kúpot csúcsával S pontban a körlemezre, és tekintsük azt a felületet, amelyet a kúp palást jának területe és a körlemeznek a kúp alapján kívül eső területe alkot. Világos, hogy ez a felület, amelyik csak a körlemez középpontja közelében tér el a síktól, minden előre megadottnál kisebb értékkel nagyobb A-nál. Mivel ezt az előre megadott értéket tetszőlegesen kicsinynek választhat juk, újból az következik, hogy a minimum, ha létezik nem lehet más mint a körlemez A területe. De a C kör által határolt felületek között egyedül a körlemeznek ekkora a területe, és mivel a körlemez nem halad át S ponton, megsérti a megengedhetőség feltételét. Következésképpen a problémának nincs megoldása. , Mellőzhetjük a Weierstrass által adott ravaszabb problémákat. Elég jól látjuk a fenti kettőből .is, hogy. a minimumlétezése nem .trivialis része a matematikaii
bizonyításnak. Mondjuk el a dolgot általánosabb és absztrakt formában. Tekintsük objektumok, pl. görbék vagy felületek meghatározott osztályát, "és rendeljünk hozzá minden egyes objektumhoz függvényként valamilyen számot, pl. hosszúságot vagy felszínt. Ha az osztályban csupán véges számú objektum van. nyilvánvaló, hogy az objektumoknak megfelelő számok között kell egy legnagyobbnak és egy legkisebbnek lenni. Azonban, ha az osztály végtelen sok objektumot tartalmaz, akkor nem föltétlenül kell legnagyobb vagy legkisebb számnak létezni, még akkor sem, ha mindezek a számok rögzített korlátok között maradnak. Ezek a számok általában a számegyenes valamely végtelen halmazát képezik. Tegyük fel pl. egyszerűség kedvéért, hogy az összes szám pozitív. Akkor a halmaznak van "legnagyobb alsó korlátja", azaz olyan ex pont, amelynél kisebb szám nincsen a halmazban, s amely maga vagy eleme a halmaznak, vagy tetszőleges pontossággal megközelíthető a halmaz elemei által. Ha ex a halmazhoz tartozik, akkor a halmaz legkisebb eleme; egyébként pedig a halmaznak egész egyszerűen nincsen legkisebb eleme. Pl."az 1, 1/2, 1/3, ... számok halmazának nincsen legkisebb eleme, mivel az alsó határ: a O, nem tartozik a halmazhoz. Ezek a példák absztrakt módon illusztrálják az egzisztencia-problémákkal kapcsolatos logikai nehézségeket. A minimumprobléma matematikai megoldása nem teljes addig, amíg explicite vagy implicite nem bizonyitottuk, hogy a problémához rendelt számértékek halmazában van legkisebb elem. 3. Elemi szélső érték problémák
Elemi problémák esetében a megoldás létezésének a kérdése csupán a szereplő alapfogalmak figyelmes elemzését kívánja meg. Említettük a VI. fejezet 5. §-ában a zárt halmaz általános fogalmát; azt állítottuk, hogy zárt halmazon értelmezett folytonos függvénynek mindig van a halmazon egy legnagyobb és egy legkisebb értéke. Az előzőkben tárgyalt elemi problémák mindegyikében úgy lehet tekinteni az összehasonIító értékeket, mint egy egyváltozós vagy többváltozós függvény értékeit egy olyan tartományban, amely vagy zárt vagy a probléma lényeges megváltoztatása nélkül zárttá tehető. Ilyen esetben bizonyos a maximum és a minimum létezése. Steiner problémáj ában pl. a kérdéses mennyiség három távolság összege, és ez a mozgatható pont helyzetének folytonos függvénye. Mivel a szabadon mozgatható pont változási tartománya az egész sík, semmit sem veszítünk ha az ábrát egy nagy körbe zárjuk, és ennek a körnek belső és határoló pont jaira szorítkozunk. Ugyanis mihelyt a szabadon mozgó pont elég messze van a három adott ponttól, ezen pontoktól való távolságainak az összege bizonyosan nagyobb lesz, mint AB+AC, amely érték egyike a függvény megengedhető értékeinek. Ha tehát van minimum a nagy körre korlátozott valamely pontra, akkor ez minimum lesz az eredeti probléma számára is. Azt azonban könnyű megmutatni; 366
hogy a kör belsejéből és a körből álló tartomány zárt halmaz, igy tehát Steiner problémáj ában létezik minimum. Az alábbi példán látható annak a feltevésnek a fontossága, hogy a független változó változási tartománya zárt halmaz. Ha adva van két zárt görbe, Cl és C2, akkor mindig létezik Ccen illetve C2-n olyan Pl illetve P2 pont, amelyek a lehető legkisebb, és két olyan Ql' Q2 pont, amelyek a lehető legnagyobb távolságra vannak egymástól. Ugyanis Cl valamely Al pontja és C2 valamely A2 pontja közötti távolság a tekintett Al' A2 pontpárokból álló zárt halmazon értelmezett folytonos függvény. Azonban, ha a két görbe nem korláto s, hanem végtelenbe terjed, akkor előfordulhat, hogy a problémának nincs megoldása. Pl. a 224. ábrán látható esetben semlegkisebb, sem legnagyobb távolság nincs a görbék között; a távolság alsó határa 0, felső határa végtelen, és a távolság egyiket sem éri el. Van olyan eset, hogy mini- 224. ábra. Görbék, rnelyek között nincsen leghosszabb, sem legrövidebb távolság mum létezik, de maximum nem. Pl. a hiperbola két ágának (17. ábra, 95. o.) csak minimális távolsága van egymástól, A és A'-nél, mivel nyilvánvalóan nincs a hiperbolának két, egymástól maximális távolságban levő pontja. Ezt a viselkedés beli különbséget könnyen megmagyarázhatjuk mesterségesen korlátozva a változók változási tartományát. Válasszunk egy R tetszőleges pozitív számot, és korlátozzuk x-et az Ixl;§ R feltétellel. Akkor mindkét utóbb említett esetben létezik maximum is, minimum is. Az első esetben a kiszabott korlát biztosítja a maximális és minimális távolság létezését, mindkettő a korláton lévén. Ha R-et növeljük, azok a pontok, amelyekre a szélső értékeket kapjuk, újból a korláton lesznek. A második esetben a minimumtávolság a tartomány belsejében van, akárhogyan is választjuk meg R-et, a két minimumpont távolsága nem változik. 4. A bonyolultabb esetek nehézségeiről
Egy, kettő, vagy akárhány véges számú független változó t tartalmazó elemi probléma ese~ében az egzisztenciakérdés sohasem okoz komoly nehézséget. De a Dirichlet-féle elv, vagy akár egyszerűbb hasonló problémák esetében is, egészen más a helyzet. Ennek vagy az az oka, hogy a független változó változási tartománya nem zárt, vagy pedig az, hogy a függvény nem folytonos. A 2. pont első példájában olyan AO'B utak sorozatát tekintettük, ahol O' pont A ponthoz tar367
e
tott. A sorozat mindegyik útja kielégítette a megengedhetőség feltételét. Azonban az AO' B utak az AB szakaszhoz tartottak, s ez nem esett többé a megengedhetőség feltétele alá. A megengedhető utak halmaza ebben a tekintetben a OO, d>O. Keressük meg a pálya legmagasabb pontjának koordinátáit. Keressük meg a pálya x-tengellyel való második rnetszéspontjának t idejét és az x értékét. 1)-
x
Newton első célja az volt, hogyanem egyenletes mozgas sebességét meghatározza. Egyszerűség kedvéért tekintsük egy egyenes mentén mozgó részecske x =f(t) függvény által megadott mozgását. Ha a mozgás állandó sebességgel történő egyenletes mozgás lenne, akkor a mozgás sebességét úgy kaphatnánk meg, hogy vennénk két értéket az időre t és tI-et, azután a részecske helyzetének ezeknek megfelelő x=f(t) és Xl =f(tl) értékeit, s képeznénk a
v hányadost. = l-re Xl
-
=
" se b esseg
.tavolság
= ---
idő
__ Xl -X __ f(tl) -f(t) ti -t
ti -t
így pl., ha t-t órákban mérj ük és x-et kilométerekben, akkor t,- t = X az 1 óra alatt megtett kilométerek számát adja meg; s v a sebességet, 415
óránként megtett kilométerekben kifejezve. Az az állítás, hogy a mozgás sebessége állandó, egyszerűe n úgy értendő, hogy az f(tl)
(3)
-f(t) tl -t
differenciahányados azonos t és tI minden értékére. De ha a mozgás nem egyenletes, mint pl. a szabadon eső test esetében, amelynek sebessége az esés folyamán állandóan nő, akkor a (3) hányados nem adja meg a t időpillanatbeli sebességét, csupán a t-től tj-ig terjedő időintervallumra vett átlagos sebességet adja. Ahhoz, hogya t időpontbeli pillanatnyi sebességet megkapj uk, az átlagsebesség határértékét kell vennünk, ha t j tart t-hez. Így Newton szerint bevezet jük a következő definicíót: (4) a sebesség t időpontban
= lim f(tl)-f(t) tl-
=f'(t). t
Más szóval, a sebesség a távolság koordináta idő szerinti derivált ja, vagy a távolság idő szerinti "pillanatnyi változási sebessége". (Megkülönböztetésül a (3) által adott átlagos változási sebességtől, a sebesség változásának átlagától.) A sebesség változásának a sebességét, a sebesség változási sebességét,gyorsulásnak nevezik. Ez nem egyéb, mint egy derivált - a sebesség - derivált ja, amit általábanf"(t)-vel szokás jelölni, sf(t) második derivált jának nevezik. Galilei figyelte meg, hogy azt az x vertikális távolságot, melyet a szabadon eső test t idő alatt tesz meg (5)
X
1 2 gt 2
=f(t)
=-
formula írja le, ahol g a nehézségi állandó. hogy a test v sebességét t időpontban (6)
v =f'(t)
adja meg, s az
IX
Az (5)-öt differenciálva
= gt
gyorsulást,
ex = f"(t) = g, amely állandó. Tegyük fel, hogy a test sebességét elengedése határozni. Az átlagos sebesség t=2-től t=2,1-ig 1
2" g(2,1)
---------
2
-
1
2: g(2)
2,1-2
után 2 másodperccel kell megterjedő időintervallumban
2
4905 (O 41) ='
0,1
,
= 20,11 (meter/secundum).
1=2 értéket helyettesítve be (6)-ba, látjuk, hogy a pillanatnyi másodperc végén v= 19,62. 416
következik,
sebesség a második
Feladat: Mi az átlagos sebessége a testnek 1= 2 és 1= 2,01 időpont által határolt időintervallumban? Mi 1=2 és t=2,001 által határoltban?
Síkbeli mozgás esetében két x=/(t) és y=g(t) függvény f'(t) és g'(t) derivált ja definiálja a sebesség két komponensét. Rögzített görbe mentén történő mozgásra a sebességet s=f(t) függvény derivált ja definiálja, ahol s az ívhosszúság. 7. A második derivált geometriai jelentése A második derivált nak az analízisben és a geometriában is megvan a jelentősége, hiszen f"(x) azt adja meg, milyen sebesen változik azy=f(x) görbe f'(x) irány tangense, emelkedése, s így utal a görbe görbülési módjára. Ha f"(x) egy intervallumban pozitív, akkor ott f'(x) változásának a sebessége pozitív. Ha egy
~O~~----------_·
o 270. ábra.
271. ábra.
függvény változásának a sebessége pozitív, az annyit jelent, hogya függvény értékei x növekedtével növekszenek. Tehát f"(x)>0 azt jelenti, hogy az f'(x) irány tangens, a görbe emeikedési iránya x növekedtével növekszik, úgyhogy ott, ahol a görbe irány tangense, emeikedési iránya pozitív, meredekebbé válik a görbe, ahol pedig a görbe irány tangense, emeikedési iránya negatív, ott a görbe kevésbé lesz meredek. Az ilyen görbére azt mondjuk, hogy felfelé konkáv (270. ábra). Hasonlóképpen, haf"(x)0. Tehátf(x)-nek van egy maximuma, f(Xl)=6.és egy minimuma.j''(xj) = 5. Fe/adatok: l) Rajzoljuk meg a fentebb tárgyalt függvény görbéjét, 2) Elemezzük az [(x) = (x2-1)(x2_ 4) függvény viselkedését és rajzoljuk meg görbéjét, 3) Keressük meg x+l!x, x+a2/x,px+q!x minimumát, hap és q pozitivok. Van ezeknek a függvényeknek maximuma? 4) Keressük meg sin x és sin (X2) maximumát és minimumát.
3. § A differenciálás technikája Eddig arra törekedtünk, hogy sokféle speciális függvényt differenciáljunk, a differenciahányadost megfelelő átalakitással előkészítve ahatárátmenetre. Döntő lépés volt, amikor Leibniz, Newton és követőik munkája nyomán ezeket az individuális műfogásokat sokkal célravezetőbb általános módszerekke 418
helyettesítették. Ezekkel a módszerekkel csaknem automatikusan lehet differenciálni minden, a matematikában közönségesen előforduló függvényt, feltéve, hogy az ember megtanul néhány egyszerű szabályt, és képes felismerni alkalmazhatóságukat. A differenciálás így számolási "algoritmus" jellegét öltötte, az elméletnek éppen ezt a jellegét fejezi ki a "kalkulus" (számolás) elnevezés. Nem mehetünk messze ennek a technikának részletezésében. Csupán néhány egyszerű szabályt említünk. (a) Összeg differenciálása.
Ha a és b állandók, és a k(x) függvényt k(x)
= af(x)+bg(x)
adja meg, akkor, amint azt az olvasó könnyen igazolhatja,
+ b g/ex).
k/ex) = af'(x)
Hasonló szabály érvényes akárhány tag esetére is. (b) Szorzat differenciálása. p(x) = f(x) g(x)
szorzat derivált ja p/(x)
= f(x)
g/ex)
+ g(x)!(x)!
Könnyen igazolható ez a következő műfogással: ugyanazt a tagot egymásután plusz és mínusz előjellel felírva, p(x+h)
-p(x)
= f(x+h)
g(x+h)-f(x)
g(x)
=f(x+h)
g(x+ h) -f(x+h)
g(x) +f(x
+ h) g(x)
-f(x)g(x),
az első két és az utolsó két tagot kombinálva p(x+h)-p(x)
-"-'---'---=--'---'-.
h
= f( x + h) g(x+h)-g(x) h
Közeledjék most h nullához; mivelf(x+h) közvetlenül következik .
+ g ()x
f(x+h)-f(x)
tart f(x)-hez,
h
.
a bizonyítandó állítás
. Feladat: Igazoljuk, hogy p(x)= x" függvény derivált ja p'(x)= nx" -]. (Útmutatás: x"=x·x" -1 alakba, és alkalmazzunk matematikai indukciót.)
írjuk x"-et
(a) és (b) szabály használatával bármely f(x)
= aO+alx+
... +anxn
polinomot differenciálhatunk, a derivált f'(x) 27*
= al +2a2x+3a3x2+
... +nanxn-l. 419
Alkalmazásként bizonyítsuk be a binomiális tételt (vö. 38. o.). (l + xt-t adja meg polinom alakban:
+ ... +anXn,
I(x) = (1 + x)" = 1 +alx+a2x2+a3x3
(1)
Ez a tétel
és azt állítja, hogy az ak együttható t (2)
ak
n(n-1)
=
... (n-k+l)
kl képlet fejezi ki. Természetesen an= 1. Láttuk (412. o., feladat), hogy az (1) bal oldalát differenciálva, kapunk. Így, a megelőző bekezdés szerint,
n{l +x)n -l-et
(3) Ebben a képletbe n x=e Ö-t írva azt kapjuk, hogy n=a" felel meg. Differenciáljuk most újból (3)-at,
= 2a2 +3, 2a3x+
n(n -1)(1 +xy-2
s ez k= l-re a (2)-nek
... +n(n -1)anxn-2
ide x=O-t, azt találj uk, hogy n(n-1)
kifejezést kapva. Behelyettesítve megegyezésben (2)-vel k=2-re.
= 2a2
Feladat: Igazoljuk (2)-t k= 3, 4, és matematikai indukcióval általános k esetére.
(c) Hányados differenciálása. Ha q(x) = f(x) , g(x) akkor
= g(x)j'(x) -f(x) g'(x)
q'(x)
(g(X»2 A bizonyítását
feladatnak
adjuk
fel. (Természetesen,
fel
kell
tenni,
hogy
g(x) 'l'" O.) Feladat: Vezessük le ezzel a szabállyal tg x és cotg x 414. oldalon közölt derviáltját sin x és cos x derivált jából. Bizonyítsuk be, hogy sec x= 1/ cos x derviáltja sin x/ cos- x és cosec x= = l/sin x derivált ja - cos x/sin2 x.
Móstmár bármely függvényt hányadosaként. Például,
tudunk
f(x)=--
differenciálni,
ami felírható
l-x l+x
derivált ja rex)
= -(l +x) -(l-x) (1+x)2
420
2
két polinom
Feladat: Differenciáljuk 1
f(x) = = x-'" xm függvényt, ahol m pozitív egész szám. Az eredmény f'(x) = -mx-m-1•
(d) Inverz függvény
differenciálása.
Ha
és x = g(y)
y =f(x)
inverz függvények (pl. y = g'(y)
X2
és x =
= _1_
Yr), akkor
vagy
f'(x)
Dg(y)'
derivált jaik egymás reciprokjai : D f(x)
= 1.
Ezt a tényt könnyű igazolni, olymódon, hogy a reciprok differenciahányadosokra, ~; -ra és ~~ -re térünk vissza. De látható az inverz függvény 285. oldalon közölt geometriai értelmezéséből is, ha az érintő iránytangensét x-tengely helyett az y-tengelyre vonatkoztat juk. Példaként differenciálhatjuk az x= ym függvény ..!.
m
Y =f(x)
=
az
y:X = x" 1
'.
.' "
inverz függvényét. (Lásd a közvetlenebb eljárást is m=- esetére a 412. olda2
Ion.) Mivel x= ym függvény derivált ja my" f'(x) l
és innen, y=xm,és
y_m
= =x-1
1
mym-l
-1
= ~L m
r"
kifejezés, felírhat juk, hogy
= ~yy-m, m
helyettesítés után, f'(x)
Differenciáljuk további pédaként a trigonometrikus
=
l
2--1
m x'"
függvények
,vagy
inverzeit
(1.
284. o.); pl. j=e
arctg x, ami ugyanazt jelenti, mint x=tg y. Itt az y változó, ívmértékben
megadva, a --}-n l esetében (pl. e") S
S
bármely nS hatványnál gyorsabban tart a végtelenhez, akármekkorára is választ juk s-et, ln n pedig bármely nS hatványnál lassabban tart a végtelenhez, akármilyen kicsiny pozitív kitevő is legyen s. Képletben : nS ---+0
(I)
an
és ln n --+0 n" '
«2)
ha n-+- =. Az szám lehet.
s
kitevőnek nem kell egész számnak lennie, bármely pozitív
Az (l) bizonyítására egyszerűsítsük előbb az állítást, az arány s-edik gyökét véve; ha a gyök zérushoz tart, zérushoz kell tartania az eredeti aránynak is. Csak azt kell tehát bebizonyítani, hogy ~--+O
anI.
ha
n --
'
Legyen b = alI'; mivel feltevésünk szerint is nagyobb lesz mint l. FeIírhatjuk, hogy
oc ,
Vb = bl/2
a
nagyobb mint l, b és így
...!.
b2=I+q,
ahol q pozitív. Most a 37. oldal (6) egyenlőtlensége szerint bn/2 = (1 +q)n ~ l +nq:> nq, .úgyhogy
461
és
Mivel az utóbbi mennyiség n növekedtével a nullához tart, a bizonyítás teljes. Valóban, az (3) összefüggés mindig érvényes, akármilyen Xl' X2, ... sorozaton keresztül tart X a végtelenhez. E sorozatnak nem kell a pozitív egész számok 1,2,3, ... sorozatával egybeesnie. Ugyanis, ha n-l ~X;:§ n, akkor
Ez a megjegyzés használható a (2) bizonyítására. úgyhogy n = ff' és nS = (eS}'" akkor a (2) arány
Legyen x=ln n és e'=a,
X
alakban írható, ami a (3) speciális esete s = l-re. Fe/adatok: 1) Bizonyítsuk be, hogy ha x _00, ln ln x függvény lassabban tart a végtelenhez mint ln x. 2) x/ln x derivált ja 1/1n x-lj(ln X)2. Bizonyítsuk be, hogy ez nagy x-re "aszimpt0tikusan" ekvivalens az első taggal, 1/ln x-szel, azaz, hogy arányuk az l-hez tart, ha x_ooo
2. ln(n!) nagyságrendje
Számos alkalmazásban, pl. a valószínűségszámításban, fontos, hogy ismerjük n! rendjét vagy "aszimptotikus viselkedését" n nagy értékeire is. Itt megelégszünk n! logaritmusának, azaz a P;
= ln 2+1n 3+1n 4+ ... -í-In
kifejezésnek a tanulmányozásával. téke" n ln n; azaz, hogy
Megmutatj uk, hogy P; "aszimptotikus ér-
ln (n !) -+ 1 nlnn ' ha n462
00.
n
A bizonyítás tipikus példája a matematika egyik gyakran használt módszerének, amely egy összeg és egy integrál összehasonIításából áll. A287. ábrán a P" összeg egyenlő a teljes vonallal kiy húzott tetejű derékszögű négyszögek területének az összegével, s ez az összeg nem lehet nagyobb, mint a logaritmikus görbe alatt l és n+ l között levő +
1
J ln x dx
=
1
=(n+ 1) ln (n+ 1)-(n+ 1)+ 1 terület (l. 442. o., 1. feladat). Azon11-1 n 1\+1 . ban P" összeg ugyancsak egyenlő azoknak a derékszögű négyszögek287. ábra. In (n!) becslése nek az összterületével is, amelyeknek a tetejét szaggatott vonallal jelöltük az 'ábrán, ez a terület pedig nagyobb, mint a logaritmikus görbe alatt l és n között levő terület, amit
I ln
x dx = n ln n - n + 1
1
ad meg. Tehát n ln n -n+ 1- 1 esetére értelmetlenné? Tekintsük például a 465. oldalon közölt (4) geometriai sort, mely lxi -< 1 esetére konvergál. Ennek az egyenletnek a baloldala tökéletesen értelmezett x= 1 esetében, ugyanis az
1
1
.T+T = 2: értéket veszi fel, de az egyenlet jobb oldala igen
különösen viselkedik, ugyanis
1-1+1-1+
...
lesz. Ez a sor nem konvergál, mivel részletösszegeinek az értéke 1 és Oközött váltakozik. Ez a tény arra utal, hogy egyes függvények sorbafejtése divergens lehet még akkor is, ha maguk a függvények semmi szabálytalanságot nem mutatnak. 470
Természetesen az
l+x
függvény végtelen lesz, ha x- -l-hez.
Mivel könnyű
megmutatni, hogy ha egy hatványsor x=a>-O esetére konvergál, ebből következik, hogy -a- Iii = 1 feltételt, mivel kimutatható, hogy akármelyik ilyen x-re való konvergenciájából következnék, hogy konvergál x= i-re is. Így a sorok konvergenciájának a kérdése, amit az infinitezimális számítás korai szakában teljesen elhanyagoltak, a komplex-változós függvényt an megteremtésében egyike volt a legfontosabb tényezőknek. 3. A harmonikus sor és a zéta-függvény. Euler végtelen sora a sinusfüggvényre
Különösen érdekesek az olyan sorok, melyeknek tagjai az egész számok egyszerű kombinációi. Tekintsük példaként az (16)
"harmonikus sort", amely csak a páros tagok előjelében különbözik ln 2 sorától. Az a kérdés, hogy ez a sor konvergál-e, azonos azzal, hogy vajon az sorozat, ahol (17) 471
véges határértékhez tart-e. Bár a (16) sor tagjai annál jobban megközelítik a O-t, minél messzebb haladunk a sorban, könnyű belátni, hogy a sor mégsem konvergál. Ugyanis elég sok tagot véve, sn bármely előre megadott pozitív számnál nagyobb lesz, úgyhogy Sn minden határon túl növekszik és (16) sor "divergál a végtelenhez". Hogy ezt belássuk, figyeljük meg, hogy l
S2
= 1+2'
(18)
Így például az S2m részletösszeg meghaladja lOD-at, mihelyt m~200. Noha a harmonikus sor nem konvergál, az (19)
l
l
l
l
2
3
4
n"
1+-+-+-+ ...+-+ ... s s s
sor konvergál minden l-nél nagyobb s esetén, és minden s »: l esetben az ún. zétafüggvényt definiálja: (20)
l l l ({s)=hm. (1+-+-+-+ s s s 2
3
4
...+-l) , n"
ha
n-+=,
mint az s változó függvényét. A zéta-függvény és a prímszámok között van egy igen fontos összefüggés, amit geometriai sorokra vonatkozó ismereteink alapján levezethetünk. Legyen p bármely prímszám,p=2, 3, 5,7, ... ; akkor s~l esetén l 0