135 51 1004KB
Finnish Pages 159 Year 2013
Analyysi I Jyrki Lahtonen
t
PSfrag repla ements
(∀ x ∈ [a, b])(∀ ε > 0)(∃ δ > 0)(y ∈ Y (x; δ) ∩ [a, b] ⇒ |f (y) − f (x)| < ε) ⇒ (∃ M )(∀ x ∈ [a, b])(f (x) ≤ M )
Turun yliopisto, elokuu 2013
Sisältö 1 Johdanto
4
1.1 Matemaattisesta logiikasta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2 Joukoista ja luvuista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.3 Tärkeitä merkintöjä ja tuloksia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.4 Funktio ja joukon mahtavuus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
1.5 Reaalifunktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
1.6 Alkeisfunktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
1.6.1
Eksponentti- ja logaritmifunktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
1.6.2
Trigonometrisistä funktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
1.6.3
Arkusfunktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
1.6.4
Hyperbeli ja areafunktioista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
2 Lukujono ja sen raja-arvo
58
2.1 Rajoitetut lukujoukot, supremum ja inmum . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
2.2 Lukujonon raja-arvo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
2.3 Raja-arvojen laskusääntöjä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
2.4 Monotoninen lukujono ja Neperin luku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
2.5 Äärettömistä raja-arvoista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
3 Funktion raja-arvo ja jatkuvuus
79
3.1 Raja-arvon määritelmä ja perusominaisuuksia . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
3.2 Raja-arvokäsitteen yleistyksiä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
3.3 Jatkuvuuden määritelmä ja perusominaisuuksia . . . . . . . . . . . . . . . . . . . . . . . . . .
88
3.4 Yhdistetyn funktion ja käänteisfunktion jatkuvuus . . . . . . . . . . . . . . . . . . . . . . . .
89
3.5 Suljetulla välillä jatkuvan funktion ominaisuuksia . . . . . . . . . . . . . . . . . . . . . . . . .
91
3.6 Kahden muuttujan funktion raja-arvo ja jatkuvuus . . . . . . . . . . . . . . . . . . . . . . . .
96
4 Dierentiaalilaskentaa
100
4.1 Derivaatan määritelmä ja perusominaisuuksia . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 2
4.2 Rationaalifunktion derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 4.3 Trigonometristen funktioiden derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 4.4 Yhdistetyn funktion derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.5 Käänteisfunktion derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 4.6 Logaritmi ja eksponenttifunktion derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.7 Logaritminen derivointi ja korkeammat derivaatat . . . . . . . . . . . . . . . . . . . . . . . . 115 4.8 Kaksi likimääräismenetelmää yhtälön ratkaisemiseksi . . . . . . . . . . . . . . . . . . . . . . . 118 4.8.1
Peräkkäisten sijoitusten menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.8.2
Newtonin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.9 Dierentiaalilaskennan väliarvolause ja sen sovelluksia . . . . . . . . . . . . . . . . . . . . . . 121 4.9.1
l'Hospitalin sääntö . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.9.2
Derivaatta funktion muutoksen arvioinnissa . . . . . . . . . . . . . . . . . . . . . . . . 127
4.10 Osittaisderivaatoista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5 Tasokäyrät ja dierentiaalilaskenta
134
5.1 Funktion ääriarvoista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 5.2 Funktion kuvaajan tutkiminen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 5.3 Parametrimuotoisen funktion derivointi ja parametrimuodossa annettu käyrä . . . . . . . . . 140 5.4 Napakoordinaattien avulla määritelty käyrä . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 5.5 Implisiittisesti määritellyn funktion derivointi . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 5.6 Korkeammat derivaatat ja parametrimuodossa tai implisiittisesti annettu käyrä . . . . . . . . 155 5.7 Aika käyrän parametrina. Hetkellinen nopeus ja kiihtyvyys . . . . . . . . . . . . . . . . . . . 158
3
Luku 1
Johdanto Tässä luvussa kertaamme matematiikassa käytettävää logiikkaa, päättelysääntöjä ja siinä käyttämiämme merkintöjä. Edelleen kertaamme joukko-opin peruskäsitteitä, ja tutustumme joukon mahtavuuden käsitteeseen. Käymme myös läpi tällä kurssilla esiintyviä lukujoukkoja ja niiden ominaisuuksia. Luvun loppuosassa käymme hieman tarkemmin läpi niin sanotut alkeisfunktiot. Ehkä hyperbelifunktioita lukuun ottamatta nämä ovat tuttuja koulukursseilta. Johdamme suuren joukon trigonometrisiä funktioita koskevia kaavoja ja identiteettejä, koska ne tarjoavat esimerkkiaineistoa ja materiaalia jatkoa varten
1.1 Matemaattisesta logiikasta Logiikassa peruskysymys on onko jokin lause tosi vai ei. Niin sanotuilla propositioilla on selkeä totuusarvo. Esimerkiksi propositio `1 > 0' on selvästi tosi (kunhan merkinnät 1, > ja 0 tulkitaan tavalliseen tapaan), ja propositio `2 + 2 = 5' on puolestaan epätosi. Propositioista voidaan muodostaa uusia yhdistämällä niitä toisiinsa. Useimmin esiintyvät tavat muodostaa uusia väitteitä ovat `ja', `tai', `ei', `konditionaali (jos niin)' sekä 'bikonditionaali'. Näiden tulkinta on seuraava. • Propositio `p ja q ' on tosi vain jos propositiot p ja q ovat molemmat tosia, ja epätosi muutoin. Tästä
käytetään usein myös merkintää p ∧ q .
• Propositio `p tai q ' on tosi jos ainakin toinen (mahdollisesti molemmat!) propositioista p, q on tosi, ja
epätosi jos kumpikaan propositoista p,q ei ole tosi. Tästä käytetään myös merkintää p ∨ q .
• Propositio ¬p (=`ei-p') on tosi, jos propositio p on epätosi, ja päinvastoin. • Kahden proposition konditionaalina tuotettu uusi propositio 'jos p, niin q ' (merkitään myös p → q ) on
epätosi, jos q on epätosi vaikka p onkin tosi, ja tosi muulloin.
• Bikonditionaalina tuotettu uusi propositio p ↔ q on tosi, jos molemmat konditionaalit p → q ja q → p
ovat tosia. Näin käy tarkalleen silloin, kun propositioilla p ja q on sama totuusarvo.
4
Esimerkki 1.1.
Propositiot `1 > 0 tai 2 + 2 = 5' ja `1 > 0 tai 2 + 2 = 4' ovat molemmat tosia, mutta
propositio `1 > 0 ja 2 + 2 = 5' on epätosi. Propositio `1 > 0 ja ¬(2 + 2 = 5)' on puolestaan tosi.
Esimerkki 1.2.
Propositiot 'jos 1 < 0, niin 2 + 2 = 4' ja 'jos 1 < 0, niin 3 < 0' ovat molemmat tosia, koska
proposition 1 < 0 on epätosi. Sitä vastoin 'jos 2 + 2 = 4, niin 1 < 0' on epätosi, koska 2 + 2 = 4 on tosi, mutta 1 < 0 epätosi. Jos f (p, q) ja g(p, q) ovat propositioista p ja q kombinoimalla saatuja mutkikkaampia lausekkeita joilla on sama totuusarvo kaikilla `alkeispropositioiden' p ja q totuusarvojen kombinaatioilla, niin sanomme, että f ja g ovat loogisesti yhtäpitäviä. Käytämme tästä tilanteesta merkintää f (p, q) ≡ g(p, q).
Esimerkiksi propositiolla p → q on aina sama totuusarvo kuin propositiolla 'ei-p tai q ', eli symbolein
kirjoitettuna
(p → q) ≡ ((¬p) ∨ q).
Tämä vastaa syyseuraussuhdetta (jos niin) sikäli hyvin, että syy ei voi olla tosi ellei seurauskin ole, mutta päinvastoin kuin luonnollisen kielen syy-seuraussuhteessa, tässä ei edellytetä mitään `reaalimaailman' yhteyttä väitteiden p ja q välillä. Joskus konditionaalia kutsutaan myös implikaatioksi ja bikonditionaalia ekvivalenssiksi. Varaamme (ainakin tässä pykälässä) nämä termit hieman mutkikkaampaan tilanteeseen, jota käsittelemme seuraavaksi. Mutkikkaammissa lauseissa esiintyy muuttujia, ja tällaisen lauseen totuusarvo riippuu yleensä siinä esiintyvien muuttujien arvojen valinnasta, eli sen sanotaan olevan avoin. Tällaisia lauseita sanotaan predikaateiksi.
Esimerkki 1.3.
• Jos merkitään p(x):llä muuttujasta x riippuvaa predikaattia x2 − 2x > 0, niin p(1)
on epätosi, mutta p(−1) on tosi.
• Merkitköön q(x, y) predikaattia `x + y on parillinen kokonaisluku' . Tällöin q(1, 3) on tosi mutta q(1, 2)
epätosi.
Tällaisen lauseen totuusarvo jää silloin hämäräksi, jos emme tiedä muuttujan arvoa. Avoin lause voidaan sulkea yksinkertaisesti antamalla muuttujalla jokin kiinteä arvo, jolloin se samalla saa totuusarvon. Useammin ollaan kiinnostuneita siitä, pitääkö predikaatti paikkansa kaikilla mahdollisilla muuttujan arvoilla, tai pitääkö se ylipäätään paikkaansa millään muuttujan arvolla. Näitä tilanteita varten on sovittu seuraavat lyhennysmerkinnät. (i) Olemassaolokvanttori ∃. Jos p(x) on jokin predikaatti, niin (∃ x)p(x) tarkoittaa, että on olemassa (ainakin yksi) sellainen x, että p(x) on tosi.
5
(ii) Kaikkikvanttori ∀. Jos p(x) on jokin väite, niin (∀ x)p(x) tarkoittaa, että p(x) on tosi valittiinpa x miten tahansa (ts. kaikilla x:n arvoilla).
Usein näkee käytettävän myös hieman erilaisia merkintöjä ∃ x : p(x) ja ∀ x : p(x). Sulkujen käyttäminen
selkeyttää merkintää etenkin silloin, kun muuttujia on useita tai predikaatin (yllä p(x)) sisäinen rakenne on hyvin mutkikas. Olemassaolokvanttoria (eli eksistenssikvanttoria) tai kaikkikvanttoria (eli universaalikvanttoria) käytettäessä muuttujan (yllä x) arvot yleensä rajataan tulemaan jostakin tietystä joukosta.
Esimerkki 1.4.
Lause (∀x ∈ R)(x > 0) luetaan: `kaikille reaaliluvuille x on voimassa epäyhtälö x > 0'.
Tämä lause on epätosi, sillä reaaliluvulle x = −1 epäyhtälö x > 0 ei pidä paikkaansa. Lause (∃x ∈ R)(x > 0)
luetaan: `on olemassa sellainen reaaliluku x, että x > 0'. Tämä on tosi, sillä epäyhtälö x > 0 toteutuu esimerkiksi silloin, kun x = 1.
Kun käytämme kvanttoria, muodostamme mielessämme useita lauseita, yhden kutakin muuttujan x mahdollista arvoa kohti. Tästä syystä käytetyn muuttujasymbolin nimellä ei ole väliä, ja sen vaihtaminen toiseksi ei muuta muodostetun väitteen sisältöä. Niinpä esimerkiksi lauseet ∀ x ∈ Z : x < x + 1 ja ∀ y ∈ Z : y < y + 1
molemmat väittävät samaa: jokainen kokonaisluku on pienempi kuin luku, joka saadaan lisäämällä siihen
ykkönen. Tämä lause on selvästi tosi. Kaikkikvanttorin avulla ilmaistaan siis usean (mahdollisesti äärettömän monen) proposition samanaikaista todenmukaisuutta (eräänlainen super-`ja') ja olemassaolokvanttorin avulla ilmaistaan vastaavasti super`tai'. Samalla avoin lause muuttuu suljetuksi eli se saa selkeän yksikäsitteisen totuusarvon.
Esimerkki 1.5.
Lause ∃ x ∈ Z : x4 − x3 + x2 − 1 = 0 on tosi, sillä kyseinen yhtälö pitää paikkaansa
esimerkiksi silloin, kun x = 1. Huomaa, että tässä yhteydessä emme ole kiinnostuneita löytämään kyseisen yhtälön kaikkia mahdollisia ratkaisuja. Lauseen totuusarvohan selvisi, kun löysimme yhden.
Esimerkki 1.6.
Lause ∀ x ∈ Z : x4 − x3 + x2 − 1 = 0 on epätosi, sillä kyseinen yhtälö ei pidä paikkaansa
esimerkiksi silloin, kun x = 0.
Jos merkitään r:llä propositiota `p ja q ', niin sen negaatio ¬r on yhtäpitävä proposition `¬p tai ¬q ' kanssa,
sillä molemmat näistä ovat tosia, jos ainakin toinen propositioista p, q on epätosi, ja epätosia muutoin. Sama asia ilmaistaan merkinnöillä ¬(p ∧ q) ≡ (¬p) ∨ (¬q).
Vastaavasti ¬(p ∨ q) ≡ (¬p) ∧ (¬q).
Koska kvanttoreilla ilmaistaan useiden yksittäisten propositioiden ja/tai yhdistelmää, niin edellinen esimerkki yleistyy havainnoiksi: ¬(∀ x : p(x)) ≡ ∃ x : ¬p(x),
6
ja ¬(∃ x : p(x)) ≡ ∀ x : ¬p(x).
Matemaattisessa päättelyssä tämä tulee usein vastaan seuraavalla tavalla. Jos halutaan kumota väite ∀ x : p(x), riittää esittää yksi esimerkki (niin sanottu vastaesimerkki) muuttujan x arvosta, jolle p(x) on
epätosi. Samoin yksi esimerkki sopivasta muuttujan x arvosta riittää osoittamaan väitteen ∃ x : p(x) todeksi.
Jos haluaa todistaa kaikkikvanttorilla kuvatun väitteen todeksi, tai olemassaolokvanttorilla kuvaillun väitteen epätodeksi, joutuu näkemään enemmän vaivaa. Erityisesti on huomattava, ettei siitä urakasta selviä vain esimerkkitilannetta tarkastelemalla.
Esimerkki 1.7.
Väite ∃ x ∈ Z : x > x + 1 on epätosi, sillä kyseinen epäyhtälö ei toteudu millään muuttujan
x kokonaislukuarvolla.
Esimerkki 1.8.
Perustellaan, miksi väite ∀x ∈ Z : ∃y ∈ Z : y > x
on tosi.
Ratkaisu. Tällainen useita kvanttoreita sisältävä lause puretaan alkaen ensin mainitusta (= uloimmasta). Niinpä tässä muodostetaan kutakin muuttujan x kokonaislukuarvoa kohti väite p(x) ∃ y ∈ Z : y > x.
Huomataan, että epäyhtälö y > x pitää paikkansa esimerkiksi silloin, kun y = x + 1. Lisäksi tämä y on kokonaisluku. Siis p(0) on tosi, koska valitsemalla y = 1 ehto y > 0 on tosi. Samoin p(1) nähdään todeksi valinnalla y = 2 jne. Näin ollen väite p(x) on tosi riippumatta siitä, mikä arvo muuttujalla x annetaan. Kvanttoriyhdistelmän avulla määritelty väite on siis tosi. Alkuperäinen väite voidaan suomen kielellä luontevasti lukea: `Jokaista kokonaislukua x kohti löytyy sellainen kokonaisluku y , että y > x.' Huomaa, että tässä kvanttorien järjestyksen muuttamisella on dramaattinen vaikutus lauseen merkitykseen ja todenmukaisuuteen. Suljettu lause ∃ y ∈ Z : ∀ x ∈ Z : y > x sanoisi suomen kielellä: `On olemassa sellainen kokonaisluku y , että kaikilla kokonaisluvun x arvoilla on voimassa epäyhtälö y > x.' Tämä on epä-
tosi, sillä valittiin y kuinka suureksi luvuksi tahansa, niin epäyhtälö y > x ei toteudu kaikilla muuttujan x arvoilla. Esimerkiksi silloin kun x = y + 1, ei vaadittu epäyhtälö ole voimassa. Predikaattien välillä konditionaalin korvaa implikaatio ⇒ ja bikonditionaalin ekvivalenssi ⇔. Tässä vaa-
ditaan, että propositioiden tason suhde on tosi kaikilla muuttujan arvojen valinnoilla:
(i) p(x) ⇒ q(x) tarkoittaa sitä, että kaikilla muuttujan x arvoilla x = a propositioiden välinen konditionaali p(a) → q(a) on tosi.
7
(ii) p(x) ⇔ q(x) tarkoittaa sitä, että molemmat predikaattien väliset implikaatiot p(x) ⇒ q(x) ja q(x) ⇒ p(x) ovat tosia.
Esimerkki 1.9.
Jos p(x) on predikaatti x = 2, ja q(x) predikaatti x + 2 = 4, niin implikaatio 'jos x = 2,
niin x + 2 = 4' (eli p(x) ⇒ q(x)) on tunnetusti tosi. Käänteinen implikaatio 'jos x + 2 = 4, niin x = 2' on sekin tosi, eli p(x) ⇔ q(x).
Esimerkki 1.10.
Jos p(x) on predikaatti x2 = 4 ja q(x) predikaatti x = 2, niin implikaatio p(x) ⇒ q(x) on
epätosi, koska p(−2) on tosi, mutta q(−2) onkin epätosi, ja siis konditionaali p(−2) → q(−2) epätosi. Tässä x = −2 on ainoa pulmallinen muuttujan arvo, mutta se riittää särkemään implikaation.
Konditionaali (ja etenkin sen vastine implikaatio) on keskeinen työkalu matemaattista teoriaa rakennettaessa. Yksinkertaisin tapa käyttää konditionaalia on tilanne, jossa tiedämme seuraavat kaksi seikkaa: 1) propositio p on tosi, 2) propositio p → q on tosi. Näistä kahdesta yhdessä voimme vetää johtopäätöksen
`propositio q on tosi'. Konditionaalin voima perustuu siihen, että propositioista voidaan muodostaa pitkiä
ketjuja. Jos esimerkiksi tiedämme, että propositiot 1) p, 2) p → q , ja 3) q → r ovat tosia, niin voimme pää-
tellä, ensin yhdistämällä faktat 1 ja 2, että q on tosi, ja sitten yhdistämällä tämä tulos ja fakta 3 voimme lopulta päätellä, että r on tosi. Vastaavasti predikaattien välisistä implikaatioista voidaan muodostaa ketjuja samaan tapaan. Lisäksi voimme käyttää predikaattien välistä implikaatiota yksittäistapauksen käsittelyssä. Jos esimerkiksi tiedämme tosiksi proposition p(1) ja implikaation p(x) ⇒ q(x), voimme päätellä, että propositio q(1) on tosi. Tämä johtuu siitä, että mainitun implikaation totuudesta seuraa erityisesti se, että konditionaali p(1) → q(1) on tosi.
Matemaattinen tulos formuloidaan yleensä predikaattien välisenä implikaationa. Käytössä on useita vakiintuneita suomen kielen fraaseja, ja niitä esitellään kurssin kuluessa. Esimerkiksi implikaatio p(x) ⇒ q(x)
luetaan usein `q(x) aina, kun p(x)'. Konditionaalin p(a) → q(a) totuusarvohan on kysymyksenä mielenkiin-
toinen vain silloin, kun p(a) on tosi, ja tämä puhetapa korostaa tätä seikkaa. Pientä sekaannusta voi ensi
alkuun aiheuttaa se, ettei tässä implikaation automaattisesti mukanaan tuomaa universaalikvanttoria yleensä mainita, koska pyritään mahdollisimman lyhyeen ilmaisuun. Implikaatiota ja konditionaalia käytettäessä suunta on tärkeä. Jos tiedämme tosiksi propositiot: 1) q ja 2) p → q , emme voi päätellä yhtään mitään. Bikonditionaali sen sijaan salli meidän tehdä päätelmän molempiin
suuntiin. Tästä syystä bikonditionaali p ↔ q luetaankin usein suomeksi: `p on tosi silloin ja vain silloin kun
q on tosi'.
Matemaattisen teoreeman (lauseen) todistaminen merkitsee pelkistettynä implikaation `oletus' ⇒ `väi-
te' todeksi osoittamista. Seuraavassa tarkastellaan paria menetelmää todistuksen oletus (o) ⇒ väite (v )
suorittamiseksi.
(i) Suora todistus. Pyritään löytämään `helposti todistettavissa' oleva osaimplikaatioiden ketju: o ⇒ v1 , v1 ⇒ v2 , . . . , vn−1 ⇒ vn , vn ⇒ v . Nämä antavat yhdistettynä tuloksen o ⇒ v .
8
(ii) Epäsuora todistus. Implikaation o ⇒ v sijasta todistetaan oikeaksi sen kanssa loogisesti ekvivalentti
kontrapositio ¬v ⇒ ¬o. Tämä tapahtuu muodostamalla vastaoletus ¬v ja johtamalla siitä tulos, joka on ristiriidassa oletuksen o kanssa.
(iii) Todistus ristiriitaan perustuen. Etsitään sellainen propositio q , että propositio (¬v ⇒ q) ja (¬q) on tosi.
Tässä siis vastaoletuksesta ¬v seuraa jokin propositio q ja myös sen negaatio ¬q , mikä on mahdollista
vain, jos vastaoletus oli epätosi. Tämä on epäsuoran todistuksen yleistys siinä mielessä, että epäsuorassa
todistuksessa aina q = o. Suora todistus on logiikaltaan yksinkertaisin.
Esimerkki 1.11.
Oletetaan, että n on pariton kokonaisluku. Silloin myös n2 on pariton kokonaisluku.
Todistus. Olkoon n jokin pariton kokonaisluku. Tällöin se voidaan kirjoittaa muodossa n = 2k + 1, missä k on niin ikään kokonaisluku. Binomin neliön kaavasta seuraa, että n2 = (2k + 1)2 = 4k 2 + 4k + 1 = 2(2k 2 + 2k) + 1.
Olemme kirjoittaneet luvun n2 muodossa n2 = 2m + 1, missä m = 2k 2 + 2k on kokonaisluku. Siis n2 on sekin pariton. Edellisen esimerkin tulos voitaisiin esittää muodossa (∀n ∈ Z)(p(n) → q(n)), kun on määritelty, että p(n)
tarkoittaa väitettä 'n on pariton' ja q(n) väitetttä 'n2 on pariton'. Käytetty sanallinen ilmaisu on tiiviimpi ja selkeämpi. Seuraavaksi yksinkertainen esimerkki epäsuorasta todistuksesta.
Esimerkki 1.12. Todistus.
Olkoon n ∈ Z. Jos n2 on parillinen, niin silloin myös n on parillinen.
Käytetään kontrapositiota. Tehdään vastaoletus, että n ei olisikaan parillinen. Tällöin se on
pariton. Esimerkin 1.11 nojalla myös luku n2 on tällöin pariton. Tämä on oletuksen negaatio. Esimerkkki ristiriitaan perustuvasta todistuksesta on seuraava tulos.
Esimerkki 1.13.
Ei ole olemassa sellaista rationaalilukua q = m/n, m, n ∈ Z, n 6= 0, että q 2 = 2.
Todistus. Teemme
vastaoletuksen, että olisi sittenkin olemassa yhtälön q 2 = 2 toteuttava rationaaliluku
q = m/n. Voimme olettaa, että tämä murtoluku on supistetussa muodossa. Erityisesti enintään toinen
luvuista m, n on parillinen. Koska 2 = q 2 = m2 /n2 näemme, että m2 = 2n2 on parillinen kokonaisluku. Edellisen tuloksen nojalla m itse on parillinen. Voimme siis kirjoittaa luvun m muodossa m = 2r siten, että r on kokonaisluku. Sijoittamalla tämä edelliseen yhtälöön saamme 2n2 = m2 = (2r)2 = 4r2 .
9
Jakamalla tämä kahdella saadaan n2 = 2r2 . Esimerkin 1.12 nojalla nyt myös luvun n on oltava parillinen. Tämä on ristiriidassa sen tekemämme oletuksen kanssa, että enintään toinen luvuista m, n on parillinen, joten vastaoletuksen on pakko olla epätosi. Propositio- ja predikaattilogiikkaa käsitellään täsmällisesti Logiikan kurssilla. Tällä kurssilla selviää myös ns. talonpoikaisjärjellä. Pykälän tarkoituksena oli lähinnä esitellä käsitteitä, merkintöjä ja puhetapoja, jotka helpottavat siirtymistä luonnollisen kielen ja logiikan eksaktin formalismin välillä.
1.2 Joukoista ja luvuista Joukko-opin peruskäsitteitä ovat joukko ja alkio sekä niiden välinen yhteys `alkio kuuluu joukkoon'. Jos alkio a on joukon A alkio (ts. a kuuluu joukkoon A), merkitään a ∈ A. Vastakkaisen tilanteen merkintä on a ∈ / A.
Joukkoa sanotaan äärelliseksi, jos voidaan laskea sen alkioiden lukumäärä. Muussa tapauksessa joukko on ääretön.
Määritelmä 1.14.
Joukko A on sama joukko kuin B , merkitään A = B , jos A ja B muodostuvat tarkalleen
samoista alkioista. Muussa tapauksessa merkitään A 6= B .
Jos jokainen joukon A alkio kuuluu myös joukkoon B sanotaan, että A on B :n osajoukko, merkitään
A ⊆ B . Jos lisäksi on voimassa A 6= B , on A joukon B aito osajoukko, merkitään A ⊂ B .
Huomautus 1.15.
Merkinnän A ⊂ B tulkinnassa esiintyy hieman horjuvuutta. Joidenkin kirjojen tai mo-
nisteiden kirjoittajat sallivat tässä myös tapauksen A = B . Vastaavia pieniä tulkintaeroja esiintyy muita-
kin. Erilaisista taustoista tulevilla matemaatikoilla on yksinkertaisesti erilaisia preferenssejä. Kunhan tästä mahdollisuudesta on tietoinen, ei sekaannuksen vaaraa ole, sillä monisteen/kirjan alussa joko selitetään käytettävät tulkinnat horjuviksi tunnetuissa tilanteissa, tai ne ovat `luettavissa rivien välistä'. Joukko voidaan määritellä monella tavalla. Yksinkertaisin tapa on luetella joukon alkiot {}-sulkujen
sisällä. Esimerkiksi
A = {0, 1, 2}
on joukko, johon kuuluvat alkiot 0, 1 ja 2 eikä mitään muita alkioita. Jos S on jokin aikaisemmin määritelty joukko, ja p(x) jokin predikaatti, niin merkintä B = {x ∈ S | p(x)}
tarkoittaa joukkoa, jonka alkiot ovat tarkalleen ne joukon S alkiot x, joilla predikaatti p(x) on tosi. Hieman samannäköistä merkintää käytetään myös silloin, kun joukko määritellään kuvailemalla sen alkiot. Esimerkkinä tällaisesta voidaan ajatella tunnetun joukon S potenssijoukkoa P (S) P (S) = {A | A on joukon S osajoukko},
10
joka on joukko, jonka alkioina ovat joukon S kaikki osajoukot. Yksinkertaisempia esimerkkejä tulee vastaan myöhemmin. Seuraavassa määritellään kolme joukko-opillista operaatiota, joita käyttäen voidaan muodostaa tunnetuista joukoista lähtien uusia.
Määritelmä 1.16.
Jos A ja B ovat joukkoja, niin
• A:n ja B :n unioni A ∪ B = { x | x ∈ A tai x ∈ B }, • A:n ja B :n leikkaus A ∩ B = { x | x ∈ A ja x ∈ B }, • A:n ja B :n erotus A \ B = { x | x ∈ A ja x ∈ / B }.
Eräitä tilanteita varten on sopivaa ottaa käyttöön myös ns. tyhjä joukko ∅, johon ei kuulu yhtään alkio-
ta. Usein on syytä tarkastella joukkoja jonkin yhteisen laajemman joukon osajoukkoina. Tällaista joukkoa sanotaan perusjoukoksi ja sen merkkinä käytetään kirjainta Ω. Tällöin määritellään joukon A komplementti Ac = Ω \ A.
Tärkeimmillä lukujoukoilla on vakiintuneet merkintänsä: • N = {0, 1, 2, . . . } = luonnollisten lukujen joukko, • Z = {0, ±1, ±2, . . . } = kokonaislukujen joukko, • Q = {a/b | a, b ∈ Z, b 6= 0 } = rationaalilukujen joukko, • R = reaalilukujen joukko, • C = { a + bi | a, b ∈ R, i =
√ −1 } = kompleksilukujen joukko.
Tällöin on voimassa: N ⊂ Z ⊂ Q ⊂ R ⊂ C. Joukossa N voidaan määritellä tavalliset yhteen ja
kertolaskut, joiden suhteen N on suljettu (a, b ∈ N ⇒ a + b, ab ∈ N). Jotta vähennyslasku voitaisiin aina
suorittaa, täytyy joukkoa N laajentaa joukoksi Z. Jakolaskun mahdollistamiseksi on edelleen siirryttävä
isompaan joukkoon Q.
Esimerkki 1.17.
Seuraavat implikaatiot seuraavat siitä, että luvuilla laskutoimitus on määritelty siten,
että laskettaessa kahden annetun luvun summa tai tulo saadaan aina sama lopputulos. Olkoot siis a, b ja c mielivaltaisia lukuja. Tällöin a = b ⇒ a + c = b + c, a = b ⇒ ac = bc.
Esimerkki 1.18.
("kun yhtäsuuriin lisätään yhtäsuuret, saadaan tulokseksi yhtäsuuret") ("kun yhtäsuuret kerrotaan yhtäsuurilla, saadaan tulokseksi yhtäsuuret")
Vahvennetaan edellisen esimerkin tuloksia todistamalla, että kaikille luvuille x, y, z on
voimassa x = y ⇔ x + z = y + z.
Jos lisäksi z 6= 0, niin myös x = y ⇔ xz = yz.
11
Ratkaisu. Tarkastellaan ensin yhteenlaskua. Meillä on kaksi predikaattia. Niistä p(x, y) sanoo, että x = y, ja q(x, y, z), että x+ z = y + z . Kiinnitetään lukujen x, y, z arvot. Soveltamalla edellisen esimerkin implikaatiota
tilanteeseen a = x, b = y , c = z saamme toden konditionaalin p(x, y) → q(x, y, z). Koska voimme kirjoittaa
x = (x + z) + (−z) ja y = (y + z) + (−z), saamme soveltamalla edellisen esimerkin implikaatiota tilanteeseen a = x + z , b = y + z , c = −z myös toisen suuntaan menevän konditionaalin q(x, y, z) → p(x, y). Siis kaikille
luvuille x, y, z bikonditionaali p(x, y) ↔ q(x, y, z) on tosi, joten väitetty predikaattien ekvivalenssi pitää
paikkansa.
Jatkossa emme erikseen tee mutkaa propositioiden kautta, vaan edellisen kappaleen mukaisesti yksinkertaisesti sovellamme tunnettuja implikaatioita sijoittamalla niissä esiintyvien muuttujien paikalle kulloinkin tarvittavat luvut ja/tai muuttujat. Tulon kohdalla toimitaan samoin. Nyt p sanoo, että x = y ja predikaatti q sanoo, että xz = yz . Implikaatio p ⇒ q seuraa edellisen esimerkin vastineestaan asettamalla a = x, b = y , c = z . Koska oletamme, että z 6= 0,
niin on olemassa luku 1/z . Sitten voimme kirjoittaa x = (xz) · (1/z) ja y = (yz) · (1/z). Soveltamalla
esimerkkiä tilanteeseen a = xz , b = yz , c = 1/z saamme sitten toiseen suuntaan menevän implikaation q ⇒ p.
Näillä yksinkertaisilla päättelysäännöillä voidaan ratkaista muun muassa kaikki ensimmäisen asteen yhtälöt.
Esimerkki 1.19.
Tiili painaa kilon ja puoli tiiltä. Paljonko tiili painaa?
Ratkaisu. Merkitään tiilen painoa kiloina luvulla t. Tällöin tehtävänämme on ratkaista yhtälö t t=1+ . 2
Ratkaisu etenee ekvivalenttien väitteiden ketjuna seuraavasti t=1+ ⇔ t−
(Esimerkki 1.18, summa: x = t, y = 1, z = −t/2)
t t t =1+ − 2 2 2
t =1 2 ⇔ t=2 ⇔
t 2
(sievennetään) (Esimerkki 1.18, tulo: x = t/2, y = 1, z = 2)
Siis luku t toteuttaa yhtälön t = 1 + t/2 silloin ja vain silloin, kun t = 2, joten tiili painaa 2 kiloa. Käytetyt yhtälönmanipulointioperaatiot (kertominen puolittain luvulla, termin siirtäminen toiselle puolelle, jne.) ovat sinulle toivottavasti koulusta tuttuja. Tässä yhteydessä kiinnitämme huomion siihen, että jokainen välivaihe oli itse asiassa predikaatti, ja nämä predikaatit ovat keskenään ekvivalentteja. Joidenkin yhtälöiden käsittely edellyttää myös sellaisia temppuja, jotka eivät samalla tavalla säilytä ekvivalenssia, mutta johtavat toki implikaatioiden ketjuun. Jos emme pääse kulkemaan implikaatioiden ketjua molempiin suuntiin, on ratkaisun loppuvaiheessa oltava tarkkana. 12
Esimerkki 1.20.
Ratkaistaan yhtälö x+2=
Ratkaisu.
√ x + 4.
Tulon `yksikäsitteisyys' antaa meille implikaation x = y ⇒ x2 = y 2 . Tämä ei kuitenkaan ole
ekvivalenssi, koska käänteinen implikaatio x2 = y 2 ⇒ x = y on epätosi. Esimerkiksi silloin, kun x = 1 ja
y = −1. Voimme kuitenkin ketjuttaa samaan suuntaan eteneviä implikaatioita, ja päätellä tällä kertaa √ x+2= x+4 (sovelletaan sääntöä x = y ⇒ x2 = y 2 ) ⇒ (x + 2)2 = x + 4
(sievennetään binomikaavan avulla, todistetaan myöhemmin) (vähennetään x + 4 molemmilta puolilta)
⇔ x2 + 4x + 4 = x + 4 ⇔ x2 + 3x = 0 ⇔ x(x + 3) = 0
(sovelletaan lukujen toteuttamaa sääntöä xy = 0 ⇔ x = 0 tai y = 0)
⇔ x = 0 tai x + 3 = 0 ⇔ x = 0 tai x = −3.
Saimme aikaiseksi yhteen suuntaan kulkevan implikaatioiden ketjun, josta yhdistämällä saamme p ⇒ q , √ missä p(x) väittää `x + 2 = x + 4', ja q(x) puolestaan `x = 0 tai x = −3'. Tehtävä ei ole vielä ratkennut, koska emme tiedä, onko p(x) tosi silloin ja vain silloin kun q(x) on tosi. Tiedämme kuitenkin, että 'jos p niin √ q '. Toisin sanoen jos x + 2 = x + 4, niin x = 0 tai x = −3. Tämä riittääkin, sillä tiedämme, ettei muita
ratkaisuja voi olla, ja ratkaisuehdokkaat 0 ja -3 voimme tarkistaa sijoittamalla ne alkuperäiseen yhtälöön.
Sijoitus paljastaa, että x = 0 on ratkaisu, mutta x = −3 ei ole (tavalliseen tapaan emme salli reaalijuuren neliöjuurelle negatiivista arvoa).
Huomautus 1.21.
Ehkä huomasitkin, että emme yllä tarkkaan kertoneet, mitä reaaliluvut ovat! Tämä
johtuu siitä, että niiden (ja itse asiassa muidenkin lukujoukkojen) täsmällinen konstruointi tehdään vasta myöhemmillä kursseilla. Tässä vaiheessa voit ajatella, että reaaliluku tarkoittaa melkein samaa asiaa kuin desimaaliluku. Pieni ero syntyy siitä, että joitakin reaalilukuja esittää kaksi eri näköistä desimaalikehitelmää. Näistä tunnetuin esimerkki on luku 1, jolla on kaksi erilaista (päättymätöntä) desimaalikehitelmää 1 = 1,000 . . . = 0,999 . . . .
Analyysissa lukujen laskutoimitusten lisäksi keskeinen työkalu on järjestysrelaatio `pienempi tai yhtä suuri kuin', ≤, ja sen ilmeinen muunnelma `pienempi kuin', .
Analyysissa tarkastellaan usein R:n osajoukkoina reaalilukuvälejä:
13
suljettu väli:
[a, b] = {x ∈ R | a ≤ x ≤ b},
avoin väli:
(a, b) = {x ∈ R | a < x < b},
puoliavoin väli:
[a, b) = {x ∈ R | a ≤ x < b}, (a, b] = {x ∈ R | a < x ≤ b}.
Myös seuraavia joukkoja sanotaan väleiksi:
(a, ∞) = { x ∈ R | x > a },
[a, ∞) = { x ∈ R | x ≥ a },
(−∞, a) = { x ∈ R | x < a },
(−∞, a] = { x ∈ R | x ≤ a },
(−∞, ∞) = R.
Määritelmä 1.22.
Reaaliluvun x itseisarvo on ( |x| =
x,
jos x ≥ 0,
−x,
jos x < 0.
Geometrisesti |x| voidaan tulkita lukusuoralla pisteen x etäisyydeksi pisteestä 0 ja edelleen |x−y| pisteiden
x ja y väliseksi etäisyydeksi. Kompleksiluvun itseisarvon |z| käsite yhtyy reaaliluvun itseisarvoon, jos z ∈ R.
Seuraavassa esitetään itseisarvon eräitä perusominaisuuksia: |x| ≥ 0, ∀x ∈ R;
|x| = 0 ⇔ x = 0,
|xy| = |x||y|, ∀x, y ∈ R, x |x| = y |y| , ∀x, y ∈ R, y 6= 0, −|x| ≤ x ≤ |x|, ∀x ∈ R.
Jos lisäksi määritellään reaaliluvun x (etu)merkki jos x > 0, 1, sgn (x) = 0, jos x = 0, −1, jos x < 0.
saadaan yhtälöt: |x| = sgn (x) · x ja x = sgn (x) · |x|.
Tässä yhteydessä palautamme mieleen seuraavat seikat: jokainen reaaliluku on joko nolla, positiivinen
(> 0) tai negatiivinen (< 0), ja lisäksi kahden positiivisen luvun summa ja tulo ovat molemmat positii-
visia, eli `positiivisten reaalilukujen joukko on suljettu yhteenlaskun ja kertolaskun suhteen'. Positiivisten reaalilukujen joukosta käytetään merkintää R+ , ja positiivisten kokonaislukujen joukosta merkintää Z+ . Einegatiivisten reaalilukujen joukosta käytämme merkintää R≥0 = R+ ∪ {0}. Nämä voidaan määritellä ja
perustella tarkasti vasta reaalilukujen konstruoinnin yhteydessä. Epäyhtälö x > y on ekvivalentti väitteen 14
'x − y on positiivinen' kanssa, ja lisäksi 'x on positiivinen' on ekvivalentti väitteen '−x on negatiivinen'
kanssa. Tällä kurssilla tyydytään siihen mielikuvaan, joka koulukursseilla on reaalilukujen suuruusjärjestyksestä kaikille muodostunut. Seuraavassa luetellaan useimmin käytettävät ominaisuudet. Ottamalla huomioon Esimerkin 1.18 säännöt nähdään, että näiden sellaiset vastineet, joissa < korvataan ≤-relaatiolla ovat myös
valideja sääntöjä.
Lemma 1.23.
Oletetaan, että x, y, z ja r ovat reaalilukuja, z 6= 0, r > 0. Tällöin
(i) x < y ⇔ x + z < y + z , (ii) jos z > 0, niin x < y ⇔ xz < yz , (iii) jos z < 0, niin x < y ⇔ xz > yz , (iv) |x| < r ⇔ −r < x < r, (v) |x| > r ⇔ x < −r tai x > r, (vi) |x| < |y| ⇔ x2 < y 2 , (vii) xy > 0 ⇔ x ja y samanmerkkisiä. (viii) jos x < y ja y < z , niin tällöin x < z (järjestysrelaation transitiivisuus). (ix) kolmesta vaihtoehdosta x > y , x < y , tai x = y on aina yksi ja vain yksi tosi. Näiden avulla voidaan ratkaista ekvivalenttien välivaiheiden ketjuna useita epäyhtälöitä, esimerkiksi kaikki ensimmäisen ja toisen asteen yhden muuttujan epäyhtälöt. Viimeinen kohta esiintyy analyysissä usein seuraavassa muodossa. Tiedämme (tai olemme todistaneet), että epäyhtälöt x ≥ y ja x ≤ y ovat molemmat
tosia. Tällöin päättelemme, että x = y . Nimittäin ensimmäisen epäyhtälön seurauksena voimme sulkea pois vaihtoehdon x < y , ja toisen seurauksena vaihtoehdon x > y . Jäljelle jää vain vaihtoehto x = y .
Esimerkki 1.24.
Millä reaaliluvun x arvoilla epäyhtälö 2x + 3 < 5x − 1 toteutuu?
Ratkaisu. 2x + 3 < 5x − 1
(vähennetään 5x + 3 molemmilta puolilta, eli 'x:t vasemmalle', Lemma 1.23 (i)) (sievennetään)
⇔ 2x − 5x < −1 − 3 ⇔
(kerrotaan luvulla −1/3 < 0, Lemma 1.23 (iii))
− 3x < −4
⇔ x > 4/3.
Esimerkki 1.25.
Ratkaistaan epäyhtälö 2x + 5 1 < . x+4 x+2
15
Y
y
z = x + iy
r = |z|
PSfrag repla ements
x
X
Kuva 1.1: Kompleksiluku tason pisteenä ja sen itseisarvo
Ratkaisu. ⇔ ⇔ ⇔ ⇔
2x + 5 1 < x+4 x+2 1 2x + 5 − 0 ja jäsenenä a−2n , jos n ≤ 0.
Huomautus 1.57.
Jos A on ääretön joukko, niin on olemassa injektio f : N → A. Tämän voit todistaa
harjoitustehtävänä: Valitse alkiot f (0), f (1), f (2), . . .. Induktiolla voit todistaa, että on mahdollista tehdä
valinnat siten, että f (n) on eri alkio kuin mikään alkioista f (0), f (1), . . . , f (n − 1). Näin ollen jokaisella äärettömällä joukolla on osajoukko, joka on numeroituvasti ääretön (tässä funktion f kuvajoukko f (N)).
Mielivaltaiselle kahdelle joukolle A ja B voidaan osoittaa, että tasan yksi seuraavasta kolmesta vaihtoehdosta toteutuu. (i) joukot ovat yhtä mahtavat, 27
(ii) A on yhtä mahtava jonkin joukon B osajoukon kanssa, mutta B ei ole yhtä mahtava minkään joukon A osajoukon kanssa (B on mahtavampi kuin A),
(iii) B on yhtä mahtava jonkin joukon A osajoukon kanssa, mutta A ei ole yhtä mahtava minkään joukon B osajoukon kanssa (A on mahtavampi kuin B ).
Täten N on mahtavuudeltaan pienin ääretön joukko. Seuraavalla ehkä hieman yllättävällä tuloksella on tärkeä periaatteellinen merkitys syvemmälle menevillä matematiikan kursseilla. Analyysin koneistoa käyttävissä laskuissa ja soveltavissa tieteissä tämä jää vähemmälle huomiolle.
Lause 1.58.
Rationaalilukujen joukko Q on numeroituva, mutta reaalilukujen joukko R on ylinumeroituva.
Todistus. 1) Nollasta eroavat rationaaliluvut voidaan esittää positiivisia kokonaislukuja käyttäen yksikäsitteisesti muodossa ±m/n, missä luvuilla m ja n ei ole yhteisiä tekijöitä. Toistamalla lopuksi Esimerkin 1.56
päättely näemme, että riittää esittää bijektio joukkojen N ja positiivisten rationaalilukujen joukon Q+ välille. Tällainen bijektio on helpointa kuvata asettamalla ensin rationaaliluvut seuraavan kaavion mukaiseen järjestykseen, missä m/n on rivillä n ja sarakkeessa m 1/1 2/1 ↓ ր 1/2 (2/2) ւ 1/3 2/3 ↓ ր 1/4 (2/4) .. .. . .
→ ւ
→ ... ւ 3/2 (4/2) ... ր ւ ր (3/3) 4/3 ... ւ ր ւ 3/4 (4/4) ... .. .. . . 3/1
4/1
ր
ja lukemalla ne siitä nuolien osoittamassa järjestyksessä: 1/1, 1/2, 2/1, 3/1, 1/3, 1/4, 2/3, 3/2, 4/1, . . . Huomaa, että suluissa olevat murtoluvut eivät ole supistetussa muodossa, joten toistojen välttämiseksi (jotta syntyisi bijektio!) ne on jätettävä pois. 2) Käytetään tietoa, että reaaliluvut ja päättymättömät desimaaliluvut vastaavat toisiaan (lähes) bijektiivisesti. (Kirjoitetaan esimerkiksi 2,7 muodossa 2,7000 . . . ja 1,2999 . . . muodossa 1,3000 . . . .) Vastaoletus. R on numeroituva, ts. on olemassa bijektio f : N → R.
Käytetään merkintää f (n) = an , jolloin jonossa a1 , a2 , a3 , . . . ovat siis mukana kaikki reaaliluvut. Olkoot näiden lukujen päättymättömät desimaalilukuesitykset a1 = A1 , a11 a12 a13 . . .
,
a2 = A2 , a21 a22 a23 . . .
,
a3 = A3 , a31 a32 a33 . . .
,
...
28
ja muodostetaan desimaaliluku x = 0, x1 x2 x3 . . . seuraavasti: ( 7, jos aii 6= 7 , (i = 1, 2, 3, . . .). xi = 3, jos aii = 7 Tällöin x ei ole mikään luvuista an (n = 1, 2, 3, . . . ), eikä siis x olekaan mukana jonossa a1 , a2 , a3 , . . . . Näin on päädytty ristiriitaan, ja vastaoletus on siten osoittautunut vääräksi.
Huomautus 1.59.
Kolme pistettä luettelon lopussa viittaa aina numeroituvasti äärettömään kokoelmaan.
Esimerkiksi merkintään A = {a1 , a2 , a3 , a4 , . . .}
sisältyy lausumaton väite, että joukko A numeroituvasti ääretön (tai mahdollisesti äärellinen, jos luettelossa jotkin alkiot toistuvat äärettömän monta kertaa). Luettelon keskellä kolmea pistettä käytetään vain tilan säästämiseksi. Merkintä A = {a1 , a2 , . . . , an }
tarkoittaa siis joukkoa, jossa on n alkiota (tai vähemmän, jos toistoja esiintyy); siis äärellinen määrä. Joissakin tilanteissa on järkevää sopia, että myös luettelon keskellä 3 pistettä kuvaa äärettömän montaa pois jätettyä alkiota, mutta nämä selvennetään aina erikseen, eikä tällaista tilannetta tule vastaan tällä kurssilla.
1.5 Reaalifunktioista Funkiota f : A → B sanotaan reaalifunktioksi, jos A , B ⊆ R. Merkintöjen yksinkertaistamiseksi jätetään
usein maalijoukko ilmoittamatta. Jopa määrittelyjoukko jätetään joskus merkitsemättä; tällöin ajatellaan laajinta mahdollista määrittelyjoukkoa ellei asiayhteydestä toisin ilmene. Funktio f (x) = √
f : (−1, 1) → R ,
voidaan lausua surjektiona muodossa f : (−1, 1) → [1, ∞) ,
Yksinkertaistettuna voi merkitä 1 , f (x) = √ 1 − x2 √ tai vielä lyhyemmin voi puhua funktiosta 1/ 1 − x2 .
Määritelmä 1.60.
1 1 − x2
f (x) = √
1 . 1 − x2
−1 < x < 1,
Joukossa A määriteltyä reaalifunktiota f sanotaan kasvavaksi joukossa A, jos x1 , x2 ∈ A , x1 < x2 ⇒ f (x1 ) ≤ f (x2 ) ,
ja aidosti kasvavaksi joukossa A, jos x1 , x2 ∈ A , x1 < x2 ⇒ f (x1 ) < f (x2 ) .
29
Vastaavasti määritellään vähenevä ja aidosti vähenevä funktio. Yhteisnimitys tällaisille funktioille on monotoninen ja aidosti monotoninen funktio.
Esimerkki 1.61.
Määritellän funktio f : R → R asettamalla f (x) = x, jos x < 1 ja f (x) = x + 1, jos x ≥ 1.
Osoita, että f on aidosti kasvava.
Ratkaisu.
Tämä tulos on sangen ilmeinen funktion f kuvaajasta katsomalla. Tarkka perustelu voidaan
esittää esimerkiksi seuraavasti. Oletetaan, että x1 ja x2 ovat ehdon x1 < x2 toteuttavia reaalilukuja. Jaetaan tarkastelu osiin sen mukaan ovatko luvut x1 ja x2 pienempiä kuin yksi vai eivät. Jos x2 < 1, niin tällöin myös x1 < 1, koska x1 < x2 . Silloin f (x1 ) = x1 < x2 = f (x2 ), eli funktio f säilytti näiden lukujen keskinäisen järjestyksen. Jos x2 ≥ 1, niin jaamme tarkastelun edelleen kahtia sen mukaan, onko x1 < 1 vai ei. Jos x1 < 1, niin
f (x1 ) = x1 < 1 < 1 + x2 = f (x2 ), ja jälleen keskinäinen järjestys säilyi. Jos myös x1 ≥ 1, niin f (x1 ) = 1 + x1
ja f (x2 ) = 1+x2 . Lisäämällä oletusepäyhtälöön x1 < x2 puolittain luku 1 näemme, että tässäkin tapauksessa f (x1 ) < f (x2 ).
Esimerkki 1.62.
Osoita, että funktio f : R+ → R+ , x 7→ x2 on kasvava, eli osoita että jos x > y ja y > 0,
niin tällöin x2 > y 2 .
Ratkaisu. Järjestysrelaation perusominaisuuksien (Lemma 1.23) nojalla y 2 = y · y < y · x < x · x = x2 .
Jos funktio f : A → B on aidosti monotoninen, niin se on samalla injektiivinen. Tällöin siis on määritelty
myös käänteisfunktio f −1 : f (A) → A.
Lause 1.63. f
−1
: f (A) → A on myös aidosti kasvava (vähenevä) joukossa f (A).
Todistus. f
−1
Jos funktio f : A → f (A) on aidosti kasvava (vähenevä) joukossa A, niin sen käänteisfunktio
Oletetaan, että f on aidosti kasvava joukossa A. Olkoot y1 , y2 ∈ f (A), y1 < y2 . Jos nyt olisi
(y1 ) ≥ f −1 (y2 ), niin johtuen funktion f kasvavuudesta olisi myös f (f −1 (y1 )) ≥ f (f −1 (y2 )) eli y1 ≥ y2
vastoin lukujen y1 ja y2 valintaa. Siis f −1 (y1 ) < f −1 (y2 ), joten f −1 on aidosti kasvava. Tapaus, jossa f on aidosti vähenevä, käsitellään analogisesti.
Jos f ja g ovat reaalifunktioita A → B sekä c reaaliluku, määritellään näitä käyttäen uusia funktioita: cf : f ±g : fg : f : g
(cf )(x) = cf (x) ,
∀x ∈ A ,
(f ± g)(x) = f (x) ± g(x) ,
∀x ∈ A ,
(f g)(x) = f (x)g(x) , f (x) f (x) = , g g(x)
∀x ∈ A ,
30
∀x ∈ A , g(x) 6= 0.
Itse funktion yksityiskohtainen antaminen voidaan suorittaa useilla eri tavoilla. Yksinkertaisimmillaan esitetään suorastaan lauseke, joka selvittää kuvan määräytymisen, esimerkiksi f (x) = x +
p x2 + 1.
Tällöin on kyseessä ns. eksplisiittimuoto (eli ratkaistu muoto). Joskus on tarkoituksenmukaista kertoa, miten määrittelyjoukon alkio kuvautuu, ja tällöin käytetään merkintää x 7→ f (x) (luetaan: `x kuvautuu luvuksi f (x)'). Joskus funktio annetaan implisiittimuodossa (eli ratkaisemattomassa muodossa), jolloin tun-
netaan yhtälö, joka määrittää argumentin ja sen kuvana olevan reaaliluvun välisen yhteyden, esimerkiksi y = f (x), missä x3 + y 2 = 1, tai y = g(x), missä y 3 + 2y − x = 1. Toisinaan on mahdollista siirtyä impli-
siittimuodosta eksplisiittimuotoon. Esimerkiksi edellä funktion f yhteydessä tulee oikeastaan erotettavaksi √ kaksi funktiota y = ± 1 − x3 , joista kummankin määrittelyjoukko on (−∞, 1] ja arvojoukko toisella [0, ∞) ja toisella (−∞, 0].
Eräissä tilanteissa on sopivaa tarkastella funktiota parametrimuodossa. Tällöin tunnetaan x− ja y− koordinaattien riippuvuus apumuuttujasta, ns. parametrista. Jos parametrina on muuttuja t, ja voimme lausua molemmat muuttujat x ja y tämän parametrin funktioina, x = x(t), y = y(t), missä t saa arvoja väliltä I , niin tällöin voimme yrittää lausua xy -koordinaattien keskinäisen relaation f = {(x(t), y(t)) | t ∈ I}
funktion y = f (x) muodossa: annetaan parametrille t arvoja, esimerkiksi t = t0 , lasketaan ensin x0 = x(t0 ) ja y0 = y(t0 ), ja määritellään sitten `funktio' y = f (x) pisteessä x0 asettamalla f (x0 ) = y0 . Ongelmaksi tässä muodostuu tietenkin se, ettei ole helppoa nähdä saammeko tällä tavalla funktion! Ensinnäkin, jotta funktio y = f (x) tulisi ollenkaan määriteltyä pisteessä x, tulee luvun x olla funktion x = x(t) arvojoukossa. Toinen
mahdollinen ongelma seuraa siitä, että sama x:n arvo voidaan saada usealla eri parametrin t arvolla, ja tämä johtaa funktion f (x) arvojen monikäsitteisyyteen. Jos esimerkiksi x1 = x(t1 ) = x(t2 ), mutta y(t1 ) 6= y(t2 ), niin ei ole selvää tuleeko meidän määritellä f (x1 ) = y(t1 ) vai f (x1 ) = y(t2 )? Joskus parametrin voi eliminoida
helposti.
Esimerkki 1.64.
Funktion parametriesitys ( x = t−1, y = 2t2 − 4t + 1 ,
0≤t≤3
johtaa funktioon y = 2x2 − 1, −1 ≤ x ≤ 2, kun parametri t eliminoidaan. Eliminointi tapahtuu yksinkertai-
sesti ratkaisemalla yhtälöstä x = t − 1 parametri t, jolloin saamme t = x + 1. Tällöin y = 2t2 − 4t + 1 = 2(x + 1)2 − 4(x + 1) + 1 = 2x2 − 1.
Käytännössä parametrin eliminointi ei aina ole mahdollista. Esimerkkejä tästä sekä tilanteista, joissa esiintyy monikäsitteisyyttä, näemme myöhemmin tällä kurssilla. Nämä periaatteelliset ongelmat voidaan yleensä kiertää jakamalla parametrin t vaihtelualue sellaisiin osaväleihin, joilla ongelmia ei esiinny. 31
y 0.4 0.2
PSfrag repla ements
-3
-2
1
-1
2
3
x
-0.2 -0.4
Kuva 1.2: Funktion f (x) = x/(x2 + 1) kuvaaja välillä x ∈ [−3, 3] Reaalifunktioita havainnollistetaan tuttuun tapaan piirtämällä karteesiseen koordinaatistoon funktion kuvaajana oleva käyrä. Funktion määritelmästä johtuen kukin y−akselin suuntainen suora leikkaa kuvaajan enintään yhdessä pisteessä. Kuvassa 1.2 on esimerkki erään yksinkertaisen funktion kuvaajasta. Käytännössä usein tutkittavat käyrät saadaan yhdistämällä useiden eri funktioiden kuvaajia. Näin käy luonnollisella tavalla tarkasteltaessa erityisesti implisiittimuotoja ja parametriesityksiä.
Esimerkki 1.65.
Yksikköympyrän S = {(x, y) | x2 + y 2 = 1}
√ voidaan ajatella muodostuvan funktioiden f1 : [−1, 1] → R, x 7→ 1 − x2 ja funktion f2 : [−1, 1] → R, x 7→ √ − 1 − x2 kuvaajien unionista. Nämä funktiot määräytyivät implisiittisesti ympyrän yhtälöstä. Huomaa
kuitenkin, että ympyrä tällöin hieman keinotekoisesti katkeaa sen ja x-akselin leikkauspisteissä.
Edellä on käsitelty ns. yhden muuttujan reaalifunktioita, jolloin f : A → B , missä A, B ⊆ R. Funktiota
f : A → B , missä A ⊆ R × R(= R2 ) ja B ⊆ R sanotaan kahden (reaali)muuttujan (reaali)funktioksi.
Sen määrittelyjoukkona on siis jokin xy−tason osajoukko ja kuvaajana xyz−koordinaatistossa pinta, joka on pisteiden (x, y, f (x, y)), (x, y) ∈ A muodostama joukko. Kuvassa 1.3 on polynomifunktion z = f (x, y) =
1 + 3x − x2 − y 2 kuvaajasta se osa, joka saadaan rajoittamalla muuttujat x, y molemmat välille [1/5, 4/5].
Tässä siis A = [1/5, 4/5] × [1/5, 4/5]. Kuten näemme, tällaisesta kuvaajasta on jo työläämpää hahmottaa
edes kuvaajan yleisiä piirteitä, ellei sinne lisätä avustavia osia. Oheiseen kuvaan lisäsin xy -tason ruudukon `lattialle', sekä apuviivat muuttujien vaihtelualueena olevan neliön kärjistä niiden vastinpisteisiin kuvaajalla. Tällainen funktio voidaan antaa samoin kuin yhden muuttujan funktio eksplisiittimuodossa (esim. z = x + 2y 2 ), implisiittimuodossa (esim. 2x + y + 3z = 6) tai parametrimuodossa (esim. x = 2u cos t, y = 2
u sin t, z = u2 , jossa on kaksi parametria t ja u). Edelleen yleistäminen usean muuttujan funktioihin f : A →
R, missä A ⊆ R × R × R × · · · × R(= Rn ) voidaan suorittaa analogisella tavalla.
1.6 Alkeisfunktioista Kerrataan aluksi reaalilukujen potenssin perusominaisuuksia. Perustapauksessa kantaluku x voi olla mikä tahansa reaaliluku (tai jopa kompleksiluku), ja eksponentti n on positiivinen kokonaisluku. Tällöin määritellään 32
3
z
2
1
0 0
0.2
0.2
0.4
y 0.6
0.8
1
0.4 0.6
PSfrag repla ements
x
0.8
1
Kuva 1.3: Funktion f (x, y) = 1 + 3x − x2 − y 2 kuvaajan osa ns. rekursiivisesti potenssi xn seuraavilla säännöillä: • x1 = x, • xn+1 = x · xn aina, kun n ∈ Z+ .
Rekursiivisen määrittelyn idea on, että jos jo tiedämme, mitä xn tarkoittaa, niin sen avulla selitämme, mitä xn+1 tarkoittaa. Näitä sääntöjä soveltamalla saadaan siis tavalliseen tapaan x2 = x1+1 = x · x1 = x · x,
ja x3 = x1+2 = x · x2 = x · x · x.
Tällä tavalla määritelty potenssi noudattaa useita laskulakeja: • (xy)n = xn · y n kaikille x, y ∈ R, n ∈ Z+ , • xn · xm = xn+m kaikille x ∈ R, n, m ∈ Z+ , • (xn )m = xnm kaikille x ∈ R, n, m ∈ Z+ .
Laskutoimitusten suoritusjärjestyksestä on huomattava, että potensseja muodostettaessa lasketaan aina ensin eksponentin arvo. Esimerkiksi lausekkeessa x1+2 ajattelemme yllä kuvatun määritelmän hengessä, että n
ensin laskemme eksponentin 1 + 2 = 3. Huomaa erityisesti, että merkintä xm tarkoittaa luvun x sellaista 33
potenssia, jonka eksponenttina on luku mn . Tämä on (yleensä) eri luku kuin luku (xm )n . Etenkin vann
hat taskulaskinmallit edellyttävät oikean lopputuloksen saamiseksi, että potenssi xm syötetään muodossa n
x(m ) . Tarkista, miten omasi toimii! Tekstissä voidaan koko eksponenttia ympäröivät sulkeet siis jättää pois.
Sulkuja käyttämällä voidaan laskujärjestys ohjata halutuksi. Esimerkiksi (2 + 1)5 = 35 = 243,
2
(23 )2 = 82 = 64,
23 = 29 = 512,
2
(23 )(3
)
= 89 .
Potenssikäsitteen laajennuksia tulet näkemään useita. Ensimmäinen laajennus koskee tapausta, missä eksponentti on nolla. Määritellään • x0 = 1, jos x 6= 0.
Potenssia 00 ei siis määritellä lainkaan, mutta joissakin tilanteissa (kuten aiemmin
P
-merkintöjen yhteydes-
sä) on yksinkertaisinta sopia, että 0 = 1 sellaisissa kaavoissa, joissa esiintyy potenssi x0 , ja haluamme jättää 0
mahdollisuuden sijoittaa luvun x paikalle myös x = 0. Tässä on kuitenkin syytä olla varovainen, sillä kaikki laskusäännöt eivät tällöin pysy voimassa. Yksi syy varovaisuuteen näkyy jo siinä, että on vaikea sovittaa yhteen määritelmiä: 0n = 0 aina, kun n ∈ Z+ , ja x0 = 1 aina, kun x 6= 0.
Funktiot f (x) = xn , missä n ∈ Z+ ovat siten määritellyt koko reaalisuoralla ja niitä kutsutaan potenssi-
funktioiksi. Potenssifunktiossa siis muuttuja x on kantalukuna, ja eksponenttina on vakio. Näillä funktioilla
on useita ominaisuuksia, jotka ovat toivottavasti tuttuja jo koulukurssilta. Todistamme osan niistä myöhemmin tällä kurssilla. • Jos n on pariton, funktio f (x) = xn on kaikkialla aidosti kasvava. • Jos n on parillinen, funktio f (x) = xn saa ainoastaan ei-negatiivisia arvoja, on aidosti kasvava välillä [0, ∞), ja aidosti vähenevä välillä (−∞, 0].
Seuraava potenssikäsitteen laajennus koskee negatiivisen eksponentin tapausta. Määrittelemme • Jos n < 0 ja x 6= 0, niin määrittelemme
xn =
1 x−n
.
Tällöin aikaisemmin mainitsemamme laskusäännöt ovat voimassa, kunhan kantaluku 6= 0.
Yleisempi potenssi xa , missä eksponentti a ei olekaan enää kokonaisluku, voidaan ensimmäisen vuoden
kursseilla määritellä ainoastaan silloin, kun x > 0. Määrittely voidaan tehdä useilla eri tavoilla. Luonnollisin (joskaan ei yksinkertaisin) tapa on laajentaa ensin potenssin xn (n ∈ Z) määritelmä rationaalisille m eksponenteille r = (m ∈ Z, n ∈ Z+ ) asettamalla n √ xr = xm/n = n xm , jolloin vakiolle a > 1 funktio f (r) = ar on aidosti monotoninen, sekä määritellä sitten ar irrationaalisilla r:n arvoilla siten, että monotonisuus säilyy (eli `täytetään' käyrän y = ar aukot). Tässä kurssissa sivuutetaan 34
ko. määrittelyn vaatimat yksityiskohtaiset tarkastelut. Kurssissa Analyysi II määritellään nämä potenssit toisella tavalla käyttäen hyväksi sarjojen teoriaa, jolloin potenssin perusominaisuuksien todistaminen tulee helpommaksi. Tämä potenssikäsitteen laajennus voidaan tehdä siten, että yllä mainitut `potenssiopin laskulait' ovat voimassa niissä tilanteissa, joissa kaikki esiintyvät potenssit on määritelty. Reaalifunktioita voidaan luokitella esimerkiksi seuraavasti: (i) Algebralliset funktiot: • Polynomifunktiot y = P (x),
P (x) , missä P ja Q ovat polynomeja, (polynomi- ja murtofunktioista käytetään Q(x) yhteisnimitystä rationaalifunktiot)
• Murtofunktiot y =
• Irrationaalifunktiot: Rationaali- ja juurifunktioista rationaalisilla laskutoimituksilla (yhteen-, vä-
hennys-, kerto- ja jakolasku sekä juurenotto) muodostetut funktiot,
• Polynomiyhtälön P (x, y) = 0 muut juuret (joita ei yleisesti voida lausua juurifunktioiden avulla).
(ii) Transsendenttifunktiot: Funktiot, jotka eivät ole algebrallisia.
Esimerkki 1.66.
• Funktiot y = x2 ja y = x5 ovat potenssifunktioita, jotka on määritelty ∀ x ∈ R.
• Funktio y = x3 − 3x + 1 on polynomifunktio, joka on määritelty ∀ x ∈ R. • Funktio y = (x2 + 2)/(x − 1) on rationaalifunktio, joka on määritelty ∀ x ∈ R \ {1}. • Funktio y =
√ x3 + 1 on (algebrallinen) irrationaalifunktio, joka on määritelty ∀ x ≥ −1.
• Funktio y = y(x), missä y on yhtälön y 5 + y = x2 + 1 ratkaisu on algebrallinen (implisiittisesti
määrätty funktio). Myöhemmin voimme todistaa, että kullekin reaalimuuttujan x arvolle kyseinen yhtälö toteutu yhdelle ja vain yhdelle reaaliluvulle y . Tätä ratkaisua y ei voida lausua x:n polynomija juurilausekkeena, mutta jätämme tämän perustelematta.
Yhteistä algebrallisille funktioille on, että niiden määrittelyssä pari (x, y) toteuttaa jonkin polynomiyhtälön, ja yhtälön ratkaisua koskevaa vaihetta lukuun ottamatta selvitään peruslaskutoimituksilla (nelilaskimella). Jo transsendenttisten funktioiden määrittely edellyttää mutkikkaampien operaatioiden ottamista käyttöön. Näistä tutustumme eksponentti- ja logaritmifunktion, trigonometristen funktioiden ja arkusfunktioiden sekä hyperbeli- ja areafunktioiden perusominaisuuksiin. Alkeisfunktioiksi sanotaan näistä sekä potenssi- ja juurifunktioista rationaalisilla laskutoimituksilla ja yhdistämällä saatuja funktioita. Tässä yhteydessä emme voikaan määritellä näitä matemaattisen täsmällisesti, ja turvaudumme hieman epätyydyttäviin menetelmiin kuten visuaaliseen havaintoon, tai rajaprosessiin. Ensimmäisen ja osin vielä toisenkin vuoden analyysin opintojen yhtenä tavoitteena on vähitellen hankkiutua eroon tästä epämääräisyydestä.
35
1.6.1 Eksponentti- ja logaritmifunktioista Olkoon a > 0, a 6= 1 jokin kantaluku. Eksponenttifunktioiksi kutsutaan muotoa f : R → R+ , f (x) = ax ,
olevia funktioita. Päinvastoin kuin potenssifunktion tapauksessa tässä muuttuja x esiintyy eksponentissa, ja kantalukuna esiintyy vakio a. Seuraavassa luetellaan eräitä eksponenttifunktion y = ax ominaisuuksia. Osa näistä on potenssiopin kaavojen seurauksia. Todistamme nämä ominaisuudet kurssilla Analyysi II. (i) f : R → R+ , f (x) = ax on bijektio, ( kasvava, kun a > 1, (ii) y = ax on aidosti vähenevä, kun 0 < a < 1, (iii) au+v = au av , auv = (au )v ja (ab)u = au bu . Eksponenttifunktion ominaisuuden (i) nojalla saadaan käänteisfunktiona logaritmifunktio f : R+ →
R , f (x) = loga x, joka myös on aidosti monotoninen. Käyttämällä käänteisfunktion yleisiä ominaisuuksia
saadaan esimerkiksi seuraavat logaritmin perusominaisuudet: (i) f : R+ → R , f (x) = loga x on bijektio, (ii) y = loga x ⇔ ay = x, ts. aloga x = x, ( kasvava, kun a > 1, (iii) y = loga x on aidosti vähenevä, kun 0 < a < 1, (iv) loga 1 = 0 ja loga a = 1 , (v) loga (xα ) = α loga x (α ∈ R) (vi) loga (uv) = loga u + loga v (vii) logb x =
loga x loga b
.
Kantalukuna a esiintyy usein luku 10, jolloin saadaan Briggsin logaritmit, tai ns. Neperin luku e ≈
2,718281828 . . ., jolloin saadaan luonnolliset logaritmit. Tällöin merkitään vastaavasti log10 x = lg x ja loge x = ln x. Neperin luvun tarkkaan määritelmään palaamme tällä kurssilla lukujonojen raja-arvojen yh-
teydessä. Logaritmi on kätevä työkalu suuriin lukuihin liittyvissä arviointitehtävissä.
Esimerkki 1.67.
Selvitä kuinka monta numeroa on luvun 21000 kymmenjärjestelmäesityksessä.
Ratkaisu. Laskimella saadaan likiarvo lg 2 ≈ 0,30103.
36
Käyttämällä logaritmin perusominaisuuksia saamme sitten lg 21000 = 1000 lg 2 ≈ 301,03,
erityisesti
301 < lg 21000 < 302.
Koska funktio f (x) = 10x on aidosti kasvava, saamme tästä
10301 < 21000 < 10302 .
Luvussa 21000 on siten 302 numeroa.
Esimerkki 1.68.
4
Selvitä kumpi luvuista 44 ja 1313 on suurempi.
Ratkaisu. Koska 44 = 256, ja 4 = 22 niin 4 log2 44 = log2 4256 = 256 · log2 4 = 256 · 2 = 512.
Toisaalta 13 < 16 = 24 , ja funktiot y = log2 (x) ja y = x13 ovat molemmat aidosti kasvavia välillä (0, ∞), joten
log2 1313 < log2 1613 = 13 log2 (16) = 13 · 4 = 52. 4
Koska log2 säilyttää lukujen suuruusjärjestyksen, niin voimme päätellä, että 44 on selvästi suurempi. Tämän voit tarkistaa myös taskulaskimella!
1.6.2
Trigonometrisistä funktioista
Seuraavissa tarkasteluissa käytetään hyväksi origokeskistä yksikköympyrää x2 + y 2 = 1.
Kuvassa 1.4 ajatellaan (suunnatun) kulman α muodostuva siten, että puolisäde OX (alkukylki) kääntyy origon O ympäri asentoon OA (loppukylki). Kulma on positiivinen tai negatiivinen sen mukaan onko kiertosuunta positiivinen eli vastapäivään tai negatiivinen eli myötäpäivään. Loppukylki määrittää kulman neljänneksen eli kvadrantin (I,II,III tai IV).
Määritelmä 1.69.
Kuvan 1.4 kulman α suuruus radiaaneissa on pisteen X piirtämän kaaren XA ja vastaa-
van säteen OX= 1 pituuksien suhde varustettuna + tai merkillä sen mukaan onko kiertosuunta positiivinen tai negatiivinen. Käyttämämme kulman suuruuden `määritelmä' ei ole täysin ongelmaton, koska siinä sivuutamme esimerkiksi kaaren pituuden määrittelemiseen liittyvän problematiikan. Tätä kysymystä pohditaan tarkemmin myöhemmillä kursseilla. Vaikka ympyrän kehän pituus = 2π , niin sallimme tässä kulmalle x myös arvot 37
y
II
A
1
I
0.5 α
-1
O
-0.5
0.5
X 1
x
-0.5 PSfrag repla ements
III
IV
-1
Kuva 1.4: Yksikköympyrän osia ja koordinaattineljännekset
≥ 2π . Nämä tulkitaan siten, että annamme pisteen A liukua ympyrän kehää pitkin matkan x verran (alkaen
pisteestä X), jolloin se yksinkertaisesti aloittaa uuden kierroksen, kun x kasvaa suuremmaksi kuin 2π .
Yhdenmuotoisuudesta johtuen kulman α suuruus radiaaneissa voidaan laskea myös muussa kuin yksikköympyrässä. Kuvan 1.5 merkinnöin α = b/r (varustettuna oikealla etumerkillä), missä r = OA = OB on ympyräsektorin säde, ja b = kaaren AB pituus. Kulman suuruutta voidaan mitata myös asteilla(◦ ), jolloin täysikulma on 360◦ = 2π rad. Asteen osina käytetään desimaalien ohella minuutteja (′ ) ja sekunteja (′′ ), jolloin 1◦ = 60′ ja 1′ = 60′′ . Jos ei erityisesti muuta mainita, niin kulman suuruus ilmoitetaan radiaaneissa. Syy radiaanien suosimiseen tulee ilmeiseksi, kun myöhemmin tällä kurssilla tutkimme trigonometristen funktioiden derivointia.
38
A b
B
r
α
PSfrag repla ements O
Kuva 1.5: α = b/r
Määritelmä 1.70.
(Trigonometriset funktiot.) sin α = A:n ordinaatta (ykoordinaatti), cos α = A:n abskissa (xkoordinaatti), sin α 1 tan α = , sec α = , cos α cos α 1 1 cot α = , csc α = . tan α sin α
Määritelmän 1.70 nojalla sin2 α + cos2 α = 1 ja edelleen 1 + tan2 α = 1 +
sin2 α 1 tan2 α = = , cos2 α cos2 α sin2 α
jotka voidaan ratkaista muotoon sin α ±
p = ± 1 − cos2 α
p 1 − sin2 α =
cos α
√ 1 − cos2 α sin α =± ±p cos α 1 − sin2 α
tan α = ±√ , 1 + tan2 α 1 = ±√ , 1 + tan2 α =
tan α ,
missä etumerkit määräytyvät kulman α neljänneksen perusteella.
Esimerkki 1.71.
Tähtitieteessä käytetään etäisyyden yksikköä parsek. Se määritellään etäisyytenä r, josta
katsottuna Maan ja Auringon välinen kulma on (suurimmillaan) yksi kaarisekunti. Koska Maan ja Auringon etäisyys b on noin 150 miljoonaa kilometriä, yksinkertainen lasku alkaen yhtälöstä 2π b = r 360 · 60 · 60
johtaa tulokseen r ≈ 3.1 · 1013 kilometriä eli noin 3,26 valovuotta. 39
Määritelmä 1.72.
Vakiota a(6= 0) sanotaan funktion f jaksoksi, jos kaikilla f :n määrittelyjoukkoon kuulu-
villa arvoilla x ja x + a on voimassa f (x) = f (x + a). Pienintä positiivista f :n jaksoa sanotaan perusjaksoksi (alkujaksoksi). Trigonometristen funktioiden määrittelyn perusteella on heti selvää, että kaikkien trigonometristen funktioiden jaksona on 2π ja että se on sinin ja kosinin perusjakso, mutta tangentin perusjakso on π . Siis sin x = sin(x + n · 2π) ,
cos x = cos(x + n · 2π) ,
tan x = tan(x + n · π) ,
kun n = 0, ±1, ±2, . . . 1
A
0.5
α
-1
O
-0.5
X 1
0.5 -α
-0.5
PSfrag repla ements
A’ -1
Kuva 1.6:
Pisteiden A ja A' symmetrisyyden (vrt. Kuva 1.6) takia on voimassa sin(−α) = − sin α,
cos(−α) = cos α,
tan(−α) = − tan α
joten sini ja tangentti ovat parittomia ja kosini parillinen funktio. Seuraavassa esitetään trigonometristen funktioiden kuvaajia. Ne havainnollistavat edellä esille tulleita
ominaisuuksia: jaksollisuutta, pariteettia, arvojoukkoja jne. Sfrag repla ements y 1 - 3π/2
-π
-π/2
π/2
π
3π/2
-1
Kuva 1.7: Kosinin (musta) ja sinin (harmaa) kuvaajat
40
x
Kuvassa 1.7 on kosinin ja sinin tyypilliset aaltomaiset kuvaajat (useimmat ideaaliset aaltoliikkeet ovat juuri tällaisen siniaallon muotoisia). Jakso 2π näkyy esimerkiksi aaltojen peräkkäisten huippujen välimatkana. Lisäksi näemme, että sinin kuvaaja on itse asiassa kosinin kuvaaja π/2 verran oikealle suuntaissiirrettynä. y 3
2
1
-π
-π/2
π/2
π
x
-1
PSfrag repla ements -2
-3
Kuva 1.8: Kotangentin (musta) ja tangentin (harmaa) kuvaajat
Kuvassa 1.8 näemme osia tangentin ja kotangentin kuvaajista. Kun kehäpiste lähestyy y -akselia, tangentin arvosta tulee itseisarvoltaan hyvin suuri, mikä selittää kuvaajan 'hännät' kulmien π/2 + nπ, n ∈ Z
lähistöllä. Vastaavasti kehäpisteen lähestyessä x-akselia (kulma = nπ, n ∈ Z) kotangentin itseisarvo tulee
hyvin suureksi.
Siirrytään tarkastelemaan trigonometristen funktioiden yhteen ja vähennyslaskukaavoja. Ensimmäisenä todistetaan kosinin vähennyslaskukaava: cos(α − β) = cos α cos β + sin α sin β.
(∗)
Todistus. Lisäämällä tarvittaessa kulmaan α tai β tai molempiin sopivia 2π:n monikertoja voidaan olettaa, että 0 ≤ α , β < 2π . Koska vielä cos(α − β) = cos(β − α) ja väitteen oikea puoli on symmetrinen kulmien α
ja β suhteen, voidaan lisäksi olettaa α ≥ β .
Pisteiden A ja B koordinaatit xy -koordinaatistossa ovat ( A = (cos α, sin α), B = (cos β, sin β).
Kierretään koordinaatistoa vastapäivään kunnes x-akseli kulkee pisteen B kautta. Näin saadussa x′ y ′ -koordinaatistossa pisteiden A ja B koordinaatit ovat (ks. Kuva 1.9) ( A = (cos(α − β), sin(α − β)), B = (1, 0). 41
x’
B
α−β
y
β
α
x
PSfrag repla ements y ’
A
Kuva 1.9: Molemmat koordinaatistot ovat suorakulmaisia ja niissä on saman pituinen pituusyksikkö. Täten pisteiden A ja B etäisyys on molemmissa koordinaatistoissa sama ja siis (cos α − cos β)2 + (sin α − sin β)2 = (cos(α − β) − 1)2 + (sin(α − β) − 0)2 ,
josta sieventämällä saadaan kaava (∗). Kaavaa (∗) hyväksi käyttäen voidaan nyt todistaa komplementtikulmia koskevat tulokset: π 2 π cos( 2 π tan( 2 π cot( 2 sin(
− α) =
cos α ,
− α) =
sin α ,
− α) =
cot α ,
− α) =
tan α .
Todistus. Kaavan (∗) perusteella voidaan kirjoittaa cos(
π π π − α) = cos cos α + sin sin α = sin α, 2 2 2
joten toinen kaavoista on voimassa. Tämän nojalla on edelleen cos α = cos(
π π π − ( − α)) = sin( − α), 2 2 2
mikä todistaa ensimmäisen kaavoista. Tangenttia ja kotangenttia koskevat tulokset saadaan edellisistä jakolaskulla. Kaavan (∗) ja komplementtikulmien kaavojen avulla saadaan vielä seuraavaa. Sijoitetaan kaavassa (∗)
β :n paikalle −β :
cos(α + β) = cos α cos(−β) + sin α sin(−β) = cos α cos β − sin α sin β.
42
Käyttämällä komplementtikulmaa saadaan π π − (α + β)) = cos(( − α) − β) 2 2 π π = cos( − α) cos β + sin( − α) sin β 2 2 = sin α cos β + cos α sin β.
sin(α + β) = cos(
Sijoitetaan edellisessä β :n paikalle −β : sin(α − β) = sin α cos(−β) + cos α sin(−β) = sin α cos β − cos α sin β.
Näin on saatu sinin ja kosinin yhteen- ja vähennyslaskukaavat: sin(α + β) =
sin α cos β + cos α sin β ,
sin(α − β) =
sin α cos β − cos α sin β ,
cos(α + β) =
cos α cos β − sin α sin β ,
cos(α − β)
cos α cos β + sin α sin β .
=
Suorittamalla sopivasti näiden kaavojen kesken jakolaskuja saadaan supistamalla vastaavat kaavat tangentille ja kotangentille: tan(α ± β) = cot(α ± β) =
tan α ± tan β , 1 ∓ tan α tan β ± cot α cot β − 1 . cot α ± cot β
Sinin ja kosinin yhteenlaskukaavoista voidaan ratkaista tuloparit, jolloin saadaan `tulot summiksi' -kaavat: 1 (sin(α + β) + sin(α − β)) , 2 1 (sin(α + β) − sin(α − β)) , cos α sin β = 2 1 cos α cos β = (cos(α + β) + cos(α − β)) , 2 1 sin α sin β = − (cos(α + β) − cos(α − β)) . 2 sin α cos β =
Merkitään sinin ja kosinin summakaavoissa α + β = x ja α − β = y , jolloin α = (x + y)/2 ja β = (x − y)/2,
saadaan `summat tuloiksi' -kaavat:
x+y x−y cos , 2 2 x−y x+y sin , sin x − sin y = 2 cos 2 2 x−y x+y cos , cos x + cos y = 2 cos 2 2 x+y x−y cos x − cos y = −2 sin sin . 2 2 sin x + sin y =
2 sin
43
Kun yhteenlaskukaavoihin sijoitetaan α = β , saadaan kaksinkertaisia kulmia koskevat kaavat: sin 2α =
2 sin α cos α ,
cos 2α =
cos2 α − sin2 α = 2 cos2 α − 1 = 1 − 2 sin2 α , 2 tan α , 1 − tan2 α cot2 α − 1 . 2 cot α
tan 2α = cot 2α =
Esimerkki 1.73.
Millä reaaliluvun x arvoilla on voimassa epäyhtälö sin 3x > sin x.
Ratkaisu. Jaksollisuuden seurauksena x on ratkaisu silloin ja vain silloin, kun x + n2π, n ∈ Z on ratkai-
su, joten voimme rajoittaa tarkastelun esimerkiksi välille x ∈ [0, 2π). Käyttämällä ym. kaavoja epäyhtälö
muuntuu seuraavasti
sin 3x > sin x
(summat tuloiksi) sin 3x − sin x > 0 3x + x 3x − x ⇔ 2 cos sin > 0 (sievennys, jaetaan luvulla 2 > 0) 2 2 ⇔ cos 2x sin x > 0. ⇔
Välillä [0, 2π) funktio sin x muuttaa merkkiään pisteissä 0, π, (2π) ja toinen tekijä cos 2x muuttaa merkkiään pisteissä π/4, 3π/4, 5π/4 ja 7π/4. Merkkitarkastelu osoittaa, että näiden kahden tekijän tulo on positiivinen silloin ja vain silloin, kun x ∈ (0, π/4), x ∈ (3π/4, π) tai x ∈ (5π/4, 7π/4). Ratkaisuiksi kelpaavat kaikki kulmat x, jotka saadaan näihin avoimiin väleihin, kun sopiva jakson 2π kokonaislukumonikerta niistä
vähennetään. Luonnossa esiintyviä aaltoliikkeitä (mekaanisten värähtelyjen ja ääniaaltojen lisäksi etenkin sähkömagneettiset aallot) sinikäyrät tai siniaallot kuvaavat erittäin hyvin. Asettamalla sopivasti vakioita saadaan perustapauksista yleisempiä tilanteita, esimerkiksi y = a sin(bx + c),
missä vakioiden a ja b 6= 0 merkitys on seuraava: |a| = amplitudi, 2π = aallonpituus, |b| c määrittää vaihesiirron.
Sinin ja kosinin yhteenlaskukaavojen avulla voidaan selvittää myös aallonpituudeltaan samanlaisten (tai ajan ollessa muuttujana samantaajuisten värähtelyjen), mutta erivaiheisten siniaaltojen summa-aallon vaihe ja amplitudi.
44
Esimerkki 1.74.
Esitä aalto
√ f (x) = sin x + 2 2 sin(x + π/4)
muodossa f (x) = a sin(x + c), missä a, c ∈ R ovat vakioita. √ Ratkaisu. Koska sin(π/4) = cos(π/4) = 1/ 2, saamme sinin summakaavasta √ √ 2 sin(x + π/4) = 2[sin x cos(π/4) + cos x sin(π/4)] = sin x + cos x.
Näin ollen f (x) = 3 sin x + 2 cos x. Toisaalta edelleen sinin summakaavan nojalla a sin(x + c) = (a cos c) sin x + (a sin c) cos x,
joten saamme tehtävän ratkaistua, mikäli löydämme ratkaisun (a, c) yhtälöparille ( a cos c = 3, a sin c = 2.
Neliöimällä nämä yhtälöt puolittain ja laskemalla saadut yhtälöt puolittain yhteen saamme a2 (cos2 c + sin2 c) = 32 + 22 = 13,
josta voimme eliminoida vaiheen c käyttämällä identiteettiä cos2 c + sin2 c = 1. Siis a2 = 13 ja valitsemme √ √ √ a = 13. Vaiheen c on siis lisäksi toteutettava ehto sin c = 2/ 13. Koska myös cos c = 3/ 13 on positiivinen, on nämä ehdot toteuttava kulma c ensimmäisessä neljänneksessä. Taskulaskimesta saamme likiarvon c ≈
0,588 eli c ≈ 33,7◦ (sinin käänteisfunktiota käsitellään myös seuraavassa pykälässä). Vastaukseksi saamme, √ että summa-aallon amplitudi a = 13 ≈ 3,606 ja vaihe c ≈ 33,7◦ . Kuvassa 1.10 amplitudi a näkyy aallon
korkeutena. Vaihesiirto c näkyy siten, että kuvaaja leikkaa x-akselin kohdissa x = −c + nπ, n ∈ Z. 3 2 1 1
2
3
4
5
-1 -2 -3
√ Kuva 1.10: Funktion f (x) = sin x + 2 2 sin(x + π/4) kuvaaja
Edellä jo johdimme `kaksinkertaisen kulman kaavat'. Käännetään nämä seuraavaksi 'puolen kulman kaavoiksi'. Esiintyneistä kaksinkertaisen kulman kosinin cos 2α eri esityksistä voidaan ratkaista 2 sin2 α = 1 − cos 2α ja 2 cos2 α = 1 + cos 2α,
45
joista sijoittamalla 2α:n paikalle α saadaan puolen kulman kaavat r 1 − cos α α sin = ± , 2 2 r 1 + cos α α cos = ± , 2 2 r 1 − cos α α , tan = ± 2 1 + cos α joissa etumerkit määräytyvät kulman α/2 neljänneksen perusteella. Lisäksi vielä on voimassa tan
sillä esimerkiksi
sin α 1 − cos α α = = , 2 1 + cos α sin α
2 sin α2 cos α2 sin α α = = tan . 1 + cos α 2 cos2 α2 2
Koska sin α =
ja cos α =
2 sin α2 cos α2 2 tan α2 sin(2 · α2 ) = = 2 1 1 + tan2 α2 sin α2 + cos2 α2 cos(2 · α2 ) cos2 α2 − sin2 = 1 sin2 α2 + cos2
α 2 α 2
=
1 − tan2 1 + tan2
α 2 α 2
,
niin merkitsemällä t = tan(α/2) saadaan kulman α trigonometriset funktiot rationaalisina muuttujan t funktioina:
2t 1 + t2 1 − t2 cos α = 1 + t2 2t tan α = 1 − t2 1 − t2 . cot α = 2t Päätteeksi trigonometrisistä kaavoista esitetään kaksi tuttua kolmioon liittyvää tulosta. Käytetään kolsin α =
mion osista Kuvan 1.11 mukaisia standardimerkintöjä. Sini ja kosinilauseet voidaan esitää seuraavasti: a b c = = = 2R , sin α sin β sin γ
missä esiintyvä vakio R on kolmion kaikkien kärkien (A, B, C ) kautta piirretyn ympyrä säde, ja c2 = a2 + b2 − 2ab cos γ .
Kolmion pinta-ala lasketaan trigonometrisesti usein kaavalla: Ala =
1 b c sin α. 2
Jos kolmion osista (a, b, c, α, β, γ ) jotkin 3 tunnetaan, niin muut voidaan näiden avulla määrätä, kunhan ainakin yksi tunnetuista osista on sivu (poikkeuksena ssk-tilanne, jossa kolmion muodolle ja koolle jää 2 vaihtoehtoa). 46
B β c
PSfrag repla ements α
a
A
b γ C
Kuva 1.11: Kolmion osat
Esimerkki 1.75.
Kheopsin pyramidin pohjana on neliö ABCD, jonka sivun pituus on c = 230 metriä.
Pyramidin huippu P on kohtisuoraan pohjaneliön keskipisteen O yläpuolella 147 metrin korkeudessa. Määrää pyramidin sivukolmion △ABP kulmat.
Ratkaisu. Mitat ovat selvästi luonteeltaan likiarvoja (ja pyramidi taitaa olla nykyään madaltunut muutaman metrin eroosion, maan tärähtelyn ja turistien vaikutuksesta), joten emme tällä kertaa käytä tarkkoja arvoja. √ Jana AO on pituudeltaan puolet pohjaneliön lävistäjästä, joten AO = 2 · 230/2 = 162,6 metriä. Soveltamalla Pythagoraan lausetta suorakulmaiseen kolmioon △AOP saamme a = AP =
p p AO2 + OP 2 = 162,62 + 1472 = 219 metriä.
Selvästi jana b = BP on yhtä pitkä. Kolmio △ABP on siis tasakylkinen, ja itse asiassa melkein tasasivuinen. Merkitään pohjan sivun ja nousevan reunan välistä kulmaa α =
6
BAP = 6
ABP ja pyramidin huipussa
yhtyvien sivujen välistä kulmaa φ = 6 AP B . Kosinilauseesta saadaan 2302 = 2192 + 2192 − 2 · 2192 cos φ,
mistä ratkeaa cos φ ≈ 0,45. Kosinin käänteisfunktiolla saamme φ ≈ 63,3◦ . Koska kolmion kulmien summa on 180◦ saadaan α = (180◦ − φ)/2 ≈ 58,4◦ .
√ Usein esiintyvät sinin ja kosinin arvot sin(π/6) = cos(π/3) = 1/2, sin(π/4) = cos(π/4) = 2/2 ja √ sin(π/3) = cos(π/6) = 3/2 kannattanee opetella ulkoa (tarkemmin sanottuna ehkä `nämä oppii ulkoa,
koska ne esiintyvät sangen usein'). Neliöjuurilausekkeina voidaan lausua myös kulman π/5 sini ja kosini.
Esimerkki 1.76.
Johda tulokset √ 1+ 5 π , cos = 5 4
π sin = 5
47
s
√ 5− 5 . 8
C
α
D
PSfrag repla ements
α
2α
α
A
B Kuva 1.12: α = π/5
Ratkaisu. Käytetään Kuvan 1.12 merkintöjä, ja alkeisgeometrian tietoa (seuraa esimerkiksi sinilauseesta), että kolmiossa yhtäsuuria kulmia vastaavat sivut ovat yhtä pitkiä. Piirretään tasakylkinen kolmio △ABC , jossa huippukulma
6
ACB = α = π/5. Tällöin kantakulmat
BAC , 6 ABC ovat molemmat suuruudeltaan (π − α)/2 = 2π/5 = 2α. Piirretään kulman 6 BAC puolittaja
6
(kuvan harmaa jana). Olkoon D tämän kulmanpuolittajan ja janan BC leikkauspiste. Tunnetuista kulmista lasketaan helposti, että 6
ADB = π − 6 DAB − 6 DBA = π − (π/5) − (2π/5) = 2π/5.
Siis kolmio △ADB on myös tasakylkinen. Koska sen huippukulma
6
DAB = α = 6
ACB , niin kolmiot
△ADB ja △CBA ovat yhdenmuotoisia. Valitaan yksiköt siten, että janan AB pituus on 1, ja merkitään
janan BD pituutta luvulla x. Tällöin kolmion △ADB tasakylkisyyden perusteella AD = 1. Edelleen kolmion △ADC tasakylkisyyden (kaksi kulmista = α) vuoksi myös CD = 1.
Yhdenmuotoisten kulmien vastinjanojen suhteista voidaan muodostaa verranto AD 1+x 1 BC = ⇔ = . AB DB 1 x
Kertomalla viimeinen yhtälö puolittain luvulla x saadaan toisen asteen yhtälö x2 +x = 1. Tällä on ratkaisuina √ √ x = (−1 ± 5)/2, joista miinusmerkkinen valinta ei negatiivisena lukuna tule kysymykseen. Siis x = ( 5 − 1)/2. Sovelletaan lopuksi kosinilausetta kolmioon △ABD:
x2 = 12 + 12 − 2 cos α.
Tästä ratkaistaan cos α = 1 − (x2 /2) = (1 + neliöjuurena (α 1. neljänneksen kulma).
√
5)/4. Luku sin α saadaan sitten luvun 1 − cos2 α positiivisena
48
Kuva 1.13: Ikosaedri ja sen 30 särmän muodostama kehikko
Jatketaan tätä seuraavalla esimerkkiketjulla, jossa käsittelemme ikosaedriksi kutsuttua säännöllistä monitahokasta, ja sen yhteydessä ns. bu kyball-muotoa, mikä on esimerkiksi fullereeni-molekyylillä C60 . Tässä on kyse enemmänkin edellä esiintyneiden tulosten huolellisesta soveltamisesta 3-ulotteisessa maailmassa. Koska nämä esimerkit eivät tuo lisävalaistusta trigonometristen funktioiden ominaisuuksiin, vaan ovat mukana lähinnä kuriositeettiarvonsa vuoksi, ne lukijat, joita fullereenin (tai jalkapallon) geometria ei kiinnosta, voivat hypätä tämän esimerkin yli. Ikosaedri (ks. Kuva 1.13) on yksi ns. Platonin monitahokkaista. Siinä on 12 kärkeä, 30 särmää ja 20 tahkoa. Kaikki tahkot ovat tasasivuisia kolmioita. Ikosaedrin ympärille voidaan kuvitella pallopinta, joka kulkee kaikkien kärkien kautta. Kaikki 12 kärkeä ovat siten yhtä etäällä tämän pallon keskipisteestä. Ikosaedrilla on runsaasti symmetrioita ja sitä voidaan muun muassa pyöritellä siten, että mikä tahansa sen kärjistä (tai särmistä tai tahkoista) tulee toisen valitun kärjen (tai särmän tai tahkon) paikalle, ja samalla kuitenkin kappale kokonaisuudessaan täyttää saman tilan avaruudessa. Jokainen ikosaedrin kärjistä on mukana viidessä eri tahkossa, ja jokaisesta kärjestä lähtee viisi särmää. Seuraavaa tulosta johdettaessa käytämme runsaasti apuna kuvasta `ilmeisiä' symmetrioita, joten laskun sulattelu vaatii muutaman apukuvan piirtämisen lisäksi uskoa siihen, että ikosaedrin muotoinen kappale on olemassa ja että sillä on mainitut symmetriat.
Esimerkki 1.77.
Oletetaan, että ikosaedrin särmän pituus on a. Osoitetaan, että tällöin sen ympärillä
olevan pallon säde on ρ=a
s
√ 5+ 5 . 8
Ratkaisu. Koska mittayksiköt voidaan valita vapaasti, oletetaan yksinkertaisuuden vuoksi a = 1. Olkoon O mainitun pallon keskipiste ja A yksi ikosaedrin kärjistä. Sillä on viisi `naapurikärkeä' B, C, D, E, F , ja ne ovat siis pisteestä A lähtevien särmien päätepisteet. Symmetrian (kierto kulman 2π/5 verran akselin OA ympäri) vuoksi pisteet B, C, D, E, F ovat kaikki samalla tasolla T , ja monitahokas ABCDEF on 5-sivuinen pyramidi, 49
A
G P C
R
B
O
Kuva 1.14: 5-sivuinen pyramidi ikosaedrin osana ja ympäröivän pallon keskipiste O
jonka sivut ovat kaikki yhteneviä tasasivuisia kolmioita ja pohjana on säännöllinen viisikulmio BCDEF . Olkoon P kyseisen viisikulmion ympäri piirretyn ympyrän keskipiste. Tällöin jana P A on kohtisuoraan tasoa T vastaan. Merkitään janan BC keskipistettä R:llä. Koska piste P ei liiku mainitussa kierrossa (se on janan OA ja tason T leikkauspiste), kolmiossa △P BC sivut P B ja P C ovat yhtä pitkiä, 6 BP C = 2π/5, ja jana P R on kulman
6
BP C puolittaja. Erityisesti siis
6
BP R = π/5 = α ja
6
BRP on suora. Suorakulmaisessa
kolmiossa △BP R kateetti BR = 1/2, joten hypotenuusa P B = BR/ sin α = 1/(2 sin α). Edelleen P R = √ cos αBP = cos α/(2 sin α). Jana AR on tasasivuisen kolmion △ABC korkeusjana, joten AR = 3/2. Koska A on kohtisuoraan pisteen P päällä, kolmio △AP R on suorakulmainen. Olkoon sitten G tasasivuisen kolmion △ABC keskipiste. Kolmioiden koulugeometrian perusteella tiedämme, että G on keskijanojen leikkauspiste.
Erityisesti se siis on janalla AR ja vieläpä siten, että AG = AR·(2/3). Siis AG2 = AR2 ·(4/9) = (3/4)·(4/9) =
1/3. Ikosaedrin symmetrioiden vuoksi tiedämme, että tahkolle △ABC pisteeseen G piirretty normaali kulkee
pisteen O kautta. Siis pisteet A, P, O, G, R ovat kaikki samassa tasossa, A, G, R samalla suoralla, ja samoin A, P, O (ks. Kuva 1.14). Merkitään β = 6 RAP = 6 GAO. Suorakulmaisesta kolmiosta AP R saadaan √ (cos α/(2 sin α))2 cos2 α 3+ 5 P R2 √ . = = = sin2 β = AR2 3/4 3 sin2 α 3(5 − 5) √ √ √ Tästä saadaan cos2 β = 1−sin2 β = (12−4 5)/(3(5− 5)). Laventamalla tämä luvulla 5+ 5 ja käyttämällä √ √ √ 2 √ tulosta (5 + 5)(5 − 5) = 52 − 5 = 20 se sievenee muotoon cos2 β = (10 − 2 5)/15. Suorakulmaisesta
kolmiosta △OAG saadaan lopulta
AG2 1 5 √ . = = 2 2 cos β 3 cos β 2(5 − 5) √ Laventamalla viimeinen osamäärä jälleen luvulla 5 + 5 se sievenee muotoon √ √ √ 5(5 + 5) 5+ 5 5(5 + 5) √ √ = ρ2 = OA2 = = . 2 · 20 8 2(5 − 5)(5 + 5) OA2 =
50
Kuva 1.15: Fullereeni-molekyyli, ikosaedri ja jalkapallo
Esimerkki 1.78.
Fullereeni-molekyylissä on 60 hiiliatomia. Ne sijoittuvat ikosaedrille siten, että jokaisella
ikosaedrin 30 särmästä on 2 atomia. Jos särmän pituus on a, niin hiiliatomit sijoittuvat särmälle etäisyydelle a/3 sen päätepisteistä (ja siis myös etäisyydelle a/3 toisistaan). Hiiliatomit ovat silloin erään monitahokkaan
kärkiä. Kustakin ikosaedrin kärjestä lähtee viisi särmää, joten niillä kyseistä kärkeä lähimpinä olevat 5 hiiliatomia ovat erään säännöllisen 5-kulmion kärkiä. Koska ikosaedrilla on 12 kärkeä, tällaisia 5-kulmioita on 12 kappaletta. Kullakin ikosaedrin 20 tahkosta on 3 särmää reunoina. Näillä särmillä on yhteensä 6 hiiliatomia, ja ne muodostavat sitten säännöllisen (tasomaisen) 6-kulmion. Tällaisia 6-kulmioita on 20 kappaletta. Jalkapallot kootaan usein juuri tällä tavalla 12 viisikulmion muotoisesta mustasta nahkapalasta ja 20 kuusikulmion muotoisesta valkoisesta nahkapalasta. Kuvassa 1.15 on kuvattu fullereeni-molekyyli monitahokkaana ja `jalkapallo' ympäröivän ikosaedrin sisällä. Pisteen P paikan tasossa määrittävät sen karteesisten eli suorakulmaisten koodinaattien (x, y) lisäksi myös P:n napakoordinaatit (r, ϕ), missä (vrt. Kuva 1.16) −−→ • r = radiusvektori (= vektorin OP pituus), −−→ • ϕ = vaihekulma (= positiivisen xakselin ja vektorin OP välinen kulma).
Luonnollisesti vaaditaan r ≥ 0. Trigonometristen funktioiden määrittelyn nojalla voidaan kirjoittaa kartee-
sisten koordinaattien ja napakoordinaattien väliset muunnoskaavat: p ( r = x2 + y 2 , x = r cos ϕ , tan ϕ = y , x 6= 0 . y = r sin ϕ , x
Edellä esiintyvä tan ϕ ei vielä tietenkään määritä kulmaa ϕ yksikäsitteisesti. Lisäksi on otettava huomioon koordinaattien x ja y merkit, ts. neljännes, johon kyseinen piste (x, y) sijoittuu.
51
y P = (x, y)
PSfrag repla ements
r
ϕ x
Kuva 1.16: Napakoordinaatit
Lopuksi tarkastellaan trigonometristen funktioiden käyttöä kompleksilukujen yhteydessä. Kompleksilukua z = x + yi, missä i2 = −1 ja x, y ∈ R, vastaa sen geometrisessa esityksessä xy -tason piste (x, y). Mer-
kitään tämän pisteen napakoordinaatteja (r, ϕ), jolloin x = r cos ϕ ja y = r sin ϕ, missä r ≥ 0 ja ϕ yksikä-
sitteisyyden saavuttamiseksi jollakin sovitulla 2π -mittaisella välillä esimerkiksi 0 ≤ ϕ < 2π tai −π < ϕ ≤ π . Nyt z tulee muotoon
z = r(cos ϕ + i sin ϕ).
Tätä sanotaan kompleksiluvun polaariseksi esitysmuodoksi. Aikaisemman nojalla |z| =
p p x2 + y 2 = (r cos ϕ)2 + (r sin ϕ)2 = r ≥ 0.
Vastinpisteen vaihekulmaa ϕ sanotaan kompleksiluvun z argumentiksi ja merkitään arg z . Käyttäen polaarista esitysmuotoa saadaan kompleksilukujen tulolle ja osamäärälle uudet tulkinnat. Lukujen zk = rk (cos ϕk + i sin ϕk ), missä k = 1, 2, tulolle saadaan sinin ja kosinin summakaavojen avulla muoto z1 z2 = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )),
joten |z1 z2 | = |z1 ||z2 |
ja
arg(z1 z2 ) = arg z1 + arg z2 .
Vastaavasti saadaan z1 |z1 | = z2 |z2 |
ja
arg
z1 z2
= arg z1 − arg z2 ,
kun z2 6= 0 .
Edellisissä kaavoissa ajatellaan argumentit luonnollisesti redusoiduiksi sovitulle vaihekulmavälille lisäämällä tai vähentämällä sopiva täyden kierroksen 2π monikerta. Tämä kahden kompleksiluvun tulon polaariesityksen kaava on yleistettävissä induktiolla muotoon z1 z2 · · · zn = r1 r2 · · · rn (cos(ϕ1 + ϕ2 + · · · + ϕn ) + i sin(ϕ1 + ϕ2 + · · · + ϕn )),
missä zk = rk (cos ϕk + i sin ϕk ), k = 1, 2, . . . , n. Jos tässä valitaan z1 = z2 = · · · = zn = cos ϕ + i sin ϕ, saadaan Moivren kaava
(cos ϕ + i sin ϕ)n = cos(nϕ) + i sin(nϕ) ,
52
missä n = 1, 2, . . .
Tämä kaava voidaan todistaa induktiolla suoraankin ja tulos on voimassa myös, kun n = 0, ±1, ±2, . . .
1.6.3
Arkusfunktioista
Trigonometristen funktioiden käänteisfunktioita sanotaan arkusfunktioiksi tai syklometrisiksi funktioiksi. Aikaisemmin esitetyn mukaisesti voidaan käänteisfunktio muodostaa vain bijektiiviselle funktiolle. Täten trigonometristen funktioiden yhteydessä on rajoituttava sopiviin väleihin, joissa tarkasteltava funktio on aidosti monotoninen. Funktio h π πi f: − , → [−1, 1] , f (x) = sin x 2 2
on aidosti kasvava, joten sillä on käänteisfunktio
h π πi f −1 : [−1, 1] → − , , f −1 (x) = arcsin x , 2 2
joka myös on aidosti kasvava. Käänteisfunktion ominaisuuksien mukaan jos x ∈ [−π/2, π/2] ja y ∈ [−1, 1],
niin
y = sin x ⇔ x = arcsin y ,
eli toisin esitettynä arcsin(sin x) = x , sin(arcsin y) = y .
Vastaavasti aidosti vähenevällä funktiolla f : [0, π] → [−1, 1] , f (x) = cos x
on aidosti vähenevä käänteisfunktio f −1 : [−1, 1] → [0, π] , f −1 (x) = arccos x .
Samalla tavalla rajoittamalla tan x välille (−π/2, π/2) ja cot x välille (0, π) saadaan π π arctan x : R → (− , ) , 2 2 ar
ot x : R → (0, π) .
Tarkastellaan vielä kulmien arcsin x ja arccos x välistä yhteyttä. Merkitään y = sin x = cos(π/2 − x). Jos
nyt x ∈ [−π/2, π/2], niin π/2 − x ∈ [0, π] ja siis x = arcsin y ja π/2 − x = arccos y , joten arcsin y + arccos y =
π , 2
∀y ∈ [−1, 1] .
Tämä yhteys on näkyvissä myös arkussinin ja arkuskosinin kuvaajissa (vrt. Kuva 1.17)
53
y
π/2 y π
π/3
5π/6
π/6
PSfrag repla ements
-1
2π/3
PSfrag repla ements x 1 0.5
-0.5
π/2
−π/6
π/3
−π/3
π/6
−π/2 -1
-0.5
0.5
1
x
Kuva 1.17: Arkussinin (vasemmalla) ja arkuskosinin (oikealla) kuvaajat
Tangentin kuvaajasta katsoen vakuuttaudumme helposti siitä, että välillä x ∈ (−π/2, π2) funktio tan x
on kasvava ja saa arvoikseen kaikki reaaliluvut. Näin ollen sille voidaan vastaavasti määritellä kaikkialla kasvava käänteisfunktio arctan : R → (−π/2, π2) asettamalla arctan x = y ⇔ tan y = x, ja −π/2 < y < π/2.
Kuvassa 1.18 on hahmoteltu arkustangentin kuvaaja. Huomaa, että kuvaaja on kokonaisuudessaan suorien y = π/2 ja y = −π/2 välissä. Kun x on itseisarvoltaan suuri ja positiivinen, niin arkustangentin kuvaaja
on kohdassa x varsin lähellä vaakasuoraa y = π/2. Vastaavasti itseisarvoltaan suuren negatiivisen luvun arkustangentti on lähellä lukua −π/2. Käsittelemme tätä täsmällisemmin raja-arvojen yhteydessä.
54
y π/2
PSfrag repla ements
-4
-2
2
4
x
-π/2
Kuva 1.18: Arkustangentin kuvaaja
1.6.4
Hyperbeli ja areafunktioista
Määritellään eksponenttifunktiota käyttäen hyperbelifunktiot: hyperbelisini , hyperbelikosini , hyperbelitangentti, hyperbelikotangentti,
ex − e−x , 2 x −x e +e cosh x = , 2 sinh x ex − e−x tanh x = , = x cosh x e + e−x ex + e−x cosh x . = x coth x = sinh x e − e−x sinh x =
Voidaan osoittaa, että nämä funktiot liittyvät `yksikköhyperbeliin' x2 − y 2 = 1 samalla tavalla kuin
trigonometriset funktiot yksikköympyrään x2 + y 2 = 1. Tästä johtuen hyperbelifunktioilla on runsaasti ominaisuuksia, jotka muistuttavat trigonometristen funktioiden vastaavia ominaisuuksia. Tämä yhteys saa tarkemman selityksen myöhemmällä kurssilla Funktioteoria. Kuvassa 1.19 on esitetty funktioiden cosh x ja sinh x kuvaajat. Hyperbelikosinin kuvaajaa kutsutaan usein ketjukäyräksi, koska suhteellisen alkeellisella fysiikalla voidaan osoittaa, että kuormittamaton, tasalaatuinen, päistään kiinnitetty ketju tai vaijeri asettuu homogeenisessa painovoimakentässä tämän käyrän osan muotoiseksi (kun mittayksiköt valitaan sopivasti). Seuraavassa luetellaan todistuksetta hyperbelifunktioiden joitakin perusominaisuuksia. Vertaa näitä trigonometristen funktioiden summakaavoihin, kaksinkertaisen kulman kaavoihin jne.
55
y
3
2
1
-2
-1
1
2
x
-1
-2
PSfrag repla ements
-3
Kuva 1.19: Hyperbelikosinin (musta) ja hyperbelisinin (harmaa) kuvaajat
cosh2 x − sinh2 x = 1,
1 , cosh2 x 1 1 − coth2 x = − , sinh2 x sinh(x + y) = sinh x cosh y + cosh x sinh y,
1 − tanh2 x =
cosh(x + y) = cosh x cosh y + sinh x sinh y, sinh 2x = 2 sinh x cosh x, cosh 2x = cosh2 x + sinh2 x = 1 + 2 sinh2 x = 2 cosh2 x − 1.
Hyperbelifunktioiden käänteisfunktioita sanotaan areafunktioiksi. Funktioiden sinh x, tanh x ja coth x on helppo nähdä olevan injektioita, joten niillä on normaaliin tapaan käänteisfunktiot arsinh x, artanh x ja arcoth x. Sen sijaan cosh x ei ole injektio, mutta ottamalla määrittelyjoukoksi [0, ∞) siitä saadaan bijektio
ja siis edelleen käänteisfunktio arcosh x joukolta [1, ∞) joukolle [0, ∞).
Koska hyperbelifunktiot määritellään eksponenttifunktion avulla, on odotettavissa, että areafunktiot voi-
56
daan lausua logaritmifunktion avulla. p arsinh x = ln x + x2 + 1 , ∀x ∈ (−∞, ∞) , p arcosh x = ln x + x2 − 1 , ∀x ∈ [1, ∞) , 1+x 1 ln , 2 1−x 1 x+1 arcoth x = ln , 2 x−1
∀x ∈ (−1, 1) ,
artanh x =
Esimerkki 1.79.
∀x ∈ (−∞, −1) ∪ (1, ∞) .
Johda hyperbelisinin käänteisfunktion esitetty lauseke.
Ratkaisu. On ratkaistava yhtälö x = sinh y =
1 y e − e−y . 2
Muuttujan t = ey avulla kirjoitettuna yhtälö muuntuu toisen asteen yhtälöksi 1 1 x= t− 2 t 1 2 ⇔ tx = (t − 1) 2 2 ⇔ t − 2xt − 1 = 0.
√ √ Toisen asteen yhtälön ratkaisukaavasta näemme, että tällä on ratkaisut t = x + x2 + 1 ja t = x − x2 + 1. √ Koska aina x2 + 1 > |x|, jälkimmäinen ratkaisu on negatiivinen. Se ei tule kysymykseen, koska t = ey > 0.
Samasta syystä taas ensimmäinen ratkaisu on positiivinen ∀x ∈ R. Siis p y = ln t = ln x + x2 + 1 .
57
Luku 2
Lukujono ja sen raja-arvo 2.1 Rajoitetut lukujoukot, supremum ja inmum Ennen siirtymistä raja-arvoihin esittelemme eräitä järjestysrelaatioon (≤) liittyviä käsitteitä.
Määritelmä 2.1.
Olkoon S joukko reaalilukuja. Sanomme, että x on joukon S suurin alkio = max S , jos
molemmat seuraavat ehdot toteutuvat (i) x ∈ S , ja (ii) ∀y ∈ S : x ≥ y. Vastaavasti määritellään pienin alkio = min S korvaamalla yllä kohdassa (ii) relaatio ≥ relaatiolla ≤. Kaikilla lukujoukoilla ei suurinta tai pienintä alkiota ole olemassa.
Esimerkki 2.2.
Osoita, että välillä S = (0, 1) ei ole suurinta alkiota.
Ratkaisu. Tehdään vastaoletus, että suurin alkio olisi sittenkin olemassa, ja osoitetaan, että tämä johtaa ristiriitaan. Oletetaan siis, että x olisi etsitty suurin alkio. Koska x ∈ S , niin 0 < x < 1. Näin ollen
1 < 1 + x < 2. Jakamalla tämä epäyhtälö kahdella saamme 0 < 1/2 < (1 + x)/2 < 1. Näin ollen (1 + x)/2 ∈ S .
Toisaalta epäyhtälöstä x < 1 seuraa myös epäyhtälö 2x = x + x < 1 + x. Jakamalla tämä epäyhtälö kahdella
saamme epäyhtälön x < (1 + x)/2. Siis x ei ollutkaan joukon S suurin luku, ja vastaväite on näin kumottu.
Esimerkki 2.3. alkio?
Jos S ⊂ R on äärellinen epätyhjä joukko, niin perustele, miksi sillä on aina suurin ja pienin
Ratkaisu. Suurin (tai pienin) alkio löydetään valitsemalla ensin jokin alkio `ehdokkaaksi'. Käydään sitten muut alkiot läpi, verrataan niitä ehdokkaaseen, ja vaihdetaan vertailun tuloksen perusteella tarvittaessa ehdokas suuremmaksi (pienemmäksi) alkioksi. Koska alkioita on vain äärellinen määrä, vertailuprosessi päättyy joskus. Siinä vaiheessa jäljellä oleva ehdokas on välttämättä suurin (pienin) alkio.
58
Jotta saisimme tarkemman mielikuvan reaalilukujen ja rationaalilukujen joukkojen välisestä erosta, tarkastelemme seuraavaksi reaalilukujoukkojen ylä- ja alarajoja. Seuraava luonnollinen määritelmä vie meitä eteenpäin.
Määritelmä 2.4.
Olkoon S jokin joukko reaalilukuja. Sanotaan, että luku M ∈ R on joukon S yläraja, jos
se on suurempi tai yhtä suuri kuin mikä tahansa joukon S alkio, eli ∀ x ∈ S : M ≥ x.
Sanotaan, että joukko S on ylhäältä rajoitettu, jos sillä on jokin yläraja. Vastaavasti, jos ∀ x ∈ S : m ≤ x,
niin sanotaan, että m on joukon S alaraja, ja joukkoa S , jolla on jokin alaraja, kutsutaan alhaalta rajoitetuksi. Joukkoa S kutsutaan rajoitetuksi, jos se on sekä alhaalta rajoitettu että ylhäältä rajoitettu.
Esimerkki 2.5.
(i) Luku 4 on joukon {0, 1, 2} eräs yläraja, ja joukon {4, 5, 6} eräs alaraja.
(ii) Mikä tahansa luku kelpaa tyhjän joukon ylärajaksi ja alarajaksi! (iii) Jos joukko S on ylhäältä rajoitettu, niin joukko −S = {−x | x ∈ S}
on alhaalta rajoitettu, sillä x ≤ M ⇔ −M ≤ −x. (iv) Joukko N on alhaalta rajoitettu, mutta ei ylhäältä rajoitettu. Alarajaksi käy esimerkiksi −5. (v) Joukko Z ei ole alhaalta rajoitettu eikä ylhäältä rajoitettu. (vi) Avoin väli (−1, 3) on rajoitettu. Eräs alaraja on −7 ja eräs yläraja 11. Samoin mikä tahansa reaalilukuväli, jolla ∞ ei esiinny välin `reunana', on rajoitettu.
Esimerkki 2.6.
Olkoon S alhaalta rajoitettu epätyhjä joukko. Oletamme lisäksi, että kaikki joukon S alkiot
ovat kokonaislukuja. Osoita, että joukolla S on aina pienin alkio.
Ratkaisu. Tiedämme, että joukolla S
on jokin alaraja m. Kiinnitetään jokin alkio n0 ∈ S . Tällainen alkio
on olemassa, koska joukko S ei ollut tyhjä. Tutkitaan joukkoa
V = {n ∈ Z | n ∈ S, n ≤ n0 },
jossa on mukana ne joukon S alkiot n, jotka ovat pienempiä tai yhtä suuria kuin äsken valittu n0 . Koska V ⊆ S , niin m on myös joukon V alaraja. Näin ollen jokainen joukon V alkio n ∈ [m, n0 ]. Tällä välillä on vain
äärellisen monta kokonaislukua. Lisäksi n0 ∈ V , joten V on epätyhjä. Edellisen esimerkin nojalla joukolla V
on siis pienin alkio m0 . Tämä luku m0 on myös joukon S pienin alkio. Jos nimittäin n ∈ S , niin joko n ≤ n0
tai n > n0 . Edellisessä tapauksessa n ∈ V ja siis m0 ≤ n. Jälkimmäisessä tapauksessa taas m0 ≤ n0 < n, ja
siis m0 < n.
59
Esimerkki 2.7.
Oletetaan, että f on koko reaalisuoralla määritelty kasvava funktio, ja että M on joukon
S ⊂ R yläraja. Osoita, että tällöin luku f (M ) on kuvajoukon f (S) = {f (x) | x ∈ S}
yläraja.
Ratkaisu. Olkoon y jokin kuvajoukon f (S) alkio. Tällöin on olemassa sellainen luku x ∈ S , että y = f (x).
Koska M on joukon S yläraja, niin x ≤ M . Koska f on kasvava, niin y = f (x) ≤ f (M ). Koska y oli joukon f (S) mielivaltainen alkio, niin väite on todistettu.
Tulemme näkemään, että analyysin koneiston kannalta on usein tärkeää, että voimme löytää ylä- tai alarajojen joukosta parhaimman mahdollisen. Tätä varten tarvitaan toinen määritelmä.
Määritelmä 2.8.
Jos reaalilukujen joukko S on ylhäältä rajoitettu ja jos on olemassa luku M ∈ R, joka
on joukon S pienin yläraja, niin sanomme lukua M joukon S supremumiksi. Käytetään merkintää M = sup S.
Jos vastaavasti joukko S on alhaalta rajoitettu ja jos on olemassa luku m ∈ R, joka on joukon S suurin alaraja, niin sanomme lukua m joukon S inmumiksi. Käytetään merkintää m = inf S.
Jos siis S on ylhäältä rajoitettu epätyhjä joukko, niin M = sup S toteuttaa ehdot (i) M = sup S on joukon S yläraja, ja (ii) Jos x on mikä tahansa joukon S yläraja, niin M ≤ x. Tästä näemmekin heti, että vaikka joukolla S usein on useita eri ylärajoja, supremumeja sillä on enintään yksi. Jos nimittäin sekä M1 että M2 toteuttavat joukon S supremumilta vaaditut ehdot, on niiden molempien oltava joukon S ylärajoja ehdon 1 nojalla. Soveltamalla ehtoa 2 supremumiin M1 ja ylärajaan M2 saamme epäyhtälön M1 ≤ M2 . Soveltamalla ehtoa 2 supremumiin M2 ja ylärajaan M1 saamme käänteisen epäyhtälön M2 ≤ M1 . Nämä voivat olla samanaikaisesti tosia vain, jos M1 = M2 .
Alhaalta rajoitetun joukon S inmumilla on vastaavasti ominaisuudet
(i) m = inf S on joukon S alaraja, ja (ii) Jos x on mikä tahansa joukon S alaraja, niin m ≥ x. Reaalilukujen joukon täsmällisen konstruktion eräs tärkeä seuraus on niin sanottu täydellisyys. Tämä ilmaistaan seuraavassa lauseessa. Se todistetaan reaalilukujen konstruoinnin yhteydessä, joten tällä kurssilla käsittelemme sitä aksioomana, eli oletamme, että käyttämällämme reaalilukujen joukolla on tämä ominaisuus. Tilanne on tietenkin loogisesti epätyydyttävä, mutta korjaantuu aikanaan. 60
Lause 2.9. (Täydellisyysaksiooma) Jokaisella reaalilukujen joukon R epätyhjällä ja ylhäältä rajoitetulla joukolla S on supremum sup S ∈ R.
Seuraus 2.10.
Jos S on epätyhjä alhaalta rajoitettu reaalilukujen joukko, niin on olemassa inf S ∈ R.
Todistus. Selvästi luku −M on joukon S inmum silloin ja vain silloin, kun M on joukon −S = {−x | x ∈ S}
supremum. Helposti nähdään, että tässä joukko −S on epätyhjä ja ylhäältä rajoitettu, joten täydellisyysaksiooman nojalla luku M = sup(−S) on olemassa. Täten −M = inf S .
Seuraus 2.11.
(Arkhimedeen Lemma) Jos ε > 0, niin on olemassa sellainen luonnollinen luku n, että
nε > 1.
Todistus. Tarkastellaan epätyhjää joukkoa S = {nε | n ∈ N}.
Jos vaadittua lukua ei ole olemassa, niin tällöin (vasta-oletus) joukko S on ylhäältä rajoitettu, koska 1 on sen yläraja. Olkoon sitten M = sup S . Koska M − ε < M , ja M oli joukon S pienin yläraja, voimme päätellä,
että M − ε ei ole joukon S yläraja. Näin ollen on olemassa sellainen luonnollinen luku n, että nε > M − ε.
Tällöin (n + 1)ε > M . Koska n + 1 ∈ N seuraa tästä, että M ei ollutkaan joukon S yläraja. Tämä on ristiriita.
Jos joukolla S on suurin alkio (erityisesti siis jos S on äärellinen), niin tämä suurin alkio on ilman muuta myös supremum. Vastaavasti pienin alkio (jos sellainen on olemassa) on aina myös inmum, esimerkiksi sup{1, 3, 4} = 4
Esimerkki 2.12.
ja
inf{1, 3, 4} = 1.
Osoitetaan, että jos S on avoin väli (0, 1), niin inf S = 0 ja sup S = 1.
Ratkaisu. Selvästi luku 0 on joukon S alaraja. Olkoon sitten x jokin muu joukon S alaraja. Voisiko x olla positiivinen? Ei, sillä jos 0 < x, niin 0 < x/2 < x, joten m = min{x/2, 1/2} kuuluu joukkoon S . Koska ei ole x ≤ m, vaikka m ∈ S , niin x ei voi olla joukon S alaraja. Näin ollen x ≤ 0 ja siis 0 on suurin alaraja.
Samoin nähdään, että 1 on joukon S pienin yläraja. Jos nimittäin x on jokin joukon S yläraja, niin ei
voi olla x < 1, sillä tällöin x
0} n
supremum ja inmum. 61
Ratkaisu. Luku 1 = 1/1 on joukon S suurin alkio, joten se on myös sup S . Joukolla S ei kuitenkaan ole pienintä alkiota, koska n voidaan valita mielivaltaisen suureksi, jolloin 1/n tulee `mielivaltaisen pieneksi', mutta pysyy kuitenkin positiivisena. Todistetaankin, että 0 = inf S . Koska joukon S alkiot ovat kaikki positiivisia, on 0 selvästi alaraja. Mikään luku x > 0 ei voi olla joukon S alaraja, sillä Arkhimedeen lemman nojalla tällöin on olemassa sellainen luonnollinen luku n0 , että n0 x > 1. Jakamalla tämä puolittain positiivisella luvulla n0 saadaan x > 1/n0 . Näin ollen x ei ollutkaan joukon S alaraja, koska sieltä löytyi sitä pienempi luku 1/n0 .
Esimerkki 2.14.
Osoita, että Esimerkin 2.7 ylärajoja koskevaa tulosta ei voida yleistää koskemaan supre-
mumia, eli osoita, että väite: `kasvava funktio kuvaa joukon supremumin kuvajoukon supremumiksi' on epätosi.
Ratkaisu. On annettava (vasta)esimerkki sellaisesta kasvavasta funktiosta f
ja sellaisesta joukosta S ⊂ R,
joille M = sup S , mutta f (M ) 6= sup f (S). Tämä jätetään joko luentoesimerkiksi tai harjoitustehtäväksi. Opastuksena paljastan, että Esimerkin 1.61 funktio sopii funktioksi f kunhan joukko S valitaan sopivasti,
ks. myös Esimerkki 3.29. Täydellisyysaksiooma on se ominaisuus, joka tietyssä mielessä pakottaa meidät analyysissa käyttämään reaalilukuja rationaalilukujen asemesta, sillä kohta näytämme, että rationaalilukujen joukko ei toteuta täydellisyysaksioomaa. Jokainen epätyhjä rajoitettu rationaalilukujen joukko on toki rajoitettu myös reaalilukujen joukkona, ja sillä on siis olemassa supremum, mutta mikään ei takaa sitä, että kyseinen supremum olisi rationaaliluku. Täydellisyysaksiooma siis viime kädessä takaa sen, että `reaalilukujen lukusuorassa ei ole aukkoja'. Otetaan tästä esimerkkinä seuraava tulos, joka kertovat, että `neliöjuuri 2 on olemassa' reaalilukujen joukossa. Aikaisemmin jo näimme (Esimerkki 1.13), ettei yhtälöllä x2 = 2 ole ratkaisua rationaalilukujen joukossa.
Esimerkki 2.15.
On olemassa sellainen reaaliluku M > 0, että M 2 = 2.
Todistus. Tarkastellaan joukkoa S = {x ∈ R+ | x2 < 2}.
Joukko S ei ole tyhjä, sillä esimerkiksi 1 ∈ S . Todetaan ensin, että S on ylhäältä rajoitettu. Jos nimittäin
x > 3, niin Esimerkin 1.62 nojalla x2 > 32 = 9 > 2, joten x ∈ / S . Täten 3 on joukon S eräs yläraja. Näin
ollen täydellisyysaksiooman nojalla on olemassa M = sup S . Osoitamme, että M on etsitty luku. Tehdään vastaoletus, jonka mukaan M 2 6= 2. Koska 1 ∈ S , niin joka tapauksessa 3 ≥ M ≥ 1.
Oletetaan ensin, että M 2 < 2. Tällöin siis y = 2 − M 2 > 0. Koska M ≥ 1 saadaan M 2 ≥ 1, ja edelleen
y ≤ 1. Tutkitaan lukua x = M + y/20. Nyt
x2 = M 2 + yM/10 + y 2 /400 = M 2 + y
62
M y + 10 400
.
Koska M ≤ 3, niin tässä M/10 < 1/2. Samoin koska y ≤ 1, niin y/400 < 1/2, joten yo. suluissa oleva lauseke < 1. Näin ollen
x2 < M 2 + y = 2,
joten x ∈ S . Toisaalta x > M , joten M ei voi tällöin olla joukon S yläraja. Tämä on ristiriita.
Oletetaan sitten, että M 2 > 2. Nyt z = M 2 − 2 > 0. Tutkitaan tällä kertaa lukua x = M − z/(2M ).
Koska M > 0, z > 0, niin x < M . Nyt x2 = M 2 − 2M
z z 2 z 2 z 2 + = M2 − z + =2+ > 2. 2M 2M 2M 2M
Jos sitten y ∈ S , niin y > 0 ja on oltava y ≤ x. Jos nimittäin olisikin y > x > 0, niin Esimerkin 1.62 nojalla
y 2 > x2 > 2, mikä on ristiriidassa joukon S määritelmän kanssa. Täten myös x on joukon S yläraja. Koska x < M , niin M ei voinutkaan olla pienin yläraja.
Olemme sulkeneet pois vaihtoehdot M 2 > 2 ja M 2 < 2. Ainoa jäljelle jäävä mahdollisuus on M 2 = 2. Mitä ihmettä tässä oli todistamista? Taskulaskinhan antaa neliöjuuri kahden likiarvoja. Mitä parempi taskulaskin tai tietokone, sen tarkempi! Mikä tässä oikein oli epäselvää? Paremmat ja paremmat likiarvot sisältävät tosiaan enemmän ja enemmän oikeita desimaaleja. Esimerkiksi 1,42 = 1,96 ja 1,4142 = 1,999396 jne. Mutta huomaat, että tässä samalla myös 'väärien' desimaalien määrä kasvaa. Ei ole ollenkaan selvää, että olisi olemassa sellainen päättymättömän desimaaliluku, jonka neliössä ei olisi yhtään virheellistä desimaalia. Suurin vaikeus tässä tosin liittyy siihen, mitä päättymättömällä desimaaliluvulla (eli reaaliluvulla) lopulta tarkoitamme. Täydellinen selvyys saa siis odottaa myöhempää kurssia, jolla reaaliluvut konstruoidaan huolellisesti. Täydellisyyden todellinen merkitys on siinä, että sen avulla voimme kehittää teoriaa eteenpäin, ja sangen pienestä määritelmien joukosta liikkeelle lähtien täsmällisesti todistaa useita esimerkiksi jatkuvien funktioiden ominaisuuksia, jotka koulukursseissa vain perustellaan visuaaliseen mielikuvaan vedoten. Tämä on analyysin ydinidea. Se, että syntyvällä teorialla on sitten sovelluksia laaja-alaisesti johtunee suurelta osin, että valitut määritelmät hyvin vastaavat mainittuja visuaalisia mielikuvia.
2.2 Lukujonon raja-arvo Sanaa jono käytetään matematiikassa varsin samanlaisessa merkityksessä kuin yleiskielessä. Verrattuna joukkoon on jonossa lisäominaisuutena alkioiden järjestys. Täsmällisemmin esitettynä reaalilukujono määritellään funktiona f : Z+ → R. Kun tässä merkitään f (n) = an ja luetellaan järjestyksessä lukujen 1, 2, 3, . . . , n, . . .
kuvat, saadaan jono muotoon a1 , a2 , a3 , . . . , an , . . . Tätä merkitään lyhyesti (an ) tai (an )∞ n=1 . Lukua an sanotaan lukujonon n:nneksi jäseneksi. Keskeinen kysymys lukujonon yhteydessä on tarkastella millaisia jäseniä jonossa esiintyy, kun siirrytään
yhä kauemmas jonon alusta, ts. miten an käyttäytyy indeksin n tullessa hyvin suureksi.
63
3
2.04
2.5
2.02
4
2
PSfrag repla ements
6
8
10
n
2.004
2.002
102 104 106 108 110
1.5
1.98
1
PSfrag repla ements 1.96
n
1002 1004 1006 1008 1010
n
1.998
PSfrag repla ements
1.996
Kuva 2.1: Lukujonon 2n/(n + 1) jäseniä
Esimerkki 2.16.
Tarkastellaan jonoa (an ), missä an = 2n/(n + 1). Jonon alkupäässä ovat tällöin jäsenet
1, 4/3, 3/2, 8/5, 5/3, . . . Jonoa voidaan havainnollistaa joko tasossa (Kuva 2.1) tai lukusuoralla. Laskemalla
jonon (an ) myöhempiä jäseniä, esim. a99 = 1,98, a999 = 1,998, . . . huomataan, että jonon jäsenet näyttävät `lähestyvän' arvoa 2 indeksin n kasvaessa rajatta. Edellisen esimerkin ajatukset ilmaistaan täsmällisesti seuraavassa määritelmässä:
Määritelmä 2.17.
Luku A on lukujonon (an ) raja-arvo, jos jokaista positiivilukua ε (miten pientä tahansa)
kohti on olemassa sellainen n(ε) ∈ R, että n > n(ε) ⇒ |an − A| < ε.
Tällöin sanotaan jonon (an ) suppenevan (eli konvergoivan) ja merkitään lim an = A
n→∞
n→∞
(tekstin lomassa kirjoitetaan limn→∞ an = A, tai lyhyemmin lim an = A, tai an → A, tai an −→ A). Jos jono (an ) ei suppene sen sanotaan hajaantuvan (eli divergoivan).
Lukujonon suppenevuusehto voidaan kvanttoreita käyttäen esittää lyhyessä muodossa lim an = A ⇔ (∀ε > 0)(∃n(ε) ∈ R) (n > n(ε), n ∈ Z+ ⇒ |an − A| < ε) .
n→∞
Esimerkki 2.18.
Palataan Esimerkin 2.16 lukujonoon (an ) ja osoitetaan nyt täsmällisesti että lim an = 2.
Ratkaisu. Olkoon ε > 0. Tällöin on 2n − 2(n + 1) 2n = 2 < ε, − 2 = |an − 2| = n+1 n+1 n+1
64
∀n >
2 − 1. ε
Näin tulos on todistettu, sillä olkoonpa ε miten pieni positiiviluku tahansa, niin sitä kohti löytyi sellainen n(ε) = 2/ε − 1 ∈ R, että aina kun n > n(ε), niin |an − 2| < ε. (Jos esimerkiksi ε = 0,1 , niin n(ε) = 19, ε = 0,01 , niin n(ε) = 199, jne) Raja-luvun n(ε) suuruus riippuu yleensä toleranssin ε suuruudesta siten, että
mitä pienempi ε > 0 on sitä suuremmaksi n(ε) tulee. Määritelmässä esiintyvä n(ε) ei ole yksikäsitteinen. Erityisesti ei siis tarvitse välttämättä löytää pienintä mahdollista rajalukua n(ε), vaan riittää löytää jokin n(ε), joka toteuttaa määritelmän ehdon. Laskutoimituksia voidaan tällä tavalla usein yksinkertaistaa ja
esimerkiksi edellinen tarkastelu saadaan muotoon |an − 2| = · · · =
Lause 2.19.
2 2 < < ε, n+1 n
∀n >
2 . ε
Jos jonolla (an ) on raja-arvo, niin tämä raja-arvo on yksikäsitteisesti määrätty.
Todistus.
Tehdään vastaoletus, että jonolla (an ) on kaksi raja-arvoa A ja B , missä A < B . Raja-arvon B−A . Siten on olemassa määritelmässä esiintyvä ehto on erityisesti voimassa, kun ε:lla on arvo ε1 = 2 sellaiset rajaluvut n1 ja n2 , että |an − A| < ε1 , ∀n > n1 , |an − B| < ε1 ,
∀n > n2 .
Jos nyt n > max{n1 , n2 } , niin molemmat edellisistä epäyhtälöistä ovat voimassa. Tämä johtaa kolmioepäyh-
tälöä käyttäen ristiriitaan seuraavasti:
B − A = |B − an + an − A| ≤ |B − an | + |an − A| < ε1 + ε1 = B − A.
Jos jonosta (an ) jätetään pois jäseniä siten, että jäljelle jää (ääretön) jono an1 , an2 , an3 , . . . , ank , . . . ,
niin tätä jäljelle jäävää jonoa sanotaan jonon (an ) osajonoksi. Kyseessä on siis lukujono (bk ), missä bk = ank (k = 1, 2, 3, . . .). Jos alkuperäinen jono (an ) suppenee kohti raja-arvoa A, niin silloin indeksin n erääs-
tä arvosta lähtien luvut an poikkeavat A:sta vähemmän kuin ε:n verran. Tällöin selvästi myös osajonon (ank ) jäsenet poikkevat indeksin k eräästä arvosta lähtien A:sta vähemmän kuin toleranssin ε verran. Tämä
merkitsee, että myös osajono suppenee kohti samaa raja-arvoa A. Näin on perusteltu seuraava lause.
Lause 2.20.
Suppenevan jonon jokainen osajono suppenee kohti alkuperäisen jonon raja-arvoa.
Jonon hajaantuminen voidaan joskus perustella Lauseesta 2.20 epäsuoralla päättelyllä saatavalla seurauksella.
Seuraus 2.21.
Jos jonolla (an ) on kaksi osajonoa, joilla on eri raja-arvot (tai osajono, joka hajaantuu),
niin jono (an ) hajaantuu. 65
Huomautus 2.22.
(vaativampi, voit sivuuttaa) Eräänlaisen perustelun reaalilukujen täydellisyysaksioo-
malle (eli supremumin olemassaololle) saame soveltamalla Esimerkkiä 2.6 äärettömän monta kertaa. Olkoon siis S epätyhjä ylhäältä rajoitettu joukko reaalilukuja. Konstruoimme jonon lukuja M0 , M1 , M2 , . . .. Ideana on, että M0 tiukin sellainen joukon S yläraja, että M0 on kokonaisluku. Edelleen M1 on tiukin sellainen joukon S yläraja, että luvussa M1 on desimaalipilkun jälkeen enintään yksi desimaali, M2 tiukin sellainen yläraja, jossa pilkun jälkeen on enintään 2 desimaalia jne. Nämä luvut Mi , i ≥ 0 saadaan seuraavasti. Olkoon J0 joukon S ylärajojen joukko. Tämä on alhaalta
rajoitettu, sillä jos s ∈ S , niin s on joukon J0 eräs alaraja. Esimerkin 2.6 nojalla joukossa Z ∩ J0 on pienin
luku P0 , ja etsitty M0 = P0 . Luku Mi saadaan vastaavasti kaavasta Mi = Pi /10i , missä Pi on pienin alhaalta rajoitettuun joukkoon Ji = {10i x | x ∈ J0 }
kuuluva kokonaisluku. Helposti nähdään, että M0 ≥ M1 ≥ M2 ≥ . . .. Lisäksi nähdään, että kaikilla indeksin
i arvoilla Mi −Mi+1 < 10−i . Kun reaaliluvut lopulta konstruoidaan, tämä jo riittää osoittamaan, että jonolla (Mi ) on raja-arvo M . Tarkistamalla yksityiskohdat nähdään, että kyseinen raja-arvo täyttää kaikki joukon S supremumilta vaaditut ehdot.
Aiemmin käsitellyn Esimerkin 2.15 joukon S = {x ∈ R | x2 < 2}
tapauksessa näemme, että M0 = 2, M1 = 1,5, M2 = 1,42, M3 = 1,415, . . . ja jonon (Mi ) luvut lähestyvät √ raja-arvoa 2 ylhäältä päin siten, että oikeiden desimaalien lukumäärä aina kasvaa yhdellä.
2.3 Raja-arvojen laskusääntöjä Lukujonoa (an ) sanotaan rajoitetuksi, jos vastaava lukujoukko {an | n ∈ Z+ } on rajoitettu (Määritelmä 2.4),
ts.
∃C ∈ R+ :
Lause 2.23.
|an | ≤ C, ∀n ∈ Z+ .
Suppeneva lukujono on rajoitettu.
Todistus. Olkoon limn→∞ an
= A. Silloin raja-arvon määritelmän mukaan erityisesti (valittaessa ε = 1)
saadaan |an − A| < 1, kun n > n(1) ja vielä |an | = |an − A + A| ≤ |an − A| + |A| < 1 + |A| ,
∀n > n(1).
Täten joukko {an | n > n(1)} on rajoitettu. Tämän jälkeen jää enää tarkasteltavaksi äärellinen joukko {an | 1 ≤ n ≤ n(1)}. Jos nyt valitaan C :ksi luku
C = max |a1 | , |a2 | , . . . , an(1) , 1 + |A| ,
niin |an | ≤ C , ∀n ∈ Z+ ja näin väite on siis todistettu.
66
Lause 2.24.
Jos lim an = A = lim bn
n→∞
n→∞
ja an ≤ cn ≤ b n ,
∀n ≥ n0 ,
niin myös limn→∞ cn = A.
Todistus. Olkoon ε > 0. Ensimmäisen oletuksen perusteella on olemassa sellaiset rajaluvut n1 (ε) ja n2 (ε), että
n > n1 (ε) ⇒ |an − A|
< ε,
n > n2 (ε) ⇒ |bn − A|
< ε.
Jälkimmäisen oletuksen nojalla an − A ≤ cn − A ≤ bn − A ja siis edelleen |cn − A| ≤ max {|an − A| , |bn − A|} ,
kun n ≥ n0 . Jos nyt n > max {n1 (ε), n2 (ε), n0 }, niin yhdistämällä edelliset tulokset saadaan |cn − A| < ε ,
mikä todistaa väitteen. Ennen siirtymistä varsinaisiin raja-arvojen laskusääntöihin esitetään vielä todistuksia yksinkertaistava huomautus. Itse asiassa raja-arvon εehto (Määritelmä 2.17) voidaan esittää myös muodossa lim an = A ⇔ (∀ε > 0)(∃n(ε) ∈ R) (n > n(ε, n ∈ Z+ ⇒ |an − A| < kε) ,
n→∞
missä k on positiivinen vakio. Jos tässä nimittäin positiiviluku ε korvataan positiiviluvulla ε/k , palaudutaan alkuperäiseen muotoon. Olennaista on se, että vakio k ei riipu luvusta ε eikä indeksistä n. Kohtaamme useita päättelyitä, joissa esiintyy useita ε-suureita (esimerkiksi Lauseen 2.24 todistus). Koska kaikkikvanttorin yhteydessä väitämme jotakin kaikista positiivisista luvuista, meillä on lupa sijoittaa ko. muuttujan paikalle mikä tahansa positiiviseksi tiedetty luku. Esimerkiksi ε/2, jos ε on jostakin toisesta yhteydestä tunnettu positiivinen luku. Siltä varalta, että tämä tuntuu ensi alkuun hämmentävältä, esitän seuraavan lauseen ensimmäiselle tulokselle kaksi eri todistusta. Jälkimmäisessä käytän eri ε-suureita hyödyntäen sitä, että kaikkikvanttoriväitteessä muuttuja on aina korvattavissa toisella. Ensimmäinen on normaalin matemaattisen kirjoitustavan mukainen. Suosittelen, että luet ensin ensimmäisen todistuksen. Jos se tuntuu epäselvältä, yritä sitten jälkimmäistä todistusta. Mieti tarkasti sitä, miten ja mitä ε-muuttujia niissä käytetään. Tavoitteena on, että lopulta ymmärrät, että nämä ovat `yksi ja sama todistus' !! Voit siis tarvittaessa palata tähän kohtaan monistetta myöhemmin. Jatkossa käytetään vain ensimmäisen todistuksen lyhyemmin ilmaistua rakennetta.
Lause 2.25.
Jos limn→∞ an = A ja limn→∞ bn = B , niin lim (an + bn ) = A + B ,
n→∞
lim an bn = AB .
n→∞
67
Todistus. Olkoon ε > 0. Oletusten nojalla on olemassa sellainen n(ε) (kahdesta rajaluvusta suurempi, vrt. edellisen Lauseen todistus), että |an − A| < ε ja
Täten
|bn − B| < ε ,
∀n > n(ε).
|(an + bn ) − (A + B)| = |( an − A )+ (bn − B)|
mikä todistaa ensimmäisen väitteen.
≤ |an − A| + |bn − B| < ε + ε = 2ε ,
∀n > n(ε) ,
Jälkimmäistä väitettä varten kirjoitetaan an bn − AB = an bn − Abn + Abn − AB = (an − A) bn + A (bn − B) .
Tämän nojalla |an bn − AB| ≤ |an − A| |bn | + |A| |bn − B| .
Lauseen 2.23 perusteella on olemassa sellainen C ∈ R+ , että |bn | ≤ C , ∀n. Jos nyt n > n(ε), niin yhdistämällä edeltä saadaan
|an bn − AB| ≤ ε · C + |A| · ε = (C + |A|)ε ,
mikä todistaa kahden suppenevan lukujonon tuloa koskevan väitteen.
Todistus. (Sama päättely kahden suppenevan jonon summan tapauksessa yksityiskohtaisemmin esitettynä). Oletuksinamme on, että limn→∞ an = A ja että limn→∞ bn = B , ja väitämme, että limn→∞ (an + bn ) = A + B. Tämän todistaaksemme, meidän tulee osoittaa, että olipa ε > 0 miten pieni tahansa, jostakin rajasta n(ε) ∈ N alkaen on voimassa implikaatio n > n(ε) ⇒ |(an + bn ) − (A + B)| < ε.
Kiinnitämme todistuksen tässä vaiheessa suureelle ε > 0 jonkin arvon. Kirjoitamme oletuksemme ensin käyttäen kummallekin oletukselle omaa ε-suurettaan. Koska kyseinen muuttuja on universaalikvanttorin sulkema tämä on luvallista. Sitä paitsi koska jo
kiinnitimme luvun ε arvon, emme voi enää käyttää sitä
`vapaana muuttujana' muussa yhteydessä. Oletimme siis, että (∀εA > 0)(∃nA (εA ) ∈ N) (n > nA (εA ) ⇒ |an − A| < εA ) ,
sekä (∀εB > 0)(∃nB (εB ) ∈ N) (n > nB (εB ) ⇒ |bn − B| < εB ) .
Valitsemme sitten ensimmäisessä oletuksessa εA = ε/2. Koska tämä luku on positiivinen, ensimmäinen oletus kertoo, että on olemassa sellainen luku n1 = nA (εA ) = nA (ε/2), että implikaatio n > n1 ⇒ |an − A| < ε/2
68
on tosi. Seuraavaksi valitsemme toisessa oletuksessa εB = ε/2. Tämäkin luku on positiivinen, joten jonoa (bn ) koskeva oletuksemme kertoo, että on olemassa sellainen luku n2 = nB (εB ) = nB (ε/2), että implikaatio n > n2 ⇒ |bn − B| < ε/2
on tosi. Jos sitten määrittelemme uuden 'rajalukumme' n(ε) säännöllä n(ε) = max{n1 , n2 } = max{nA (ε/2), nB (ε/2)},
niin molemmat implikaatiot ovat tosia, ja kuten ensimmäisessä todistuksessa näemme kolmioepäyhtälön avulla todeksi implikaation n > n(ε) ⇒ |(an + bn ) − (A + B)| = |(an − A) + (bn − B)| ≤ |an − A| + |bn − B| < ε/2 + ε/2 < ε.
Koska tämä päättely onnistui muuttujan ε mielivaltaisella positiivisella arvolla, raja-arvotuloksemme on todistettu.
Seuraus 2.26.
Jos limn→∞ an = A, limn→∞ bn = B ja c ∈ R, niin lim c an = c A ,
n→∞
lim (an − bn ) = A − B .
n→∞
Todistus. Ensimmäinen väite seuraa Lauseen 2.25 tuloa koskevasta osasta, koska lim c = c. Erotusta koskeva tulos saadaan edellisiä kombinoimalla seuraavasti lim (an − bn ) = lim (an + (−bn )) = lim an + lim (−1)bn = A + (−1)B = A − B.
n→∞
n→∞
n→∞
n→∞
Osamäärän raja-arvosäännön todistamiseksi tarvitaan ensin seuraava aputarkastelu.
Lemma 2.27.
Jos limn→∞ an = A 6= 0, niin on olemassa sellainen rajaluku n0 (∈ Z+ ), että |an | >
|A| , 2
∀n > n0 .
Todistus. Koska A 6= 0, niin |A| > 0. Kun raja-arvon määritelmässä valitaan erityisesti ε = |A|/2, voidaan
todeta, että on olemassa sellainen rajaluku n0 , että |an − A|
n0 .
Jos siis n > n0 , niin |A| = |an − (an − A)| ≤ |an | + |an − A| < |an | +
ja vielä |an | > |A| −
69
|A| |A| = . 2 2
|A| 2
Lause 2.28.
Jos limn→∞ an = A ja limn→∞ bn = B 6= 0, niin lim
n→∞
Todistus. Koska B
an A = . bn B
6= 0, niin Lemman 2.27 nojalla on olemassa sellainen n0 , että |bn | > |B|/2 , ∀n > n0 .
Näillä n:n arvoilla siis erityisesti bn 6= 0, joten an /bn on määritelty. Edelleen voidaan kirjoittaa A an B − Abn an B − AB + AB − Abn (an − A)B + A(B − bn ) an − = = = bn B bn B bn B bn B
ja vielä
an A |an − A||B| + |A|B − bn | . bn − B ≤ |bn ||B|
Olkoon ε > 0. Oletuksen nojalla on olemassa sellainen luku n(ε) (jälleen kahdesta rajaluvusta suurempi), että
n > n(ε) ⇒ (|an − A| < ε
ja |bn − B| < ε) .
Käyttämällä lisäksi arviota |bn | > |B|/2 saadaan an 2(|A| + |B|) A ε|B| + |A|ε = < − ·ε, bn |B| B |B|2 |B| 2 kun n > max{n0 , n(ε)}, mikä todistaa väitteen.
Laskusäännöt siis kertovat, että raja-arvo noudattaa useita luonnollisia sääntöjä. Useat perusraja-arvot hoituvat nyt näiden avulla.
Esimerkki 2.29.
Arkhimedeen lemman (Lemma 2.11) nojalla limn→∞ 1/n = 0. Soveltamalla Lausetta 2.25
saadaan sitten muun muassa, että lim
n→∞
Esimerkki 2.30.
Määritä raja-arvo
1 = 0, n2
lim
n→∞
1 = 0. n3
2n2 + n . n→∞ 3n2 − 7n − 8 lim
Ratkaisu. Tämän tapaisten osamäärien raja-arvotarkastelussa usein otetaan ns. johtavan termin (eli termin, joka suurilla muuttujan n arvoilla kasvaa nopeimmin) määräämä, yleensä hieman keinotekoinen, yhteinen tekijä:
n2 2 + n1 2n2 + n = 3n2 − 7n − 8 n2 3 − n7 − n82
2 + n1 3 − n7 − n82 2+0 2 n→∞ → = . 3−7·0−8·0 3 =
Myös muut funktiot kuin peruslaskutoimituksien avulla määritellyt `kunnioittavat raja-arvoa' tässä mielessä. Otetaan yksi tätä valottava esimerkki. 70
Esimerkki 2.31.
Oletetaan, että limn→∞ an = 0. Osoita, että tällöin lim
n→∞
√
1 + an = 1.
Ratkaisu. Koska raja-arvotarkasteluissa emme hae kutakin toleranssia ε kohti pienintä mahdollista rajalukua n(ε), meillä on aina lupa olettaa, että indeksi n on jo riittävän suuri jonkin halutun arvion tekemiseksi. Tässä esimerkissä joudumme ilman muuta olettamaan, että n on tarpeeksi suuri, jotta olisi an ≥ −1. Muu√ tenhan ei neliöjuuri 1 + an olisi edes olemassa reaalilukuna. Oletamme siis tämän (mutta meillä ei esimerkiksi olisi lupaa olettaa an ≥ 0, koska on mahdollista, että jono (an ) lähestyy raja-arvoaan 0 negatiiviselta
puolelta). Muunnetaan tarkasteltavaa erotusta sopivasti laventamalla √ √ ( 1 + an − 1)( 1 + an + 1) √ √ | 1 + an − 1| = 1 + an + 1 √ 2 1+a − 12 n = √ 1 + an + 1 1 + an − 1 (pienennetään nimittäjää) = √ 1 + an + 1 |an | ≤ = |an |. 1
Kiinnitetään sitten ε > 0. Oletuksen mukaan jostakin rajaluvusta n(ε) alkaen sekä |an − 0| < ε että
myös aiemmin tekemämme oletus an ≥ −1 ovat molemmat voimassa. Yllä tehty arvio osoittaa, että täl√ löin | 1 + an − 1| < ε.
Voisimme johtaa vastaavia muotoa lim an = A ⇒ lim f (an ) = f (A) olevia sääntöjä muillekin funk√ tioille kuin edellisessä esimerkissä funktiolle f (x) = 1 + x. Kuten tulemme näkemään, tällaisen säännön paikkansapitävyys on ekvivalenttia funktion f jatkuvuuden kanssa. Käsittelemme tätä kolmannessa luvussa.
2.4 Monotoninen lukujono ja Neperin luku Määritelmä 2.32.
Reaalilukujonoa (an ) sanotaan kasvavaksi, jos a1 ≤ a2 ≤ a3 ≤ · · ·
ja aidosti kasvavaksi, jos a1 < a2 < a3 < · · · .
Vastaavasti määritellään vähenevä ja aidosti vähenevä jono. Yhteisnimitys em. jonoille on monotoninen ja aidosti monotoninen jono (vrt. monotoninen funktio). Jonon kasvavuus voidaan esittää myös ehdolla an+1 − an ≥ 0 ,
71
∀n ∈ Z+
ja edelleen positiivijäsenisessä jonossa ehdolla an+1 ≥1, an
Nyt esitetään
Lause 2.33.
∀n ∈ Z+ .
monotonisten lukujonojen peruslause.
Jos jono (an ) on kasvava ja ylhäältä rajoitettu, ts. a1 ≤ a2 ≤ a3 ≤ · · · ≤ M (= vakio),
niin jono suppenee ja limn→∞ an ≤ M .
Vastaavasti jos jono (an ) on vähenevä ja alhaalta rajoitettu, ts. a1 ≥ a2 ≥ a3 ≥ · · · ≥ m(= vakio),
niin jono (an ) suppenee ja limn→∞ an ≥ m. Tämän lauseen todistus vaatii täydellisyysaksiooman käyttöä, ja voit sen sivuuttaa ensimmäisellä lukukerralla.
Todistus. Käsitellään kasvavan ylhäältä rajoitetun jonon tapaus. Vähenevä alhaalta rajoitettu jono jätetään harjoitustehtäväksi. Tarkastellaan jonon alkioiden muodostamaa joukkoa J = {an |n ∈ N}.
Tämä joukko on oletusten perusteella sekä epätyhjä että ylhäältä rajoitettu, joten reaalilukujen täydellisyysaksiooman nojalla sillä on pienin yläraja A = sup J.
Väitämme, että itse asiassa lim an = A.
n→∞
Toteamme aluksi, että koska A on joukon J yläraja, epäyhtälö an ≤ A on voimassa kaikilla indeksin n arvoilla. Olkoon sitten ε > 0 mielivaltainen positiivinen reaaliluku. Tällöin A − ε < A. Koska A oli joukon J
pienin yläraja, voimme päätellä, että A − ε ei ole joukon J yläraja. Näin ollen löytyy sellainen indeksi n1 , että an1 > A − ε. Koska jono (an ) on kasvava, saamme epäyhtälöiden ketjun
A − ε < an1 ≤ an1 +1 ≤ an1 +2 ≤ · · · an1 +m ≤ · · · A.
Jos siis m > 0, niin an1 +m ∈ (A − ε, A]. Tämä tarkoittaa sitä, että indeksi n1 toteuttaa rajalle n(ε) asetetut vaatimukset, joten lim an = A. Koska lauseen väitteessä annettu luku M on joukon J eräs yläraja, ja A on pienin yläraja, saamme myös halutun epäyhtälön A ≤ M .
Esimerkki 2.34.
Määritellään lukujono (an ) käyttäen palautuskaavaa eli rekursiivisesti seuraavasti: a1 = 1
ja an+1 =
√ 2an + 3 , kun n = 1, 2, 3, . . .
Osoitetaan Lauseen 2.33 avulla, että jono suppenee. 72
Ratkaisu. Väite 1. Jono (an ) on kasvava, ts. an+1 ≥ an , kun n = 1, 2, 3, . . . √ Todistus. (Induktio.) Väite 1 on voimassa, kun n = 1, sillä a2 = 5 ≥ 1 = a1 . Jos oletetaan, että ak+1 ≥ ak , niin myös
ak+2 =
p √ 2ak+1 + 3 ≥ 2ak + 3 = ak+1 .
Väite 2. Jono (an ) on ylhäältä rajoitettu: an ≤ 3, kun n = 1, 2, 3, . . . Todistus. (Induktio.) Väite 2 on voimassa, kun n = 1, sillä a1 = 1 ≤ 3. Jos oletetaan, että ak
myös
ak+1 =
≤ 3, niin
√ √ 2ak + 3 ≤ 2 · 3 + 3 = 3.
Täten jono (an ) suppenee. Merkitään lim an = A. Tällöin palautuskaavasta saadaan A = lim an = lim an+1 = lim n→∞
n→∞
n→∞
√ √ 2an + 3 = 2A + 3.
Tästä seuraavan yhtälön ratkaisut löydämme seuraavasti: A=
√
A + 3 ⇒ A2 − 2A − 3 = 0 ⇒ A = 3taiA = −1.
Tarkistamalla näemme, että ainoa ratkaisu on A = 3. Täten lim an = 3. Seuraavaa tulosta tarvitaan usein; esimerkiksi kurssilla Analyysi II geometrisia sarjoja tutkittaessa. Sen todistaminen olisi helppoa käyttäen logaritmifunktion ominaisuuksia. Koska tarvitsemme tätä tulosta siellä myös eksponenttifunktion (ja myös logaritmifunktion) konstruointiin, perustelemme sen kehäpäättelyn välttämiseksi tässä yhteydessä käyttämättä apuna transkendenttisten funktioiden ominaisuuksia.
Esimerkki 2.35.
Olkoon q jokin ehdon |q| < 1 toteuttava reaaliluku. Tällöin lim q n = 0.
n→∞
Ratkaisu. Väite on ilmeinen, jos q = 0. Riittää käsitellä tapaus q > 0, sillä jos (−q)n → 0, niin myös qn → 0. Oletetaan siis, että 0 < q < 1, ja määritellään an = q n kaikille n ∈ N.
Selvästi kaikilla indeksin n arvoilla an > 0, joten jono (an ) on alhaalta rajoitettu. Edelleen, koska an > 0 ja
q < 1, niin an+1 = qan < 1 · an = an , joten jono (an ) on monotonisesti vähenevä. Näin ollen se monotonisten
jonojen peruslauseen nojalla suppenee kohti jotain raja-arvoa x = limn an . Jonon (an+1 ) = q(an ) raja-arvo
on Lauseen 2.25 nojalla = qx. Toisaalta jono (an+1 ) on jonon (an ) osajono, joten niillä on sama raja-arvo Lauseen 2.20 nojalla. Siis qx = x, eli (1 − q)x = 0. Koska 1 − q 6= 0 seuraa tästä, että raja-arvo x = 0. 73
Esimerkki 2.36.
Määrää raja-arvo
4n + 3n . n→∞ 5n + 2n lim
Ratkaisu. Otetaan jälleen määräävä termi yhteiseksi tekijäksi, ja käytetään edellisen Esimerkin tulosta. 4n + 3n 4n (1 + (3/4)n ) = n n n 5 +2 5 (1 + (2/5)n ) n 1 + (3/4)n 4 · = 5 1 + (2/5)n 1+0 n→∞ → 0· = 0. 1+0
Tässä viimeisessä vaiheessa sovellettiin Esimerkin 2.35 tulosta seuraavissa tilanteissa: q = 4/5, q = 3/4 ja q = 2/5.
Nyt siirrytään tarkastelemaan ns. Neperin lukua. Se määritellään jonon n 1 an = 1 + n raja-arvona. Jonon alkupää näyttää tällaiselta: a1 = 2, a2 = 2,25, a3 ≈ 2,37037, a4 ≈ 2,44141,. . .,a10 ≈
2,59374, . . .,a20 ≈ 2,6533,. . ., a100 ≈ 2,704814,. . ., joten näyttäisi siltä, että tämä jono on monotonisesti
kasvava ja ylhäältä rajoitettu. Jonon monotoninen kasvu ei kuitenkaan ole ollenkaan selvää, sillä tässähän eksponentti kyllä kasvaa, mutta kantaluku vastaavasti pienenee indeksin n kasvaessa. Siksi tämän havainnon todistuksessa on tehtävä erittäin huolellisia arviointeja.
Lause 2.37.
Lukujono (an ), missä
n 1 , an = 1 + n
on kasvava ja ylhäältä rajoitettu, joten se suppenee. Edelleen on n 1 lim 1 + ≤ 3. n→∞ n
Todistus. Tarkastellaan jonon kahden peräkkäisen jäsenen suhdetta an+1 = an
=
1+
1 n+1
n+1
1 n
=
1 n+1 + n1
1+
!n+1
1+
1 n
1 n+1 n+1 1 1 n+1 n2 + 2n 1+ = 1− . n2 + 2n + 1 n (n + 1)2 n 1+
n
Bernoullin epäyhtälön (Lause 1.38) perusteella on edelleen n+1 1 an+1 ≥ 1− =1. an n+1 n Täten siis jono on kasvava. Binomikaavan (Lause 1.36) nojalla voidaan kirjoittaa n n X 1 n 1 =1+ , an = 1 + n k nk k=1
74
missä edelleen on n(n − 1) . . . (n − k + 1) 1 nk 1 1 1 n 1 = ≤ ≤ = k−1 . k! nk k! nk 1 · 2 · 2···2 2 k nk
Näin saadaan edelleen an ≤ 1 +
joten jono on ylhäältä rajoitettu.
n k−1 X 1 k=1
2
n 1 − 21 1 1, niin
an = ∞. n→∞ n lim
Todistus. Merkitään a = 1 + b, missä b > 0. Binomikaavaa (Lause 1.36) käyttäen saadaan, kun n ∈ Z+ an = (1 + b)n = 1 + nb +
ja siis vielä
n(n − 1) 2 n(n − 1) 2 b + · · · + bn > b 2! 2!
n−1 2 n 2 an > b ≥ b , n 2 4
kun n = 2, 3, 4, . . . Jos nyt M > 0, niin an 4M n 2 > b > M , kun n > max 1, 2 . n 4 b
Seuraus 2.42.
Jos a > 1 ja s > 0, niin
an = ∞. n→∞ ns lim
Todistus. Koska a1/s > 1, niin Lauseen 2.41 perusteella
1 n s an a s n→∞ = → ∞. ns n
Edelliset tulokset on syytä painaa mieleen muodossa `eksponenttifunktio (an ) kasvaa nopeammin kuin potenssifunktio (ns ), kun n → ∞'. Näille läheistä sukua on seuraavan esimerkin tulos, joka kertoo, että
`potenssifunktio kasvaa nopeammin kuin logaritmi'.
Esimerkki 2.43.
Perustele raja-arvotulos lim
n→∞
ln n = 0. n
Ratkaisu. Käytetään hyväksi sitä, että eksponenttifunktio ex
on kaikkialla aidosti kasvava. Olkoon sitten
ε > 0 mielivaltainen reaaliluku. Nyt
⇔
ln n 0) (kasvava funktio säilyttää järjestyksen)
⇔ eln n < enε n
⇔ n < (eε ) ⇔ 1
e0 = 1, joten Lauseen 2.41 nojalla viimeisen epäyhtälön oikea puoli kasvaa rajatta. Näin ollen se on > 1 aina, kun n on tarpeeksi suuri. Väite seuraa. Päätämme tämän luvun seuraavaan raja-arvotulokseen, joka silloin tällöin putkahtelee vastaan myöhemmillä analyysin kursseilla tehtävissä arvioinneissa.
Esimerkki 2.44.
Perustele, miksi lim
n→∞
√ n n = 1.
Ratkaisu. Kirjoitetaan tämän jonon yleinen jäsen muodossa 1/n √ n = e(ln n)/n . n = n1/n = eln n
Tutkitaan tämän lausekkeen eksponenttien jonoa bn = (ln n)/n. Selvästi se on aina positiivinen. Toisaalta se lähestyy raja-arvonaan lukua 0, kun n → ∞. Kiinnitetään luku ε > 0. Tällöin ln(1 + ε) > ln 1 = 0, joten jostakin rajasta alkaen 0 < bn < ln(1 + ε). Soveltamalla tähän epäyhtälöön aidosti kasvavaa funktiota ex näemme, että tästä rajakohdasta alkaen 1 < ebn =
√ n
Väite seuraa tästä.
78
n < 1 + ε.
Luku 3
Funktion raja-arvo ja jatkuvuus 3.1 Raja-arvon määritelmä ja perusominaisuuksia Seuraavassa tarkasteltavat funktiot ovat yhden muuttujan reaalifunktioita Funktion raja-arvo eroaa jonon raja-arvosta siinä, että kun jonossa muuttujana esiintyvä n lähestyy maalinaan ääretöntä, ja kasvaa `hyppäyksittäin' eli sille sallitaan ainoastaan kokonaislukuarvot, niin funktion raja-arvoja tarkasteltaessa muuttujakin lähestyy jotakin äärellistä lukua. Tällöin meidän on tietenkin sallittava sille muitakin kuin kokonaislukuarvoja.
Esimerkki 3.1.
Tutki millaisia arvoja joukossa R \ {0} määritelty funktio f (x) =
sin x x
saa, kun muuttuja x saa arvoja ±1 , ±0,1 , ±0,01 , . . ., jotka lähestyvät nollaa.
Ratkaisu. Koska sini on pariton, niin f (−x) = f (x) kaikille x > 0. Riittää siis tarkastella positiivisia x:n arvoja. Laskimella (varmistu siitä, että kulma on radiaaneina) saamme: x 1 0,5 0,1 0,05 0,01
f (x) 0,84147 0,95885 0,99833 0,99958 0,99998
Näyttää siis siltä, että funktion arvot ovat sitä lähempänä lukua 1 mitä lähempänä lukua 0 muuttuja x on. Palaamme tähän esimerkkiin tarkemmin alla Lauseessa 3.9. Voidaksemme täsmällisesti puhua edellisen Esimerkin ilmiöstä tarvitsemme apukäsitteitä. Aluksi määritellään pisteen ympäristön käsite.
Määritelmä 3.2.
Olkoon r positiiviluku. Reaaliluvun x rympäristöksi Y (x; r) sanotaan avointa väliä Y (x; r) = (x − r, x + r).
Vastaava puhkaistu ympäristö Y ′ (x; r) on joukko Y ′ (x; r) = Y (x; r) \ {x} = (x − r, x) ∪ (x, x + r). 79
Ympäristö Y (x; r) muodostuu siis niistä reaaliluvuista, jotka poikkeavat luvusta x vähemmän kuin r:n verran, ja tämä voidaan tarvittaessa puhkaista tekemällä siihen reikä itse luvun x kohdalle. Funktion raja-arvokäsitteen pohjana on seuraava ajatus: Lukua A sanotaan funktion f raja-arvoksi, kun muuttuja x lähestyy a:ta, jos funktion arvo f (x) voidaan saada kuinka lähelle A:ta tahansa valitsemalla x riittävän läheltä a:ta (kuitenkin a:sta eroavaksi). Tämä asia esitetään seuraavassa määritelmässä täsmällisesti.
Määritelmä 3.3.
Olkoon funktio f määritelty pisteen a eräässä ympäristössä, pistettä a mahdollisesti
lukuunottamatta. Sanotaan, että funktiolla f on raja-arvo A pisteessä a, jos jokaista positiivilukua ε kohti on olemassa sellainen positiiviluku δε , että 0 < |x − a| < δε ⇒ |f (x) − A| < ε.
Tällöin merkitään lim f (x) = A,
x→a
x→a
limx→a f (x) = A tai f (x) → A, kun x → a tai vielä f (x) → A.
Tämän määritelmän epäyhtälöt voidaan korvata ympäristötulkinnalla seuraavasti. Funktiolla f on pisteessä a raja-arvo A, jos f toteuttaa seuraavan ehdon. Olipa Y (A; ε) mikä tahansa luvun A ympäristö, niin luvulla a on sellainen puhkaistu ympäristö Y ′ (a; δε ), että x ∈ Y ′ (a; δε ) ⇒ f (x) ∈ Y (A; ε).
Geometrisesti raja-arvoehto merkitsee, että x:n saadessa arvoja väliltä (a − δε , a + δε ) pistettä a lukuun ottamatta, f :n kuvaaja kulkee suorien y = A − ε ja y = A + ε välissä. Raja-arvoon ei vaikuta funktion f määrittely pisteessä a.
Raja-arvon määritelmän ehto voidaan kirjoittaa lyhyesti kvanttoreita käyttäen muodossa lim f (x) = A ⇐⇒ (∀ε > 0)(∃δε > 0) (0 < |x − a| < δε ⇒ |f (x) − A| < ε) .
x→a
Samoin kuin lukujonoilla (Lause 2.19) todetaan välittömästi, että jos funktiolla on raja-arvo pisteessä a, niin tämä raja-arvo on yksikäsitteinen. Seuraava tulos palauttaa funktion raja-arvon tarkastelun jonojen
raja-arvon tarkasteluun. Tällainen `teorian rakentelun ekonomia' on matematiikalle tyypillistä.
Lause 3.4. Jos funktio f on määritelty joukossa Y ′ (a; r), niin seuraavat ehdot ovat keskenään ekvivalentteja: (i) limx→a f (x) = A, (ii) limn→∞ f (an ) = A, mille tahansa sellaiselle joukon Y ′ (a; r) luvuista muodostuvalle jonolle (an ), jolle limn→∞ an = a.
80
Todistus. Oletetaan ensin, että (i) on tosi, ja näytetään, että (ii) seuraa tästä. Olkoon siis (an ) mikä tahansa sellainen jono joukon Y ′ (a; r) lukuja, joka suppenee raja-arvonaan kohti lukua a. Väitämme, että tällöin limn→∞ f (an ) = A. Olkoon sitten ε > 0 mielivaltainen luku. Funkion raja-arvoa koskevan oletuksemme
nojalla on olemassa sellainen luku δ > 0, että |A − f (x)| < ε aina, kun x ∈ Y ′ (a, δ). Koska limn→∞ an = a,
on olemassa sellainen rajaindeksi n1 = n(δ), että implikaatio
n > n1 ⇒ |an − a| < δ
on tosi. Jonoa (an ) koskevan oletuksemme perusteella itse asiassa siis an ∈ Y ′ (a, δ) aina, kun n > n1 . Yhdistämällä tämä luvun δ määritelmän kanssa näemme, että |f (an ) − A| < ε aina, kun n > n1 . Koska ε oli mielivaltainen, olemme näyttäneet, että
lim f (an ) = A.
n→∞
Oletetaan sitten ehdon (ii) mukaisesti, että kaikille joukon Y ′ (a; r) kohti lukua a suppeneville jonoille (an ) on voimassa limn→∞ f (an ) = A. Meidän on todistettava, että tällöin funktiolla f (x) on raja-arvo A,
kun x → a. Tehdään vastaoletus, että näin ei ole. Tällöin löytyy jokin sellainen ε > 0, että implikaatio
x ∈ Y ′ (a; δ) ⇒ |f (x) − A)| < ε ei toteudu valittiinpa δ > 0 kuinka pieneksi tahansa. Kiinnitetään jokin
tällainen ε. Erityisesti silloin ei mikään luvuista δ = 1/n, n ∈ Z+ toteuta vaadittua implikaatiota. Siis kutakin
lukua n ∈ Z+ kohti löydämme sellaisen luvun xn ∈ Y ′ (a; 1/n), että |f (x)−A)| ≥ ε. Koska tässä |xn −a| < 1/n
kaikille n ∈ Z+ , niin limn→∞ xn = a. Kuitenkin tekemiemme valintojen seurauksena jono f (xn ) ei suppene kohti lukua A, vaan pysyy siitä vähintään etäisyydellä ε. Tämän on ristiriidassa oletuksemme kanssa, joten
väite on todistettu. Lukujonoihin liittyvistä Lauseista 2.25 ja 2.28 saadaan nyt Lauseen 3.4 perusteella
Lause 3.5.
Jos limx→a f (x) = A ja limx→a g(x) = B , niin lim (f (x) ± g(x)) = A ± B ,
x→a
lim c f (x) = c A ,
x→a
missä c ∈ R ,
lim f (x) g(x) = A B ,
x→a
lim
x→a
f (x) A = , g(x) B
Seuraavaksi esitetään Lauseen 2.24 vastine.
Lause 3.6.
Jos funktiot f, g ja h toteuttavat ehdot
(i) f (x) ≤ g(x) ≤ h(x),
∀x ∈ Y ′ (a; r),
(ii) limx→a f (x) = A = limx→a h(x), missä r on jokin positiiviluku, niin myös limx→a g(x) = A. 81
missä B 6= 0 .
C
B
x A O
Kuva 3.1: Oheisten tarkastelujen apukuva
Suoritetaan seuraavaksi eräitä trigonometrisiin funktioihin liittyviä arvioita.
Lemma 3.7. Todistus.
| sin x| ≤ |x| ,
∀x ∈ R .
Tapauksessa 0 ≤ x < π/2 väite on kohtuullisen ilmeinen luvun sin x määrittelyn perusteella.
Esimerkiksi Kuvassa 3.1 harmaa jana pisteestä B kohtisuoraan x-akselille on pituudeltaan sin x kun taas
sitä pidempi kaari AB on pituudeltaan x. Samaan tulokseen pääsee vertaamalla myös sektorin OAB alaa = x/2 kolmion OAB alaan = (sin x)/2. Tapauksessa −π/2 < x < 0 palaudutaan edelliseen käyttämällä
sinifunktion parittomuutta. Koska aina | sin x| ≤ 1, niin väite on tosi myös tapauksessa |x| ≥ π/2 > 1.
Esimerkki 3.8.
Lemmaa käyttäen voidaan nyt todistaa raja-arvon määritelmään nojautuen väitteet lim sin x = sin a
x→a
ja
lim cos x = cos a.
x→a
Ratkaisu. Olkoon ε > 0. Käyttäen trigonometrian `summat tuloiksi' kaavoja saadaan x − a x+a cos x + a sin x − a sin = 2 | sin x − sin a| = 2 cos 2 2 2 2 x − a = |x − a| < ε , ≤ 2 · 1 · 2
kun 0 < |x − a| < ε. Täten ensimmäinen väite on todistettu. Toinen väite voidaan todistaa samoin tai
käyttäen hyväksi edellistä seuraavasti
cos x = sin
Lause 3.9.
π
π x→a − x → sin − a = cos a. 2 2
sin x = 1. x→0 x lim
82
Todistus. Koska sin(−x)/−x = (sin x)/x voidaan rajoituksetta olettaa, että x on positiivinen ja lisäksi jo niin lähellä nolla, että x < π/2. Tällöin vertaamalla Kuvan 3.1 kolmioiden OAB ja OAC sekä ympyräsektorin OAB pinta-aloja saadaan 1 1 1 sin x < x < tan x 2 2 2
ja edelleen kertomalla luvulla 2/ sin x 1
0) : 0 < |x − a| < δM ⇒ f (x) > M ,
lim f (x) =
A ⇐⇒ (∀ε > 0)(∃Mε > 0) : x > Mε ⇒ |f (x) − A| < ε ,
lim f (x) =
−∞ ⇐⇒ (∀M > 0)(∃NM > 0) : x > NM ⇒ f (x) < −M ,
x→a
x→∞ x→∞
∞ ⇐⇒ (∀M > 0)(∃δM > 0) : a − δM < x < a ⇒ f (x) > M .
lim f (x) =
x→a−
Esimerkki 3.13.
Osoitetaan, että
1 − 2x2 = ∞. x→−∞ 1 + x lim
Ratkaisu. Jos merkitään f (x) = (1 − 2x2 )/(1 + x), niin todistettava ehto kvanttorimuodossa on (∀M > 0)(∃NM > 0) : x < −NM ⇒ f (x) > M.
(∗)
Kun x < −1 voidaan kirjoittaa 1 − 2x2 2x2 − 1 2x2 − x2 = > = −x , 1+x −x − 1 −x
joten siis f (x) > −x > M , kun x < min{−1, −M }. Täten ehto (∗) toteutuu, kun valitaan −NM = min{−1, −M }.
Esimerkki 3.14.
Perustele, miksi lim ln x = −∞.
x→0+
84
Ratkaisu. Olkoon M
> 0 jokin luku. Luonnollinen logaritmi on kasvava välillä (0, ∞), joten kaikille välin
(0, 1/eM ) luvuille x on voimassa epäyhtälö ln x < ln(1/eM ) = − ln(eM ) = −M . Valinta δM = 1/eM siis
toimii.
Esimerkki 3.15.
Määrätään toispuoleiset raja-arvot 1
lim
x→0+ 21/x
+1
ja lim
x→0−
1 . 21/x + 1
Ratkaisu. Kun x → 0+, niin helposti vakuutumme siitä, että 1/x → ∞ (kun x ∈ (0, 1/M ), niin 1/x > M >
0). Edelleen näemme, että tällöin funktio 21/x kasvaa rajatta, joten samoin tekee tutkittavan lausekkeen
nimittäjä. Oikeanpuoleinen raja-arvo on siis muotoa '1/∞' eli etsitty raja-arvo on 0. Kun x → 0−, niin 1/x → −∞ (kun x ∈ (−1/M, 0), niin 1/x < −M < 0). Tällöin potenssi 21/x
lähestyy nollaa. Toinen tapa nähdä tämä on palauttaa se edellisen kappaleen tarkasteluun toteamalla, että nyt −1/x → ∞, ja
21/x =
1
→
2−1/x
1 = 0. ∞
Vasemmanpuoleisen raja-arvon tapauksessa siis nimittäjä lähestyy lukua 1, joten koko lauseke lähestyy vasemmanpuoleista raja-arvoa 1/(0 + 1) = 1.
Esimerkki 3.16. lim
x→π/2−
tan x = ∞,
lim
x→π/2+
tan x = −∞.
Ratkaisu. Käsittelemme näistä ensimmäisen raja-arvon. Olkoon siis M > 0. Esimerkin 3.8 nojalla ja lim sin x = 1.
lim cos x = 0
x→π/2
x→π/2
Lisäksi tiedämme, että välillä (0, π/2) kosini ja sini ovat molemmat positiivisia. Näin ollen on olemassa sellainen luku δ > 0, että välillä x ∈ (π/2 − δ, π/2) on voimassa 0 < cos x < 1/(2M ). Lisäksi välillä x ∈ (π/6, π/2) on voimassa 1/2 < sin x < 1. Näin ollen tan x =
1/2 sin x > =M cos x 1/(2M )
aina, kun x ∈ (π/2 − δ ′ , π/2), missä δ ′ = min{δ, π/3}.
Esimerkki 3.17.
Osoitetaan, että lim arctan x =
x→∞
85
π . 2
Ratkaisu.
Kiinnitetään ε > 0. Rajoituksetta voidaan olettaa, että ε < π/4. Tällöin tangenttifunktio on
määritelty ja kasvava välillä (π/2 − ε, π/2). Lisäksi luku M = tan(π/2 − ε) on tällöin positiivinen. Jos nyt
y > M , niin tällöin arctan y > arctan M = π/2 − ε tangentin kasvavuuden perusteella. Aina on voimassa arctan y < π/2, joten esitetty luku M kelpaa vaadituksi rajaluvuksi.
Kuten lukujonoilla voidaan funktioillakin useat raja-arvolauseista muuntaa edellä olevia yleisempiä tapauksia koskeviksi. Todistukset suoritetaan joko suoraan määritelmiin nojautuen tai laajentamalla ensin funktion ja lukujonon raja-arvojen välistä yhteyttä koskeva Lause 3.4 näihin tapauksiin. Epämääräisiin muotoihin jouduttaessa on yleensä funktion muotoa sopivasti muunnettava, jotta epämääräisyys häviäisi ja raja-arvolauseita voitaisiin käyttää. Seuraavaksi osoitetaan, että Neperin luvun e yhteydessä (Lause 2.37) voidaan tarkastella lukujonon sijasta x funktiota f (x) = 1 + x1 .
Lause 3.18.
x 1 1+ = e. x→∞ x lim
Todistus. Valitaan x:ää kohti sellainen positiivinen kokonaisluku n, että n ≤ x < n + 1. Jos tällöin luvuista
x ja n jompikumpi lähestyy ääretöntä, niin toinen käyttäytyy samalla tavalla. Lukujen x ja n keskinäisestä
suuruudesta johtuen on voimassa 1+
Koska tässä on edelleen
ja
1 n+1
n
1 , s > 0 ⇒ lim
ts. eksponenttifunktio f (x) = ax (a > 1) kasvaa voimakkaammin kuin potenssifunktio f (x) = xs (s > 0). Toisaalta logaritmifunktio f (x) = ln x kasvaa hitaammin kuin potenssifunktio, sillä käyttämällä yhteyttä y = ln x voidaan edellä olevaan perustuen kirjoittaa lim
x→∞
Esimerkki 3.20.
ln x y = lim sy = lim s y→∞ y→∞ x e
1 (es )y y
= 0.
Perustele toispuoleinen raja-arvotulos lim x ln x = 0.
x→0+
Ratkaisu. Kun t → ∞, niin e−t lähestyy nollaa oikealta. Voimme siis sijoittaa x = e−t . Tällöin saamme x ln x = e−t ln(e−t ) =
−t . et
Kun tässä t kasvaa rajatta, niin nimittäjän eksponenttifunktio et kasvaa edellisen tarkastelun perusteella niin paljon osoittajan itseisarvo t nopeammin, että niiden suhde lähestyy nollaa. On huomattava, että esiintyy myös tapauksia, joissa funktiolla jossakin pisteessä ei ole minkäänlaista raja-arvoa: ei äärellistä, ääretöntä eikä edes toispuoleista. Tällaista tilannetta tarkastellaan seuraavassa esimerkissä.
Esimerkki 3.21.
Tutkitaan funktiota f (x) = sin(1/x) kohdan x = 0 lähistöllä.
Ratkaisu. Olkoon aluksi x > 0. Välittömästi voidaan kirjoittaa
sin
1 x
=
0, kun x = +1, kun x = −1, kun x =
1 1 1 1 , , , ... , , ... π 2π 3π nπ 2 2 2 2 , , , ... , , ... π 5π 9π (4n − 3)π 2 2 2 2 , , , ... , , ... 3π 7π 11π (4n − 1)π
87
Koska sini on pariton funktio, saadaan edellisen perusteella tietoa myös funktion käyttäytymisestä arvoilla x < 0.
Valittiinpa nyt miten kapea origon ympäristö tahansa (vaikka vain toispuoleinenkin), niin siinä on aina sekä sellaisia pisteitä, joissa sin(1/x) = 1, että sellaisia, joissa sin(1/x) = −1. Täten funktiolla sin(1/x) ei ole minkäänlaista raja-arvoa kohdassa x = 0. Kuvassa 3.2 tekemämme havainnot näkyvät siten, että
lähestyttäessä nollaa `siniaallon' pituus tulee aina pienemmäksi ja pienemmäksi, mutta amplitudi pysyy samana. Olipa ε > 0 miten pieni luku tahansa, niin välillä x ∈ (0, ε) on äärettömän monta laaksoa ja
kukkulaa.
3.3 Jatkuvuuden määritelmä ja perusominaisuuksia Määritelmä 3.22. Olkoon funktio f määritelty pisteen a ympäristössä (piste a mukaanluettuna). Funktiota f sanotaan jatkuvaksi pisteessä a, jos lim f (x) = f (a).
x→a
Merkitsemällä h = x − a saadaan jatkuvuusehto muotoon lim f (a + h) = f (a).
h→0
Jatkuvuuteen sisältyy oikeastaan kolme vaatimusta. Ensiksi f (a) on olemassa, ts. f on määritelty kohdassa a, toiseksi funktiolla f (x) on äärellinen raja-arvo, kun x → a ja kolmanneksi varsinaisesti limx→a f (x) = f (a). Jos f (a) on määritelty, mutta jompikumpi muista ehdoista ei toteudu sanotaan, että a on f :n epäjatku-
vuuskohta. Mikäli limx→a f (x) on äärellisenä olemassa, mutta f ei ole määritelty pisteessä a (tai määritelty arvo eroaa raja-arvosta), saadaan f jatkuvaksi pisteessä a asettamalla lisämääritelmä (tai muutos määritelmään) f (a) = limx→a f (x). Tällaista epäjatkuvuuskohtaa sanotaan poistuvaksi tai näennäiseksi. Muunlaisia epäjatkuvuuskohtia sanotaan olennaisiksi.
Määritelmä 3.23.
Funktio f on oikealta jatkuva pisteessä a, jos lim f (x) = f (a)
x→a+
ja vastaavasti vasemmalta jatkuva pisteessä a, jos lim f (x) = f (a).
x→a−
Määritelmistä 3.22 ja 3.23 sekä toispuoleisten raja-arvojen ominaisuuksista seuraa, että f on jatkuva pisteessä a silloin ja vain silloin kun se on tässä pisteessä sekä vasemmalta että oikealta jatkuva.
Määritelmä 3.24.
Funktio on jatkuva avoimella välillä, jos se on jatkuva välin jokaisessa pisteessä, sekä
jatkuva suljetulla välillä [a, b], jos se on jatkuva välillä (a, b) sekä lisäksi oikealta jatkuva pisteessä a ja vasemmalta jatkuva pisteessä b. Jatkuvuus puoliavoimella välillä määritellään vastaavasti. Funktiota sanotaan jatkuvaksi, jos se on jatkuva koko määrittelyjoukossaan. 88
Geometrisesti jatkuvuus välillä merkitsee, että funktion kuvaaja kyseisellä välillä on katkeamaton käyrä. Yhdistämällä jatkuvuuden määritelmä ja aikaisempi tuloksemme Lause 3.5 saadaan välittömästi seuraava tulos, missä I voi olla avoin, suljettu, puoliavoin tai ääretön väli.
Lause 3.25.
Jos f ja g ovat pisteessä a (tai välillä I ) jatkuvia funktioita, niin samoin ovat f ± g, cf (missä
c ∈ R) ja f g . Jos lisäksi g(x) 6= 0 pisteessä a (tai välillä I ), niin myös f /g on jatkuva pisteessä a (tai välillä I ).
Edellisen lauseen perusteella jokainen polynomi c0 + c1 x + c2 x2 + · · · cn xn (ci ∈ R) on jatkuva koko R:ssä
ja jokainen rationaalifunktio
r(x) =
p(x) q(x)
(p ja q polynomeja)
on jatkuva nimittäjän nollakohtia lukuunottamatta. Samoin Esimerkin 3.8 tulos osoittaa, että limx→a cos x = cos a ja limx→a sin x = sin a kaikille reaaliluvuille a, joten trigonometriset funktiot sini ja kosini ovat jatkuvia koko R:ssä. Näin edelleen Lauseen 3.25 nojalla kaikki trigonometriset funktiot ovat jatkuvia määrittelyjoukoissaan. Seuraavassa esitettävien yhdistetyn ja käänteisfunktion jatkuvuustarkastelujen jälkeen saadaan yleisesti alkeisfunktioiden jatkuvuutta koskeva tulos: Kaikki alkeisfunktiot ovat jatkuvia määrittelyjoukoissaan.
3.4 Yhdistetyn funktion ja käänteisfunktion jatkuvuus Lause 3.26.
Jos f on jatkuva pisteessä a ja g on jatkuva pisteessä f (a), niin yhdistetty funktio g ◦ f on
jatkuva pisteessä a.
Todistus.Olkoon ε > 0. Oletuksista lim g(y) = g(f (a)) ja
y→f (a)
lim f (x) = f (a)
x→a
seuraa raja-arvon määritelmän nojalla, että on olemassa sellaiset positiiviluvut δ1 ja δ2 , että |y − f (a)| < δ1 ⇒ |g(y) − g(f (a))| < ε
ja |x − a| < δ2 ⇒ |f (x) − f (a)| < δ1 .
Jos siis |x − a| < δ2 , niin f (x) toteuttaa y :lle asetetun ehdon |y − f (a)| < δ1 ja siten |g(f (x)) − g(f (a))| < ε .
89
Lause 3.27.
Oletetaan, että funktio f on pisteen a jossakin ympäristössä aidosti monotoninen ja jatkuva.
Silloin käänteisfunktio f −1 on jatkuva pisteessä b = f (a).
Todistus. Käänteisfunktio f −1
on olemassa ja Lauseen 1.63 nojalla lisäksi aidosti monotoninen (samaan
suuntaan kuin f ) eräässä b:n ympäristössä. Oletetaan jatkossa, että f on aidosti kasvava ja jatkuva ympäristössä Y (a; r). (Aidosti vähenevän f :n tapaus todistetaan analogisesti.) Todistuksen suorittamiseksi on osoitettava, että lim f −1 (y) = f −1 (b) .
y→b
Saadaksemme tarkastelut rajoittumaan ympäristöön Y (a; r) valitaan 0 < ε < r. Tällöin f :n aidon kasvavuuden perusteella f (a − ε) < b < f (a + ε) .
Merkitään δ = min{f (a + ε) − b, b − f (a − ε)} ,
jolloin siis δ > 0. Jos nyt y ∈ Y (b; δ), niin f (a − ε) ≤ b − δ < y < b + δ ≤ f (a + ε) .
Myöhemmin todistettavan tuloksen (joka on riippumaton tässä suoritettavasta tarkastelusta) mukaan jatkuva funktio f kuvaa suljetun välin [a − ε, a + ε] suljetuksi väliksi [f (a − ε), f (a + ε)]. Näin ollen f −1 on määritelty koko välillä [f (a − ε), f (a + ε)]. Käänteisfunktion f −1 aidon kasvavuuden nojalla on f −1 (f (a − ε)) < f −1 (y) < f −1 (f (a + ε))
eli a − ε < f −1 (y) < a + ε .
Täten siis |f −1 (y) − a| < ε aina, kun |y − b| < δ ja näin väite on todistettu. Todistuksesta nähdään, että jos lauseen oletuksessa korvataan `jatkuva' sanoilla `toispuoleisesti jatkuva', niin f −1 on myös toispuoleisesti jatkuva b:ssä (samalta tai vastakkaiselta suunnalta sen mukaan, onko f aidosti kasvava vai vähenevä).
Seuraus 3.28. f
−1
Jos f on aidosti monotoninen ja jatkuva välillä [a, b] ja kuvaa välin [a, b] väliksi [c, d], niin
on jatkuva välillä [c, d].
Funktion aitoa monotonisuutta voidaan usein helpoimmin tutkia tarkastelemalla funktion derivaattaa. Tämä asia tulee myöhemmin esille yksityiskohtaisemmin.
90
Esimerkki 3.29. Oletetaan, että funktio f on jatkuva ja kasvava koko reaalisuoralla, epätyhjä joukko S ⊂ R on ylhäältä rajoitettu, ja M = sup S . Osoita, että tällöin
f (M ) = sup f (S).
Siis jatkuva kasvava funktio kuvaa joukon supremumin kuvajoukon supremumiksi. Vertaa tätä Esimerkkeihin 2.7 ja 2.14.
Ratkaisu. Koska M on joukon S eräs yläraja, Esimerkin 2.7 nojalla luku f (M ) on kuvajoukon f (S) yläraja. Tehtävänä on osoittaa, että f (M ) on pienin kuvajoukon f (S) ylärajoista. Todistus jätetään harjoitustehtäväksi. Opastus: Jos ε > 0, niin luku f (S) − ε ei voi olla kuvajoukon f (S) yläraja, koska f on kasvava, eikä
M − δ ole joukon S yläraja.
3.5 Suljetulla välillä jatkuvan funktion ominaisuuksia Seuraavassa esitellään eräitä tuloksia, joissa kaikissa tarkastellaan suljetulla välillä jatkuvaa funktiota. Nämä ovat sikäli keskeisiä analyysin teorian kannalta, että ne osoittavat (ε, δ) -formalismin vastaavan jatkuvuudesta muodostunutta visuaalista mielikuvaa. Niiden kaikkien todistukset pohjautuvat täydellisyysaksioomaan, ja ne ovat siksi käsitteellisesti ehkä hiukan haastavampia kuin tämän kurssin muut todistukset. Nämä ominaisuudet on syytä painaa mieleen, sillä niihin vedotaan myöhemmin tällä ja tulevilla kursseilla. Todistusten yksityiskohtiin voit niin halutessasi syventyä vasta myöhemmin.
Lemma 3.30.
Jos funktio f on jatkuva välillä I = [a, b], c on jokin tämän välin piste, ja f (c) 6= 0, niin
on olemassa sellainen δ > 0, että ympäristön Y (c; δ) ja välin I leikkausjoukossa funktion f (x) saamat arvot ovat kaikki samanmerkkisiä (vrt. Lemma 2.27).
Todistus.
Valitaan ε = |f (c)|/2. Jos f (c) 6= 0, niin ε > 0, ja jatkuvuuden määritelmän perusteella on
olemassa sellainen δ > 0, että implikaatio
|x − c| < δ ⇒ |f (x) − f (c)| < ε = |f (c)|/2.
on tosi kaikille x ∈ [a, b]. Jos siis x ∈ Y (c; δ) ∩ I , niin f (x) eroaa luvusta f (c) enintään puolella siitä, mitä f (c) nollasta. Näin ollen f (x) ja f (c) ovat samanmerkkisiä.
Ensimmäisenä esitetään lause, jolla on merkitystä myös yhtälön juuria etsittäessä. Visuaalisesti tulkittuna se sanoo, ettei jatkuva funktio voi vaihtaa merkkiään kulkematta nollan kautta.
Lause 3.31.
(Bolzanon lause.) Jos f on jatkuva suljetulla välillä [a, b] sekä f (a) ja f (b) ovat erimerkkiset,
niin avoimella välillä (a, b) on ainakin yksi sellainen piste c, että f (c) = 0. Tarkemmin sanottuna, jos joukko S muodostuu niistä välin [a, b] pisteistä, joissa funktio f saa erimerkkisen arvon kuin pisteessä b, niin voidaan
valita c = sup S . 91
Todistus. Korvaamalla f
tarvittaessa funktiolla −f (näillähän on samat nollakohdat) voimme olettaa, että
f (a) < 0 < f (b). Tutkitaan siis joukkoa
S = {x ∈ [a, b] | f (x) < 0}.
Joukko S on epätyhjä, koska a ∈ S . Lisäksi S on ylhäältä rajoitettu, koska selvästi b on sen eräs yläraja. Täydellisyysaksiooman nojalla on siis olemassa luku
c = sup S.
Samoista syistä (a ∈ S ja b eräs yläraja) c ∈ [a, b]. Itse asiassa Lemman 3.30 seurauksena löydämme sellaisen luvun δb > 0, että välillä (b − δb , b] funktio f saa vain positiivisia arvoja. Näin ollen myös b − δb /2 on joukon
S yläraja, ja voimme päätellä, että c < b. Samalla tavalla näemme Lemman 3.30 seurauksena, että c > a,
koska jokin muotoa [a, a + δa ) oleva väli sisältyy kokonaisuudessaan joukkoon S . Väitämme nyt, että f (c) = 0. Teemme vastaoletuksen, että joko f (c) < 0 tai f (c) > 0. Lemman 3.30 nojalla löydämme sellaisen luvun δ > 0, että joukossa Y (c; δ) ∩ [a, b] funktion f merkki ei muutu. Koska
a < c < b voimme tarvittaessa lukua δ pienentämällä päästä tilanteeseen, jossa Y (c; δ) ⊆ [a, b].
Jos f (c) < 0, niin tällöin yllä sanotun perusteella myös f (c + δ/2) < 0. Näin ollen c + δ/2 ∈ S . Koska
c + δ/2 > c ei c voikaan olla joukon S yläraja, mikä on ristiriita.
Jos f (c) > 0, niin tällöin f (x) saa ainoastaan positiivisia arvoja välillä (c − δ/2, b]. Näin ollen luku c − δ/2
on joukon S yläraja. Tämä on ristiriidassa sen kanssa, että c oli joukon S pienin yläraja.
Tekemämme vastaoletus johtaa siis aina ristiriitaan, joten ainoa mahdollisuus on, että f (c) = 0.
Seuraus 3.32.
(Jatkuvan funktion väliarvolause.) Oletetaan, että f on jatkuva suljetulla välillä [a, b] ja
f (a) 6= f (b). Tällöin f saa jokaisen lukujen f (a) ja f (b) välisen arvon ainakin yhdessä avoimen välin (a, b)
pisteessä.
Todistus. Olkoon d jokin arvojen f (a) ja f (b) välissä oleva luku. Tarkastellaan funktiota g(x) = f (x) − d.
Tällöin g on jatkuva välillä [a, b] ja arvot g(a) = f (a) − d ja g(b) = f (b) − d ovat erimerkkiset. Bolzanon
lauseen nojalla on siis välillä (a, b) sellainen piste c, että g(c) = 0 ts. f (c) = d.
Seuraus 3.33.
(Juuren olemassaolo.) Jos a > 0 ja n ∈ Z+ , niin yhtälöllä xn = a
on tarkalleen yksi positiivinen ratkaisu. (Tätä ratkaisua merkitään
√ n a:lla.)
Todistus. Tarkastellaan funktiota f (x) = xn − a välillä [0, a + 1]. Bolzanon lauseen oletukset ovat voimassa, sillä f on jatkuva, f (0) = −a < 0 ja edelleen Bernoullin epäyhtälön (Lause 1.38) nojalla f (a + 1) =
(a + 1)n − a ≥ 1 + na − a = (n − 1)a + 1 > 0. Täten f :llä on ainakin yksi nollakohta. Jos edelleen 0 < x1 < x2 ,
niin
f (x2 ) − f (x1 ) = x2 n − x1 n = (x2 − x1 )(x2 n−1 + x2 n−2 x1 + · · · + x1 n−1 ) > 0 ,
92
joten f on aidosti kasvava joukossa [0, ∞) eikä sillä siis voi olla useampia nollakohtia.
Huomautus 3.34.
Edellisen lauseen todistus on nähtävissä yleistyksenä aiemmalla todistuksellemme luvun √ 2 olemassaololle. Etenkin Bolzanon lauseen ja täydellisyysaksiooman läheinen yhteys on selvästi näkyvissä.
Huomautus 3.35.
Nyt sitten voisimme määritellä eksponenttifunktiot f (x) = ax ja niiden käänteisfunk-
tioina tuotetut logaritmifunktiot. Esimerkiksi x = e1/10 on luontevaa määritellä yhtälön x10 = e (ainoaksi) positiiviseksi ratkaisuksi. Edelleen eπ määriteltäisiin jonon e3 , e31/10 , e314/100 , . . . raja-arvoksi. Näkemällä hieman vaivaa voisimme nimittäin perustella, että tällä tavalla tuotettu lukujono suppenee, ja lopulta tuottaa jatkuvan, aidosti kasvavan funktion ex , jolla on aiemmin luetellut ominaisuudet. Emme kuitenkaan tee näin, koska kurssilla Analyysi II määrittelemme eksponenttifunktion toisella, oleellisesti helpommalla tavalla sarjojen teorian sivutuotteena. Tällöin voimme helposti todistaa kyseisellä funktiolla olevan mainitut ominaisuudet. Siihen asti tyydymme yksinkertaisesti olettamaan, että eksponenttifunktiolla on nämä tutut ominaisuudet, ja käytämme niitä. On tietenkin pidettävä huolta siitä, ettemme matkan varrella syyllisty kehäpäättelyyn. Kun funktio ex lopulta määritellään, emme siinä vaiheessa saa käyttää näiden ominaisuuksien todistamiseen mitään, mikä on johdettu ne tunnettuina pitäen. Nyt siirrytään tarkastelemaan suljetulla välillä jatkuvan funktion arvojoukkoa.
Määritelmä 3.36.
Joukossa A määriteltyä funktiota f sanotaan rajoitetuksi joukossa A, jos sen arvojoukko f (A) = { f (x) | x ∈ A }
on rajoitettu.
Lause 3.37.
Suljetulla välillä [a, b] jatkuva funktio f on rajoitettu tällä välillä.
Todistus. Tehdään
vastaoletus, että f ei ole rajoitettu tällä välillä. Tutkimalla jälleen tarvittaessa myös
funktiota −f , voimme olettaa, että f ei ole ylhäältä rajoitettu. Olkoon sitten n jokin kokonaisluku, joka on suurempi kuin luku f (b). Tarkastellaan joukkoa
Sn = {x ∈ [a, b] | f (x) ≥ n}.
Koska f ei ole ylhäältä rajoitettu, n ei ole joukon f ([a, b]) yläraja. Näin ollen on olemassa sellainen luku cn ∈ [a, b], että f (cn ) > n. Joukko Sn ei siis ole tyhjä. Koska b on sen eräs yläraja, sillä on supremum
xn = sup Sn . Selvästi xn ∈ [a, b]. Soveltamalla Bolzanon lausetta (Lause 3.31) funktioon x 7→ f (x) − n,
näemme että on oltava f (xn ) = n.
Olkoot sitten n < m kaksi positiivista kokonaislukua, jotka molemmat ovat > f (b). Koska Sm ⊆ Sn , on
jokainen joukon Sn yläraja myös joukon Sm yläraja. Erityisesti siis xn on joukon Sm yläraja. Koska xm on pienin joukon Sm ylärajoista, saamme epäyhtälön xm ≤ xn . Siis jono (xn )n>f (b) on monotonisesti vähenevä.
93
? PSfrag repla ements
n+2 n+1 n
a
c
xn+2 xn+1
xn
b
Kuva 3.3: Jos jatkuva funktio ei ole rajoitettu, löytyy jono, jonka raja-arvon kohdalla on ongelma
Se on myös alhaalta rajoitettu, sillä a ≤ xn kaikille n. Näin ollen monotonisten jonojen peruslauseen nojalla on olemassa
lim xn = c ∈ [a, b].
n→∞
Funktion jatkuvuuden ja Lauseen 3.4 nojalla lim f (xn ) = f (c).
n→∞
Mutta f (xn ) = n, joten raja-arvo limn→∞ f (xn ) ei ole äärellisenä olemassa (ks. Kuva 3.3). Tämä on ristiriita.
Esimerkki 3.38.
Selvitä, mikä menee pieleen, jos edellisen todistuksen ideaa sovelletaan puoliavoimella
välillä I = (0, 1] jatkuvaan funktioon f (x) = 1/x, mikä ei selvästi ole rajoitettu tällä välillä?
Ratkaisu.
Tälle funktiolle Lauseen 3.37 todistuksessa esiintyvä joukko Sn on avoin väli Sn = (0, 1/n).
Tällöin xn = sup Sn = 1/n, joten todistuksessa apuna käytetty luku c = lim
n→∞
1 = 0. n
Kun väli I ei olekaan suljettu, niin käykin niin, että c ∈ / I . Funktiota f ei siis ole edes määritelty pisteessä c, eikä Lausetta 3.4 päästä soveltamaan.
Lause 3.39.
Suljetulla välillä [a, b] jatkuvalla funktiolla f on tällä välillä suurin ja pienin arvo.
Todistus. Jälleen riittää todistaa suurimman arvon olemassaolo. Lauseen 3.37 perusteella funktion f
arvo-
joukko S = f ([a, b]) = {f (x) | x ∈ [a, b]}
on rajoitettu ja epätyhjä, joten sillä on supremum M = sup S . Koska M on joukon S yläraja, saamme heti, että f (x) ≤ M kaikille luvuille x ∈ [a, b]. Riittää siis osoittaa, että M ∈ S , eli että on olemassa sellainen 94
M PSfrag repla ements M − 1/(n + 2) M − 1/(n + 1) M − 1/n c
a
xn+2xn+1 xn
b
Kuva 3.4: Monotoninen jono, jonka raja-arvossa maksimi saavutetaan
c ∈ [a, b], että f (c) = M . Jos f (b) = M , niin lause on todistettu, joten rajoituksetta voimme olettaa, että f (b) < M .
Jos siis n > 0 on tarpeeksi suuri kokonaisluku, niin f (b) < M − 1/n. Luku M − 1/n < M ei ole joukon
S yläraja, joten joukko
Sn = {x ∈ [a, b] | f (x) > M − 1/n}
on epätyhjä ja ylhäältä rajoitettu. On siis olemassa xn = sup Sn , ja lisäksi xn ∈ [a, b]. Lisäksi funktio
g(x) = f (x) − M + 1/n saa negatiivisen arvon pisteessä b ja positiivisen arvon kaikissa joukon Sn pisteissä.
Soveltamalla siihen Bolzanon lausetta näemme, että g(xn ) = 0 eli f (xn ) = M − 1/n. Oletetaan sitten, että m > n ovat positiivisia kokonaislukuja. Koska M − 1/m > M − 1/n näemme, että Sm ⊆ Sn , ja edelleen,
että xm ≤ xn . Jono (xn ) on siis monotonisesti vähenevä ja alhaalta rajoitettu (ks. Kuva 3.4). Monotonisten
jonojen peruslauseen nojalla sillä on raja-arvo
lim xn = c ∈ [a, b].
n→∞
Funktion f jatkuvuuden ja Lauseen 3.4 nojalla sitten f (c) = lim f (xn ) = lim (M − 1/n) = M. n→∞
Seuraus 3.40.
n→∞
Jatkuva funktio kuvaa suljetun välin suljetuksi väliksi eli täsmällisemmin f ([a, b]) = [m, M ],
missä m = mina≤x≤b f (x) on funktion f pienin arvo välillä [a, b] ja M = maxa≤x≤b f (x) vastaavasti suurin arvo välillä [a, b].
Todistus. Lauseen 3.39 nojalla funktiolla f
on välillä [a, b] suurin arvo M ja pienin arvo m. Olkoot c ja d
sellaiset välin [a, b] pisteet, joissa f (c) = m ja f (d) = M . Seurauksen 3.32 mukaan f saa arvoikseen kaikki välin (m, M ) luvut, kun x kulkee välin [c, d] (tai [d, c]). Koska toisaalta koko välillä [a, b] saadut arvot ovat välillä [m, M ], niin f ([a, b]) = [m, M ]. 95
Esimerkki 3.41.
Osoita, että yhtälö (vrt. Esimerkki 1.66) y 5 + y = x2 + 1
määrää muuttujan y yksikäsitteisesti muuttujan x (implisiittisenä) funktiona y = f (x), f : R → R.
Ratkaisu. Riittää näyttää, että kullakin luvun x arvolla kyseisellä yhtälöllä on yksi ja vain yksi ratkaisu y ∈ R. Todetaan aluksi, että funktio g(y) = y 5 + y on muuttujan y jatkuva ja aidosti kasvava funktio kahden
aidosti kasvavan jatkuvan funktion summana. Lisäksi näemme, että limy→∞ g(y) = ∞ ja limy→∞ g(y) = −∞. Kiinnitetään sitten x ∈ R. Valitaan (tarpeeksi suuri) luku M = 2x2 +2 > x2 +1. Funktion g(y) todetuista
raja-arvo-ominaisuuksista seuraa, että on olemassa sellainen luku b ∈ R, että g(b) > M , ja sellainen luku
a < b, että g(a) < −M . Soveltamalla jatkuvan funktion väliarvolausetta (Seuraus 3.32) funktioon g(y) ja
väliin [a, b] voimme päätellä, että on olemassa sellainen luku y , että g(y) = x2 + 1 ∈ [−M, M ]. Koska g(y) on aidosti kasvava funktio, tällaisia lukuja y ei voi olla useampia kuin yksi.
Huomaa, ettemme yleisesti voi sanoa mitään siitä, saavuttaako koko reaalisuoralla jatkuva funktio suurimman ja pienimmän arvonsa. Emme edes siinä tapauksessa, että kyseinen funktio on rajoitettu. Esimerkiksi kaikkialla jatkuvasta funktiosta f (x) = 1/(x2 + 1) näemme heti, että sen arvot on rajoitettu välille (0, 1]. Se kyllä saavuttaa suurimman arvonsa kohdassa x = 0, mutta ei saavuta pienintä arvoaan missään, sillä funktion arvot ovat sitä pienempiä, mitä suurempi |x| on. Tämä johtaa meidät seuraavaan havaintoon.
Esimerkki 3.42.
Oletetaan, että funktio f on jatkuva koko R:ssä, ja että lim f (x) = lim f (x) = 0.
x→∞
x→−∞
Oletetaan myös, että funktio f saa sekä positiivisia että negatiivisia arvoja. Tällöin funktio f on rajoitettu, ja lisäksi se saavuttaa suurimman ja pienimmän arvonsa.
Todistus. Oletuksemme mukaan on olemassa sellaiset luvut x1 ja x2 , että f (x1 ) = c > 0 ja f (x2 ) = d < 0. Valitaan ε = min{c/2, |d|/2}. Raja-arvoja koskevista oletuksistamme seuraa, että on olemassa sellainen luku
M > 0, että |f (x)| < ε aina, kun |x| > M . Erityisesti siis välin I = [−M, M ] ulkopuolella funktion f arvot
on rajoitettu välille (−ε, ε), joten x1 , x2 ∈ I .
Lauseen 3.37 nojalla funktio f on rajoitettu välillä I , ja siis myös koko suoralla. Edelleen Lauseen 3.39
nojalla funktio f saavuttaa suurimman ja pienimmän arvonsa välillä I . Suurin arvo on vähintään f (x1 ) = c > ε, joten se on myös suurin funktion f koko suoralla saavuttamista arvoista. Vastaavasti pienin arvo on
enintään f (x2 ) = d < −ε, joten se on myös pienin funktion f koko suoralla saavuttamista arvoista.
3.6 Kahden muuttujan funktion raja-arvo ja jatkuvuus Tunnetusti tason pisteiden P1 = (x1 , y1 ) ja P2 = (x2 , y2 ) etäisyys d(P1 , P2 ) on d(P1 , P2 ) =
p (x1 − x2 )2 + (y1 − y2 )2 .
96
A+ε A A−ε
R
PSfrag repla ements y0 x0
P Y (P ; δ)
Kuva 3.5: Pisteen P = (x0 , y0 ) eräs ympäristö ja sen kuvautuminen
Pisteen P = (a, b) r-ympäristöllä Y (P ; r) tarkoitettaan seuraavassa P keskistä rsäteistä ympyrää Y (P ; r) = { Q ∈ R × R | d(Q, P ) < r } .
Määritelmä 3.43.
Oletetaan, että funktio z = f (x, y) on määritelty pisteen P = (a, b) rympäristössä, pis-
tettä P mahdollisesti lukuunottamatta. Funktiolla f on raja-arvo A pisteessä (a, b), jos jokaista positiivilukua ε kohti on olemassa sellainen positiiviluku δε , että |f (x, y) − A| < ε aina, kun 0
0 mielivaltainen reaaliluku. Oletetaan, että d((x, y), P ) < ε/2.
Koska d(P, (x, y)) =
p p (x − 1)2 + (y − 2)2 ≥ (x − 1)2 = |x − 1|,
niin voimme päätellä, että tällöin myös |x − 1| < ε/2. Samoin näemme, että |y − 2| < ε/2. Haluttu epäyhtälö seuraa nyt kolmioepäyhtälöstä seuraavasti
|f (x, y) − 3| = |x + y − 3| = |(x − 1) + (y − 2)| ≤ |x − 1| + |y − 2|
0. Näin voidaan kirjoittaa
kun (0 0 (tai f ′ (x) < 0). Se, että f on tällöin aidosti kasvava (vähenevä) ko. x:n arvoilla, todistetaan myöhemmin.
y = f (x)
y = f −1 (x) (a, b)
PSfrag repla ements
(b, a)
Kuva 4.3: Funktion ja käänteisfunktion kuvaajien tangentit
Käänteisfunktion derivaatan kaavalla on ilmeinen geometrinen tulkinta. Rajoitetaan x (vast. y ) pisteen a (vast. b) sellaiseen ympäristöön, jossa käänteisfunktio on olemassa. Kun rajoitamme muuttujien x ja y arvot näihin ympäristöihin, niin y = f (x) ⇔ x = f −1 (y). Näin ollen piste (x, y) on funktion f (x) kuvaajalla silloin
ja vain silloin, kun sen peilikuvapiste (y, x) (peilikuva suoran y = x suhteen) on käänteisfunktion x = f −1 (y) kuvaajalla. Sama peilaus vie tällöin alkuperäisen kuvaajan tangentin käänteisfunktion kuvaajan tangentiksi. 111
Tällöin tangentin kulmakerroin k muuttuu käänteisluvukseen 1/k , sillä (y − b) = k(x − a)
⇔
(x − a) =
1 (y − b). k
Kuvassa 4.3 tämä näkyy myös siten, että peilikuvapisteisiin (a, b) ja (b, a) piirretyt tangentit leikkaavat suoralla y = x (kuvan harmaa suora). Sovelletaan Lausetta 4.26 nyt arkusfunktioihin, jolloin niiden derivointikaavat saadaan trigonometristen funktioiden derivaattojen avulla.
Esimerkki 4.27.
(i) D arcsin x =
√ (ii) D arccos x = −1/ 1 − x2 ,
(iii) D arctan x =
√ 1/ 1 − x2 ,
−1 < x < 1 ,
−1 < x < 1 ,
1/(1 + x2 ) ,
∀x ∈ R ,
(iv) Dar
ot x = −1/(1 + x2 ) ,
∀x ∈ R .
Ratkaisu. (i) Merkitään y = arcsin x , jolloin x = sin y . Koska D sin y = cos y > 0 välillä −π/2 < y < π/2 ,
niin Lauseiden 4.21 ja 4.26 nojalla
D arcsin x =
kun −1 < x < 1 .
1 1 1 1 = √ , = = p 2 D sin y cos y 1 − x2 + 1 − sin y
(ii) Johdetaan analogisesti kohdan (i) kanssa tai käyttäen tulosta arccos x =
π 2
− arcsin x , jolloin saadaan
1 , D arccos x = −D arcsin x = − √ 1 − x2
kun −1 < x < 1 .
(iii) Merkitään y = arctan x ja käsitellään kuten kohdassa (i), jolloin saadaan D arctan x =
1 1 1 , = = D tan y 1 + x2 1 + tan2 y
kun x ∈ R .
(iv) Johdetaan analogisesti kohdan (iii) kanssa.
Esimerkki 4.28.
Pikku-Kalle (K ) katselee rautatieasemalla lähestyvää veturia (Kuva 4.4). Hän seisoo
kohtisuoraan mitattuna 10 metrin etäisyydellä kiskojen keskellä olevasta pisteestä (O). Kun lähestyvä veturi on pisteessä V 25 metrin etäisyydellä pisteestä O sen nopeus on 5 m/s. Millä (kulma)nopeudella Pikku-Kallen katse kääntyy tuolla hetkellä?
Ratkaisu. Olkoon x(t) veturin etuosan V
etäisyys pisteestä O hetkellä t, ja olkoon ϕ = 6 OKV , mikä sekin
on ajan funktio ϕ = ϕ(t). Kuvasta näemme, että tan ϕ = x(t)/KO = x(t)/10, josta voimme ratkaista ϕ(t) = arctan
112
x(t) . 10
O
PSfrag repla ements
K
V
ϕ
Kuva 4.4: Pikku-Kalle (K) ja veturi (V)
Tästä derivoimalla saadaan ϕ′ (t) =
dϕ 1 x′ (t) . = · dt 10 1 + (x(t)/10)2
Koska veturi liikkuu vasemmalle, kyseisellä hetkellä t0 on x(t0 ) = 25 (metriä) ja x′ (t0 ) = −5 (metriä
sekunnissa). Siis ϕ′ (t0 ) = −5/(10 · (1 + (25/10)2)) = −0,069 (radiaania sekunnissa), mikä on ≈ −3,95 astetta sekunnissa. Pikku-Kallen katse kääntyy siis hetkellä t0 vasemmalle noin 4 astetta sekunnissa.
4.6 Logaritmi ja eksponenttifunktion derivointi Lemma 4.29. lim
x→0
ln(1 + x) = 1. x
Todistus. Käyttäen Lausetta 3.18, sen Seurausta sekä logaritmifunktion jatkuvuutta voidaan kirjoittaa 1 ln(1 + x) = lim ln (1 + x) x = ln e = 1 . x→0 x→0 x
lim
Äskeisen raja-arvotuloksen esteettinen muoto jo antaa viitteitä siihen, miksi Neperin luku on luonnollinen valinta logaritmin kantaluvuksi. Seuraavat erikantaisten logaritmien derivaattoja koskevat tulokset selvittävät tämän lopullisesti.
Lause 4.30. D loga x =
1 , kun x > 0 . x ln a
Todistus. Muodostetaan erotusosamäärä ja käytetään Lemmaa 4.29 loga (x + h) − loga x 1 x+h 1 ln 1 + hx = loga = · h h x ln a h h ln 1 + x h→0 1 1 → · . = h x ln a x ln a x
Kun Lauseessa 4.30 valitaan a = e, saadaan
113
Seuraus 4.31. D ln x =
1 , kun x > 0 . x
Vastaavasti myös eksponenttifunktioiden puolella Neperin luku kantalukuna johtaa yksinkertaisempiin lausekkeisiin.
Lause 4.32. Dax = ax ln a .
Todistus. Merkitään y = ax , jolloin x = loga y . Lause 4.26 antaa nyt Dax =
1 = y ln a = ax ln a . D loga y
Valitsemalla taas erityisesti a = e, saadaan
Seuraus 4.33. Dex = ex .
Nyt voidaan muodostaa hyperbeli ja areafunktioiden derivointikaavat.
Lause 4.34.
(i) D sinh x =
(ii) D cosh x = (iii) D tanh x =
cosh x ,
sinh x , 1/ cosh2 x = 1 − tanh2 x ,
(iv) D coth x = −1/ sinh2 x = 1 − coth2 x ,
Todistus. (i) D sinh x =
x 6= 0 .
1 x 1 e + e−x = cosh x . D ex − e−x = 2 2
(ii) Todistetaan analogisesti kohdan (i) kanssa. (iii)
sinh x cosh2 x − sinh2 x = cosh x cosh2 x 1 = = 1 − tanh2 x . cosh2 x (iv) Todistetaan analogisesti kohdan (iii) kanssa. D tanh x = D
Esimerkki 4.35.
Johdetaan kaavat hyperbelifunktioiden käänteisfunktioiden derivaatoille
√ (i) D arsinh x = 1/ x2 + 1 , √ (ii) D arcosh x = 1/ x2 − 1 ,
x>1
114
(iii) D artanh x = 1/(1 − x2 ) ,
|x| < 1 ,
(iv) D arcoth x = 1/(1 − x2 ) ,
|x| > 1 .
Ratkaisu. Todistus voidaan suorittaa joko käyttäen hyperbelifunktioiden derivointisääntöjä ja käänteisfunktion derivointikaavaa tai areafunktioiden logaritmimuotoja (pykälä 1.6.4). Seuraavassa käytetään jälkimmäistä menettelyä. (i) Koska arsinh x = ln x +
√ x2 + 1 , niin
D(arsinh x) =
x 1 1 √ · 1+ √ . =√ x + x2 + 1 x2 + 1 x2 + 1
(ii) Todistetaan analogisesti kohdan (i) kanssa. (iii) Koska artanh x =
niin D(artanh x) =
1 1+x ln , 2 1−x
1 1 1−x 1−x+1+x = . · · 2 2 1+x (1 − x) 1 − x2
(iv) Todistetaan analogisesti kohdan (iii) kanssa.
4.7 Logaritminen derivointi ja korkeammat derivaatat Eräiden funktioiden derivointia voidaan joskus yksinkertaistaa, kun siirrytään tarkastelemaan funktion logaritmin derivaattaa. Menetelmä perustuu seuraavaan lauseeseen.
Lause 4.36.
Jos f on derivoituva funktio ja f (x) 6= 0 , niin pisteessä x D ln |f | =
Todistus. Jos f (x) > 0, niin |f | = f
Df . f
ja tulos on selvä logaritmin derivaatan ja ketjusäännön nojalla. Jos
taas f (x) < 0, niin |f | = −f ja nytkin em. tulosten mukaan D ln |f | = D ln(−f ) =
Seuraus 4.37.
−Df Df D(−f ) = = . −f −f f
(Logaritminen derivointi.) Edellisen lauseen oletuksin Df = f · D ln |f | .
Esimerkki 4.38.
Perustellaan potenssifunktion f (x) = xα , x > 0 derivointikaavan Dxα = αxα−1
voimassaolo myös siinä tapauksessa, missä α ei ole kokonaisluku. 115
Ratkaisu. Logaritmifunktion ominaisuuksien perusteella ln f (x) = α ln x.
Koska D(α ln x) = α/x saadaan tästä logaritmisesti derivoimalla Df (x) =
Esimerkki 4.39.
α α f (x) = xα = αxα−1 . x x
Määrää funktion f (x) = xx
derivaatta.
Ratkaisu.
Logaritmin perusominaisuuksien avulla näemme, että ln f = x ln x, jonka derivoimme tulon
derivoimissäännöllä D(ln f ) = 1 · ln x + xD(ln x) = ln x + x
1 = ln x + 1 . x
Saamme sitten etsityn derivaatan laskusta Df = f D ln f = xx (1 + ln x).
Logaritmisen derivaatan useammin esiintyvä merkitys on siinä, että kun tavallinen derivaatta mittaa funktion f = f (t) absoluuttista muuttumisnopeutta df /dt, niin logaritminen derivaatta mittaa suhteellista muuttumisnopeutta (df /dt)/f , eli pienessä ajassa (tai lyhyellä matkalla tms.) tapahtuvan muutoksen suhdetta suureen arvoon. Tällainen ilmiön kuvaus esiintyy käytännössä hyvin usein, kun ilmiö on luonteeltaan suuren joukon tilastollista käyttäytymistä. Joukon oliot ovat identtisiä, ja kukin osallistuu toisistaan riippumattomasti muutokseen jollakin todennäköisyydellä, joka lyhyellä (aika- tai matka-) välillä on verrannollinen välin pituuteen. Esimerkiksi ydinjätteen radioaktiivista hajoamista kuvattaessa tarkastellaan suurta määrää (Avogadron luvun suuruusluokkaa) plutonium-atomeja, joista kukin hajoaa lyhyellä aikavälillä (tässä tapauksessa vuosi on lyhyt aikaväli) tietyllä todennäköisyydellä. Samalla tavalla voidaan kuvata populaation kasvua (tietty osuus naaraista tuottaa jälkeläisen vuoden kuluessa, tai jokainen bakteeri jakautuu kahdeksi tietyllä todennäköisyydellä), korkoa korolle (lainan pääoma kasvaa p % vuodessa, tai kansantalous kasvaa p % vuodessa). Tai millin paksuinen lyijylevy absorboi säteilystä q % . . .
Esimerkki 4.40.
Oletetaan, että tilin (tai lainan) saldoon lisätään `jatkuvasti' (eikä esimerkiksi vuosittain)
korkoa p%, eli lyhyen ajanjakson ∆t kuluessa saldo S(t) muuttuu seuraavasti p ∆t . S(t + ∆t) = S(t) 1 + 100 116
Oletetaan, että aluksi saldo on S(0) = S0 . Perustele, miksi tällöin myöhemmillä ajan hetkillä t > 0 S(t) = S0 ep t/100 .
Osoita, että funktion S(t) logaritminen derivaatta on tällöin p dS/dt = . S(t) 100
Ratkaisu. Kuvitellaan aluksi, että korko olisi aikavälillä [0, t] lisätty pääomaan n kertaa. Tällöin kullakin osavälillä on aikaa kulunut ∆t = t/n yksikköä. Ylläolevan korkokaavan mukaan tällöin aina ajan ∆t jälkeen saldo kerrotaan luvulla (1 + (pt/n)/100), joten hetkellä t olisi tämän mukaan saldo n p t/100 1 + Sn = S0 . n
Tämän jonon (Sn ) raja-arvo, kun n → ∞ vastaa sitten tilannetta, jossa korko liitetään saldoon jatkuvasti (∆t = t/n → 0+). Otetaan käyttöön lyhennysmerkintä γ = p t/100 > 0. Tarkastelujemme perusteella γ n S(t) = lim S0 1 + . n→∞ n
Tämä muistuttaa jo kovasti Neperin luvun määrittelevää raja-arvoa. Merkitään x = n/γ , jolloin n = γx, ja myös x → ∞. Tällöin
1+
xγ 1 1+ x x γ 1 = 1+ x
γ n = n
x→∞
→ eγ .
Sijoittamalla tämä aiempaan lausekkeeseen saadaan väitetty S(t) = S0 eγ = S0 ep t/100 .
Tällöin ketjusäännön perusteella S ′ (t) = dS/dt = (p/100)S(t), joten tämän funktion logaritminen derivaatta on väitetty vakio p/100. Tämä ratkaisu on hieman kömpelö, ja haluankin korostaa lukijoille, että selkeämpi ratkaisu saadaan formuloimalla pääoman kasvua kuvaava yhtälö ns. dierentiaaliyhtälönä, kunhan on hankittu perustiedot vakiokertoimisten lineaaristen dierentiaaliyhtälöiden käsittelystä. Jos funktion f derivaattafunktio Df derivoidaan, saadaan f :n toisen kertaluvun derivaatta, josta käytetään merkintöjä
d2 y d2 f ′′ , y , . dx2 dx2 Yleisesti funktion f n:nnen kertaluvun derivaatta (lyhyesti n:s derivaatta) f (n) määritellään ehdolla f ′′ ,
D2 f ,
f (n) = Df (n−1) ,
missä n = 2, 3, . . . . Usein sovitaan lisäksi, että f (0) = f . Vastaavasti n:nnen derivaatan merkintöjä ovat Dn f ,
dn f , dxn
y (n) ,
117
dn y . dxn
Esimerkki 4.41.
Funktion f (x) = ex kaikkien kertalukujen derivaatat selvästi ovat olemassa ja yhtyvät, eli
kaikille n > 0 on voimassa Dn f (x) = ex . Toinen derivaatta esiintyy usein luonnonilmiötä kuvattaessa. Kun muuttujana on aika, toinen derivaatta kertoo muutosnopeuden muuttumisnopeuden. Mekaniikassa tätä kutsutaan kiihtyvyydeksi.
Esimerkki 4.42.
Aikaisemmin totesimme (Esimerkki 4.24), että harmonisen värähtelijän x(t) = A cos ωt
nopeus hetkellä t on v(t) =
dx = −Aω sin ωt. dt
Derivoimalla tämä uudelleen saadaan värähtelijän kiihtyvyydelle lauseke a(t) =
dv d2 x = 2 = −Aω 2 cos ωt. dt dt
Huomataan, että a(t) = −ω 2 x(t), eli kiihtyvyys a(t) saadaan poikkeamasta x(t) kertomalla se vakiolla −ω 2 . Yhdistämällä tämä Newtonin liikelain F = ma(t) (m on värähtelevän kappaleen massa) ja jousen
värähtelijään kohdistaman harmonisen voiman kaavan F = −kx(t) (k on ns. jousivakio) kanssa saadaan
tästä yhteys k = mω 2 . Jos m ja k voidaan mitata, tästä yhtälöstä voidaan ratkaista värähtelyn kulmanopeus p ω = k/m, ja siten myös värähtelyn taajuus f = ω/(2π).
4.8 Kaksi likimääräismenetelmää yhtälön ratkaisemiseksi Tarkastellaan yhtälön f (x) = 0
ratkaisemista. Juuren täsmällisen arvon löytäminen ei aina onnistu tai sen etsiminen voi olla hyvinkin hankalaa. Yhden menetelmän juuren likiarvon etsimiseen tarjoaa aikaisemmin käsitelty Bolzanon lause (Lause 3.31), ja se tunnetaan haarukointina. Ideana on etsiä lyhyempiä ja lyhyempiä välejä, joiden päätepisteissä funktio f saa erimerkkiset arvot, jolloin tiedämme, että kyseisellä välillä on nollakohta. Seuraavassa esitetään kaksi hieman kehittyneempää tapaa: peräkkäisten sijoitusten menetelmä ja Newtonin menetelmä. Näiden menetelmien toimivuuden perinpohjainen selvittäminen kuuluu kurssille Numeerinen Analyysi.
4.8.1 Peräkkäisten sijoitusten menetelmä Kirjoitetaan ratkaistava yhtälö muotoon x = g(x) .
Tämä voidaan tietenkin suorittaa yleensä monella tavalla, jolloin eri tavat johtavat erilaisiin g -funktioihin. Valitaan lähtökohdaksi juuren likiarvo x0 . Käyttämällä iteraatiokaavaa xn+1 = g(xn ) ,
missä n = 0, 1, 2, . . .
saadaan jono x0 , x1 , x2 , . . . Voidaan todistaa, että jos ehto |g ′ (x)| < 1 on voimassa em. yhtälön juuren x = ξ ympäristössä, jossa tarkastelut suoritetaan, niin ko. jonon raja-arvona on ξ . 118
y 1.2
1
0.8
0.6
0.4
PSfrag repla ements
0.2
0.25
0.5
1
0.75
1.25
1.5
x
Kuva 4.5: Yhtälön cos x = x likimääräisratkaisun hakeminen iteroimalla
Esimerkki 4.43.
Selvästi funktion f (x) = cos x − x arvo pisteessä x = 0 on positiivinen, ja pisteessä x = 1
taas negatiivinen, joten Bolzanon lauseen nojalla yhtälöllä cos x = x
on ratkaisu x ∈ (0, 1). Haetaan sen likiarvo iteroimalla.
Ratkaisu. Asetetaan x0 = 0,5. Jono (xn ) määräytyy tästä rekursiivisesti palautuskaavalla xn+1 = cos xn ,
n ≥ 0.
Laskimella saadaan likiarvoja x1 = 0,878, x2 = 0,639, x3 = 0,803, x4 = 0,695, . . ., x20 = 0,73901 . . ., x40 = 0,739085, ja tässä näyttäisi olevan jo 6 vakiintunutta desimaalia. Mieti palautuskaavan luonnetta niin kauan,
että ymmärrät Kuvan 4.5 neljän pystysuoran harmaan viivan olevan juuri kohdissa x = x0 , x = x1 , x = x2 ja x = x3 . Menetelmän konvergointi tarkoittaa sitä, että harmaa murtoviiva jatkuu kohti pistettä (a, a) sisäänpäin kiertyvänä spiraalina. Tässä a = limn→∞ xn ≈ 0,739.
4.8.2 Newtonin menetelmä Oletetaan, että f on derivoituva funktio yhtälön f (x) = 0 juuren x = ξ ympäristössä, jossa tarkastelut suoritetaan. Valitaan x = x0 iteraation lähtökohdaksi. Käyrän pisteeseen (x0 , f (x0 )) liittyvä tangentti y − f (x0 ) = f ′ (x0 )(x − x0 )
leikkaa xakselin pisteessä x = x0 −
f (x0 ) f ′ (x0 )
edellyttäen, että f ′ (x0 ) 6= 0. Merkitään tätä x:n arvoa x1 :llä ja siirrytään samalla menetelmällä iteraation seuraavaan vaiheeseen.
119
Yleinen iteraatiokaava on siis xn+1 = xn −
f (xn ) , f ′ (xn )
missä n = 0, 1, 2, . . .
Voidaan todistaa, että iteraation avulla saatava jono x0 , x1 , x2 , . . . suppenee kohti ξ :tä edellyttäen, että ehto f (x)f ′′ (x) f (a) tai f (x) < f (a) . Tarkastellaan seuraavassa edellistä vaihtoehtoa. Lauseen 3.39 nojalla funktiolla f on välillä [a, b] suurin ja pienin arvo. Olkoon siis c jokin sellainen piste, jossa suurin arvo saavutetaan. Koska f (c) > f (a) = f (b) , niin c ei voi olla a eikä b , joten a < c < b . Osoitetaan nyt, että f ′ (c) = 0.
Koska f (c) on suurin arvo, niin f (c + h) ≤ f (c) aina, kun |h| on niin pieni, että c + h ∈ [a, b] . Täten
tällaisilla h:n arvoilla on
f (c + h) − f (c) h
( ≤ 0 , kun h > 0 , ≥ 0 , kun h < 0 ,
joten f ′ (c+) ≤ 0 ja f ′ (c−) ≥ 0 . Koska f oletuksen mukaan on derivoituva c:ssä, niin f ′ (c) = f ′ (c+) = f ′ (c−) ja siis ainoana mahdollisuutena f ′ (c) = 0 .
Samaan tulokseen päädytään vaihtoehdossa f (x) < f (a) käyttämällä f :n suurimman arvon sijasta pienintä arvoa välillä (a, b) .
Seuraus 4.46.
Derivoituvalla funktiolla on aina kahden nollakohtansa välissä vähintään yksi derivaatan
nollakohta.
Seuraus 4.47.
Oletetaan, että funktiolla f on derivaatat k :nteen kertalukuun saakka. Jos yhtälöllä f (x) = 0
on n reaalijuurta, niin yhtälöllä f (k) (x) = 0 on vähintään n − k reaalijuurta.
Seuraus 4.48. Oletetaan, että funktiolla f on derivaatat k:nteen kertalukuun saakka. Jos yhtälöllä f (k) (x) = 0 on korkeintaan m reaalijuurta, niin yhtälöllä f (x) = 0 on korkeintaan m + k reaalijuurta.
121
Lause 4.49.
(Dierentiaalilaskennan väliarvolause =DVAL.) Jos funktio f on jatkuva suljetulla välillä [a, b]
ja derivoituva avoimella välillä (a, b) , niin välillä (a, b) on ainakin yksi sellainen piste ξ , että f (b) − f (a) = f ′ (ξ)(b − a) . y
PSfrag repla ements a
ξ
b
x
Kuva 4.8: DVAL: kuvaajan kahta pistettä yhdistävä sekantti on yhdensuuntainen jonkin tangentin kanssa
Geometrisesti väliarvolause merkitsee, että käyrän y = f (x) tangentti on välin [a, b] jossakin pisteessä sekantin suuntainen (Kuva 4.8).
Todistus. Muodostetaan apufunktio F , joka merkitsee käyrän ja sekantin ordinaattojen erotusta F (x) = f (x) −
f (b) − f (a) (x − a) − f (a) . b−a
Muodostamistapansa takia F on jatkuva välillä [a, b] ja derivoituva välillä (a, b) . Edelleen on F (a) = F (b) = 0 . Täten F toteuttaa Rollen lauseen ehdot, ja siis välillä (a, b) on ainakin yksi sellainen ξ , että F ′ (ξ) = f ′ (ξ) −
josta seuraa väite.
Seuraus 4.50.
f (b) − f (a) = 0, b−a
(Integraalilaskennan peruslause.) Jos f ′ (x) = 0 jollakin välillä I , niin tällä välillä f (x) =
vakio.
Todistus. Jos a, x ∈ I
ja a < x , niin soveltamalla väliarvolausetta välillä [a, x] saadaan f (x) − f (a) = 0 · (x − a) = 0 ,
joten f (x) = f (a) .
Seuraus 4.51.
Jos f ′ (x) = g ′ (x) välillä I , niin on sellainen vakio C(∈ R) , että f (x) = g(x) + C
koko välillä. 122
Todistus. Käytetään Seurausta 4.50 funktioon h(x) = f (x) − g(x) . Seuraavassa tarkastellaan tärkeää yhteyttä, joka vallitsee derivoituvan funktion (aidon) monotonisuuden (vrt. Määritelmä 1.60) ja derivaatan merkin välillä.
Seuraus 4.52.
Jos välillä [a, b] jatkuva funktio f toteuttaa ehdon f ′ (x) ≥ 0 ,
∀x ∈ (a, b) ,
niin f on kasvava välillä [a, b] . Jos lisäksi yhtälö f ′ (x) = 0 ei ole voimassa millään [a, b]:n osavälillä (vaan enintään välin [a, b] yksittäisissä pisteissä), niin f on aidosti kasvava välillä [a, b] . Vastaava tulos on voimassa derivaatan negatiivisuuden ja funktion vähenevyyden välillä.
Todistus. Jos x1 , x2 ∈ [a, b] ja x1 < x2 , niin väliarvolauseen nojalla on sellainen ξ ∈ (x1 , x2 ) , että f (x2 ) − f (x1 ) = f ′ (ξ)(x2 − x1 ) ≥ 0 ,
joten f (x1 ) ≤ f (x2 ) ja siis f on kasvava.
Aitoa kasvavuutta koskeva osa todistetaan epäsuorasti. Jos f ei kasva aidosti, niin jollakin osavälillä f =
vakio. Tällä osavälillä olisi siis f ′ (x) = 0 vastoin oletusta.
Esimerkki 4.53.
Todista, että kaikilla x ∈ R on voimassa epäyhtälö cos x ≥ 1 −
Ratkaisu.
x2 . 2
Koska väite-epäyhtälön molemmat puolet ovat muuttujan x parillisia funktioita, niin voimme
rajoituksetta olettaa, että x ≥ 0. Muodostetaan funktio f (x) = 1 −
x2 − cos x. 2
Heti näemme, että f (0) = 1 − 0 − 1 = 0. Muodostetaan sen derivaatta f ′ (x) = −x + sin x = sin x − x.
Lemman 3.7 nojalla sin x < x aina, kun x > 0, joten Seurauksen 4.52 nojalla funktio f on aidosti vähenevä. Siis f (x) < 0 aina, kun x > 0, ja väite seuraa. Tekemällä kokeita laskimella näemme, että kun x on kohtuullisen pieni, niin tämä epäyhtälö on itse asiassa sangen tarkka, ja kyseinen toisen asteen polynomi approksimoi kosinia sangen hyvin (|x| < 0,2 ⇒
virhe < 1/10000). Tämä saa selityksen kurssilla Analyysi II.
Jatkossa tarvitsemme tiedon siitä, että tutkittavalla funktiolla on käänteisfunktio, jos rajaamme sen määrittelyjoukon sopivan pienelle välille. Nämä tulokset ovat kaikki jo esiintyneet, mutta kootaan ne yhteen ns. käänteisfunktiolauseeksi. Myöhemmillä kursseilla käänteisfunktiolauseesta esitetään (ja lopulta myös todistetaan) useamman muuttujan vektoriarvoisia funktioita (f : Rn → Rn ) koskeva versio.
Lause 4.54. (Käänteisfunktiolause) Oletetaan, että funktio f (x) on derivoituva, ja että sen derivaattafunktio f ′ (x) on jatkuva jossakin pisteen a ympäristössä. Oletetaan lisäksi, että f (a) = b ja että f ′ (a) 6= 0. Tällöin
on olemassa sellaiset suljetut välit I1 = [x0 , x1 ] ja I2 = [y0 , y1 ], että a ∈ (x0 , x1 ), b ∈ (y0 , y1 ) ja 123
(i) f : I1 → I2 on aidosti monotoninen bijektio, joten sillä on käänteisfunktio, (ii) g = f −1 : I2 → I1 on sekin aidosti monotoninen ja jatkuvasti derivoituva, (iii) g ′ (b) = 1/f ′ (a).
Todistus. Valitaan väli I1 siten, että f ′ (x) ei sillä välillä muuta merkkiään. Tällöin f on kyseisellä välillä aidosti monotoninen. Olkoot y0 ja y1 välin I1 päätepisteiden kuvat siinä järjestyksessä, että y0 < y1 . Merkitään I2 = [y0 , y1 ]. Koska f on jatkuva, saa se Lauseen 3.32 nojalla arvoikseen kaikki välin I2 luvut, ja monotoni-
suuden vuoksi vain ne. Siis funktion f rajoittuma välille I1 on bijektio f : I1 → I2 , ja sillä on käänteisfunktio g . Käänteisfunktion derivaatan lauseke ja funktion g monotonisuus on nekin todistettu aiemmin.
Huomaa, että tässä tietenkin luvun a roolin voi ottaa mikä tahansa välin (x0 , x1 ) piste, ja erityisesti siis derivointikaava g ′ (f (x)) = 1/f ′ (x) on voimassa kaikilla x ∈ (x0 , x1 ).
Väliarvolausetta voidaan käyttää myös funktion arvon arvioimiseen pisteessä x = b , kun arvo pisteessä
x = a tunnetaan. Tämä tapahtuu kirjoittamalla väliarvolauseen mukainen kaava muotoon f (b) = f (a) + f ′ (ξ)(b − a) ,
missä ξ on a:n ja b:n välissä, ja arvioimalla tässä derivaattaa f ′ (ξ) . Tätä menettelyä voi soveltaa myös virheen arvioimiseen, jos funktion arvo kohdan x = b sijasta joudutaankin laskemaan kohdassa x = a .
4.9.1 l'Hospitalin sääntö Seuraavassa esitetään menetelmä, jonka avulla usein voi määrittää raja-arvon, joka alunperin näyttää johtavan epämääräiseen muotoon 0/0 . Sopivasti muokaten menetelmää voidaan soveltaa myös muihin epämääräisiin muotoihin. Aluksi tarvitaan eräitä aputarkasteluja.
Lause 4.55.
(Yleistetty väliarvolause.) Jos funktiot f ja g ovat jatkuvia suljetulla välillä [a, b] ja derivoituvia
avoimella välillä (a, b) , niin välillä (a, b) on ainakin yksi sellainen piste ξ , että f ′ (ξ)(g(b) − g(a)) = g ′ (ξ)(f (b) − f (a)) .
Todistus. Helposti nähdään, että funktio h(x) = (f (x) − f (a))(g(b) − g(a)) − (g(x) − g(a))(f (b) − f (a))
toteuttaa Rollen lauseen (Lause 4.45) oletukset. Täten siis on olemassa sellainen ξ ∈ (a, b) , että h′ (ξ) = 0 ,
josta väite seuraa.
Lauseesta 4.55 saadaan `tavallinen' väliarvolause (Lause 4.49), kun valitaan g(x) = x .
124
Seuraus 4.56.
Jos Lauseen 4.55 oletusten lisäksi g ′ (ξ) 6= 0 välillä (a, b) , niin ko. lauseen tuloksena saatu
kaava voidaan kirjoittaa muodossa
f ′ (ξ) f (b) − f (a) = . ′ g (ξ) g(b) − g(a)
Todistus. Lisäoletuksen nojalla g(b) − g(a) 6= 0 , sillä jos olisi g(a) = g(b) , niin g täyttäisi Rollen lauseen ehdot ja siten välin (a, b) jossakin pisteessä c olisi g ′ (c) = 0 vastoin oletusta. Täten Lauseen 4.55 kaava
voidaan jakaa termeillä g ′ (ξ) 6= 0 ja g(b) − g(a) 6= 0 .
Lause 4.57.
(l'Hospitalin sääntö.) Oletetaan, että (a voi olla myös ± ∞) ,
lim f (x) = lim g(x) = 0
x→a
x→a
f ′ (x) x→a g ′ (x) lim
on olemassa (äärellisenä tai äärettömänä).
Silloin
f ′ (x) f (x) = lim ′ . x→a g (x) x→a g(x) lim
(Sama pätee vaikka tavallisen raja-arvon sijasta tarkastellaan toispuoleista raja-arvoa.)
Todistus.
Oletetaan ensin, että a on äärellinen. Määritellään f (a) = g(a) = 0 , jolloin f ja g tulevat
jatkuviksi pisteessä a. Valitaan nyt x niin läheltä lukua a, että f ja g toteuttavat Lauseen 4.55 oletukset välillä [a, x] (tai [x, a] , jos x < a) ja siis f ′ (ξ)g(x) = g ′ (ξ)f (x) ,
missä ξ ∈ (a, x) (tai ξ ∈ (x, a)). Oletuksen (ii) nojalla lisäksi g ′ (x) 6= 0 jossakin a:n ympäristössä (x 6= a). Lauseen 4.55 seurauksen mukaan
f ′ (ξ) f (x) = , g ′ (ξ) g(x)
kun |x − a| 6= 0 on tarpeeksi pieni. Kun nyt x → a , niin myös ξ → a , joten väite seuraa edellisestä yhtälöstä. Suoritettu todistus pysyy voimassa myös toispuoleisten raja-arvojen tapauksessa.
Tapaukset a = ±∞ palautuvat edelliseen merkitsemällä t = 1/x , jolloin f 1t f (x) = lim lim x→±∞ g(x) t→0± g 1 t f ′ 1t − t12 f ′ (x) = lim ′ . = lim ′ 1 1 x→±∞ g (x) t→0± g − t2 t L'Hospitalin sääntö on voimassa myös
∞ ∞ muodoille,
lim f (x) = ±∞ ,
x→a
ts. jos Lauseen 4.57 ehto (i) korvataan ehdoilla
lim g(x) = ±∞ .
x→a
Useat muutkin epämääräiset muodot voidaan palauttaa edellisiin muokkaamalla lausekkeita sopivasti. 125
Jos esimerkiksi f (x) → 1 ja g(x) → ∞, niin rajaarvotarkastelu f (x)g(x) johtaa epämääräiseen muotoon
1∞ . Kirjoitetaan
f (x)g(x) = eg(x) ln f (x)
ja siirrytään tarkastelemaan eksponentin raja-arvoa (mahdollisesti l'Hospitalin sääntöä käyttäen). Tästä tavasta on myös seuraava muunnos: Jos limx→a f (x) = 1 ja limx→a g(x) = ∞ (ja f ′ (x) 6= 0 jossakin a:n ympäristössä, x 6= a) , niin lim f (x)g(x) = elimx→a (f (x)−1)g(x) ,
x→a
sillä l'Hospitalin säännön perusteella ln f · lim(f − 1)g f −1 f ′ /f = lim ′ · lim(f − 1)g = lim(f − 1)g . f
lim g ln f = lim
Esimerkki 4.58.
Tutki Lemman 4.29 raja-arvoa lim
x→0+
ln(1 + x) x
l'Hospitalin säännön avulla.
Ratkaisu. Tämä raja-arvo on 0/0-muotoa, joten l'Hospitalin sääntöä voidaan käyttää: ln(1 + x) ℓ′ H 1/(1 + x) 1/1 = lim = = 1, x→0+ x→0+ x 1 1 lim
koska epämääräisyys poistui derivoinnin jälkeen, ja meille jäi jatkuva alkeisfunktio. Mutta, mutta, MUTTA . . .! Tätä raja-arvoahan käytettiin, kun johdettiin kaava logaritmifunktion derivaatalle. Jos yrittäisimme korvata Lemman 4.29 todistuksen l'Hospitalin säännöllä, syyllistyisimme kehäpäättelyyn, eli yrittäisimme pelkkien implikaatioiden p ⇒ q ja q ⇒ p avulla tehdä johtopäätöksen lauseiden p
ja q totuudesta. Vältyimme kehäpäättelyltä todistamalla Lemman 4.29 toisin. Jatkossa voit (ellei sitä esimerkiksi tentissä erikseen kielletä, jolloin tehtävänä on todennäköisimmin juuri johtaa kyseinen derivointisääntö) kyllä käsitellä tämänkaltaisia raja-arvoja halutessasi l'Hospitalin säännön avulla.
Esimerkki 4.59.
Laske raja-arvo lim
x→0
sin x − x x3
l'Hospitalin sääntöä käyttäen.
Ratkaisu. Tämäkin raja-arvo on 0/0-muotoa Sangen usein l'Hospitalin sääntöä käytettäessä saatu uusikin raja-arvo on epämääräistä 0/0-muotoa. Tällöin ei alkeisfunktioiden tapauksessa yleensä ole mitään estettä käyttää sääntöä uudelleen! sin x − x ℓ′ H cos x − 1 = lim x→0 x→0 x3 3x2 ′ − sin x ℓH = lim x→0 6x 1 = − . 6 lim
(tämäkin on 0/0-muotoa, koska cos 0 = 1) (käytetään Lausetta 3.9)
126
4.9.2 Derivaatta funktion muutoksen arvioinnissa Toisinaan tarvitaan nopeaa ja yksinkertaista arviota sille, miten argumentin x pieni muutos ∆x vaikuttaa funktion f arvoon. Jos argumentti muuttuu arvosta x arvoon x + ∆x , niin olkoon funktion y = f (x) arvon muutos silloin y → (y + ∆y), ts. ∆y = f (x + ∆x) − f (x) .
Jos funktiolla f on kohdassa x äärellinen derivaatta, niin voidaan kirjoittaa ∆y = f ′ (x) + η(∆x) , ∆x
missä η(∆x) → 0 , kun ∆x → 0 . Täten siis
∆y = f ′ (x) · ∆x + η(∆x) · ∆x ,
missä ∆y on jaettu kahteen osaan. Edellinen yhteenlaskettava on päätermi, jota sanotaan f :n dierentiaaliksi pisteessä x ja merkitään dy = f ′ (x)∆x .
Jälkimmäinen yhteenlaskettava η(∆x) · ∆x on korjaustermin luonteinen, sillä sen ja dierentiaalin suhde η(∆x)∆x η(∆x)∆x η(∆x) = ′ = ′ → 0, df f (x)∆x f (x)
kun ∆x → 0 edellyttäen, että f ′ (x) 6= 0.
Kuvassa 4.9 tämä esitetään seuraavasti. Funktion todellinen kuvaaja kulkee pisteiden Q ja P kautta, ja
∆y = f (x + ∆x) − f (x) on niiden y -koordinaattien välinen erotus, eli funktion arvon todellinen muutos.
Vaikka kuvaajan pisteeseen P piirretty tangentti seuraa kuvaajaa sangen hyvin, se kuitenkin eroaa siitä jonkin verran. Kohdassa x + ∆x tangentti on pisteessä R, ja dy = df = pisteiden R ja P y -koordinaattien välinen erotus. Tarkastelemalla funktion f (x) = x dierentiaalia saadaan dx = 1 · ∆x = ∆x . Arvioimalla korjaustermi
nollaksi saadaan likimääräistys ∆y ≈ dy , ts.
f (x + dx) − f (x) ≈ f ′ (x)dx
eli f (x + dx) ≈ f (x) + f ′ (x)dx .
Tämä arvio pätee, kun dx on lähellä nollaa. Kuvan 4.9 tapauksessa ∆x on (kuvan selvyyden vuoksi) liian suuri, jotta likiarvo dy ≈ ∆y olisi uskottava. Seuraavan esimerkin tilanne on tyypillisempi.
Esimerkki 4.60.
Laske suureet dy ja ∆y , kun x = 0, f (x) =
Ratkaisu. Tällä kertaa f ′(x) = 1/2
√ 1 + x ja ∆x = 1/10.
√ 1 + x, joten f ′ (0) = 1/2. Näin ollen dy = f ′ (0)∆x = 1/20 = 0,05 ,
127
f (x) + dy
R
f (x) + ∆y
Q
PSfrag repla ements f (x)
P
x
x + ∆x
Kuva 4.9: Dierentiaali funktion arvon muutoksen likiarvona
ja ∆y = f (x + ∆x) − f (x) =
r
1+
√ 1 − 1 ≈ 0,049. 10
Tällä kertaa ∆y/dy ≈ 49/50 = 1−0,02, joten funktion arvon todellinen muutos ∆y poikkeaa dierentiaalista dy vain noin 2 prosenttia. Approksimaatio f (x + ∆x) ≈ f (x) + dy on sangen hyvä, sillä f (x + ∆x) ≈ 1,049
ja f (x) + dy = 1,05.
Aikaisemmin esitettyjen derivointikaavojen avulla voidaan nyt kirjoittaa dierentioimiskaavoja, esim. d(f + g) = df + dg , d(f g) = f dg + g df , g df − f dg f = , d g g2 d(f ◦ g) = f ′ dg .
Dierentiaalia käytetään myös virheenarvioinnissa. Kun x:n virhe dx on (itseisarvoltaan) pieni, niin edellä esitetyn likimääräistyksen mukaisesti f (x):n absoluuttinen virhe on ∆y ≈ f ′ (x) dx
(vrt. väliarvolauseen avulla saatu tulos) ja relatiivinen eli suhteellinen virhe on ∆y dy f ′ (x) ≈ = dx = d(ln f (x)) . y y f (x)
128
Dierentiaalin avulla voidaan myös kirjoittaa kaavoja, joista ilmenee funktion luonne esitettynä pelkistetyssä muodossa. Jos dx ≈ 0 ja merkitään sitä x:llä, niin tuloksen f (x) ≈ f (0) + f ′ (0)x mukaisesti saadaan esimerkiksi seuraavat likiarvokaavat, jotka ovat voimassa, kun x on lähellä nollaa: √ 1 1+x≈1+ x, 2 ex ≈ 1 + x , ln(1 + x) ≈ x , sin x ≈ x .
4.10 Osittaisderivaatoista Jos kahden muuttujan funktiossa z = f (x, y) toinen muuttujista kiinnitetään vakioksi, muodostuu yhden muuttujan funktio, jonka derivaattaa voidaan tarkastella normaaliin tapaan Määritelmän 4.2 pohjalta. Tällä tavalla saadaan funktion f osittaisderivaatat.
Määritelmä 4.61.
Funktion z = f (x, y) osittaisderivaatta x:n suhteen on f (x + h, y) − f (x, y) ∂z = lim ∂x h→0 h
edellyttäen, että tämä raja-arvo on äärellisenä olemassa. Osittaisderivaatta x:n suhteen saadaan siis derivoimalla x:n suhteen ja ajattelemalla y vakioksi. Tästä käytetään myös muita merkintöjä: ∂f , ∂x
Dx f ,
fx (x, y) ,
fx ,
zx .
Vastaavasti määritellään osittaisderivaatta y :n suhteen f (x, y + k) − f (x, y) ∂z = lim , ∂y k→0 k
jota merkitään myös seuraavasti ∂f , ∂y
Dy f ,
fy (x, y) ,
fy ,
zy .
Ensimmäisen kertaluvun osittaisderivaatat fx ja fy ovat jälleen x:n ja y :n funktioita. Kun ne edelleen derivoidaan, saadaan toisen kertaluvun osittaisderivaatat, jotka derivoimisjärjestyksestä riippuen ovat ∂2f ∂2f ∂2f ∂ ∂f ∂ ∂f ∂ ∂f ∂ ∂f ∂2f , , , . = = = = ∂x2 ∂x ∂x ∂y∂x ∂y ∂x ∂x∂y ∂x ∂y ∂y 2 ∂y ∂y Muita merkintöjä ovat esimerkiksi (vastaavassa järjestyksessä) fxx ,
fxy ,
fyx ,
fyy
ja Dx Dx f ,
Dy Dx f ,
Dx Dy f ,
129
Dy Dy f .
Esimerkki 4.62.
Jos f (x, y) = x2 + y 2 , niin fx = 2x ja fy = 2y .
Esimerkki 4.63.
Jos f (x, y) = xy , niin fx = y , fy = x ja siten fxx = fyy = 0 ja fxy = fyx = 1.
Esimerkki 4.64.
Muodostetaan funktion f (x, y) = e−(x
2
+y 2 )
kaikki ensimmäisen ja toisen kertaluvun osittaisderivaatat.
Ratkaisu.
Kun hetkellisesti pidämme muuttujaa y vakiona, niin näin saatu funktio on yksinkertaisesti
muuttujan x yhdistetty funktio g(h(x)), jossa ulkofunktiona on eksponenttifunktio g(x) = ex ja sisäfunktiona toisen asteen polynomi h(x) = −x2 − y 2 . Näin ketjusäännöllä saadaan 2 2 ∂f (x, y) = g ′ (h(x))h′ (x) = eh(x) (−2x) = −2xe−(x +y ) = −2xf (x, y). ∂x
Samalla tavalla saadaan fy =
2 2 ∂f (x, y) = −2ye−(x +y ) . ∂y
Toisen kertaluvun derivaattojen laskemiseen tarvitaan lisäksi tulon derivoimiskaavaa: 2
fxx =
∂e−(x +y ∂(−2x) −(x2 +y2 ) e + (−2x) ∂x ∂x
2
)
= (4x2 − 2)e−(x
2
+y 2 )
.
Vastaavasti fyy = (4y 2 − 2)e−(x
2
+y 2 )
.
Sekaderivaatat ovat helpompia, koska tällä kertaa ketjusäännön tuottama tekijä (=sisäfunktion derivaatta) ei enää riipu toisesta muuttujasta. Niinpä tässä voidaan käyttää vakionsiirtosääntöä `vakioon' −2y fyx =
2 2 2 2 ∂ −(x2 +y2 ) ∂ = 4xye−(x +y ) . −2ye−(x +y ) = −2y e ∂x ∂x
Samanlainen lasku osoittaa, että toinenkin sekaderivaatta fxy = (−2x)
2 2 ∂ −(x2 +y2 ) = 4xye−(x +y ) . e ∂y
Huomaamme siis, että kaikissa pisteissä P = (a, b) on voimassa fxy (P ) = fyx (P ). Vastaavasti määritellään korkeamman kertaluvun osittaisderivaatat, samoin myös useamman kuin kahden muuttujan funktion osittaisderivaatat. Yleisestikin on todettavissa (kuten edellisessä Esimerkissä), että tavallisissa tilanteissa derivoimisjärjestys ei vaikuta derivaattaan, sillä voidaan esimerkiksi todistaa, että jos fxy ja fyx ovat jatkuvia (Määritelmä 3.47) pisteen P = (a, b) jossakin r-ympäristössä, niin fxy (a, b) = fyx (a, b). Tavallisen derivaatan merkitys oli käyrän tangentin kulmakerroin. Osittaisderivaatta on tulkittavissa samoin kuten seuraavassa selvitetään. Tarkastellaan pinnan z = f (x, y) pistettä P (a, b, f (a, b)), joka sijaitsee suoraan xy tason pisteen Q(a, b, 0) yläpuolella kuten Kuvassa 4.10. 130
z P
PSfrag repla ements
b x
a
y
Q
Kuva 4.10: Kahden muuttujan funktion kuvaaja
Pystysuora xz tason suuntainen taso leikkaa pinnan pitkin käyrää z = f (x, b), joka kulkee P :n kautta. Tällä käyrällä x on muuttuja, mutta y pysyy vakiona b kuten Kuvassa 4.11. Osittaisderivaatta fx (a, b) on tämän käyrän pisteesen P asetettun tangentin kulmakerroin (xz akselistossa). Samoin fy (a, b) on ko. pinnan ja tason x = a leikkauskäyrän pisteeseen P asetetun tangentin kulmakerroin kuten Kuvassa 4.12 (yz akselistossa). Kahden muuttujan funktioiden osittaisderivaattoja koskee useita ketjusäännön muunnelmia. Näiden kunnollinen perustelu edellyttää usean muuttujan funktion dierentioivuuden käsitettä, ja palaamme niihin kurssilla Analyysi II ja erityisesti kurssilla Usean Muuttujan Funktiot. Seuraavassa luvussa tarvitsemme kuitenkin yhtä tällaista tulosta, joten esittelen sen jo nyt. Sen todistus on hieman haastavampi kuin useimmat tämän kurssin todistuksista, ja voitkin palata siihen myöhemmin.
Lause 4.65.
Oletetaan, että pisteen (a, b) jossakin ympäristössä funktiolla f (x, y) on olemassa jatkuvat
osittaisderivaatat fx ja fy . Oletetaan lisäksi, että yhden muuttujan funktio g(x) on jatkuvasti derivoituva pisteen a ympäristössä ja toteuttaa ehdon g(a) = b. Tällöin sijoittamalla y = g(x) muodostettu yhdistetty funktio F (x) = f (x, g(x)) on derivoituva pisteessä x = a, ja sen derivaatta voidaan laskea säännöllä F ′ (a) = fx (a, b) + fy (a, b) · g ′ (a).
Todistus. Olkoon h jokin pieni luku 6= 0. Tutkitaan funktion F (x) arvon muuttumista välillä I = (a, a + h)
(tai välillä I = (a + h, a) jos h < 0). Todetaan ensin, että DVAL:n (Lause 4.49) seurauksena on olemassa sellainen luku ξ1 ∈ I , että g(a + h) − g(a) = hg ′ (ξ1 ), ja siten g(a + h) = g(a) + hg ′ (ξ1 ) = b + hg ′ (ξ1 ).
131
z P
PSfrag repla ements
x
Q
a
b
y
Kuva 4.11: Kahden muuttujan funktiosta muuttujan x funktioksi asettamalla y = b
z P
PSfrag repla ements
x
a
Q
b
y
Kuva 4.12: Kahden muuttujan funktiosta muuttujan y funktioksi asettamalla x = a
132
Sitten oletuksen g(a) = b avulla F (a + h) − F (a) = f (a + h, g(a + h)) − f (a, g(a)) = [f (a + h, g(a + h)) − f (a + h, b)] + [f (a + h, b) − f (a, b)] = [f (a + h, b + hg ′ (ξ1 )) − f (a + h, b)] + [f (a + h, b) − f (a, b)] .
voimme ilmaista funktion F (x) arvojen erotuksen kahtena funktion f (x, y) arvojen erotuksena siten, että ensimmäisessä hakasulkulausekkeessa ensimmäisen muuttujan arvo pysyy vakiona x = a + h ja toisessa puolestaan jälkimmäinen muuttuja pysyy vakiona y = b. Kumpaakin hakasulkulauseketta voidaan tutkia yhden muuttujan funktion arvojen erotuksena, ja käytämmekin DVAL:ia vielä kahdesti ottaen huomioon, että DVAL nyt on ilmaistava käyttäen `ei-vakioisen muuttujan' suhteen muodostettua osittaisderivaattaa. Siis soveltamalla DVAL:ia muuttujan y funktioon f (a + h, y) näemme, että on olemassa sellainen luku ξ2 lukujen b ja b + hg ′ (ξ1 ) välissä, että [f (a + h, b + hg ′ (ξ1 )) − f (a + h, b)] = hg ′ (ξ1 )fy (a + h, ξ2 ).
Vastaavasti soveltamalla DVAL:ia muuttujan x funktioon f (x, b) saamme, että on olemassa sellainen luku ξ3 lukujen a ja a + h välissä, että [f (a + h, b) − f (a, b)] = hfx (ξ3 , b).
Yhteenvetona siis F (a + h) − F (a) = h {fx (ξ3 , b) + g ′ (ξ1 )fy (a + h, ξ2 )}
Nyt kun h → 0, niin tarkasteluvälimme kutistuvat, ja voimme päätellä, että ξ1 → b, ξ2 → b ja ξ3 →
a. Osittaisderivaattoja fx ja fy sekä derivaattaa g ′ (x) koskevien jatkuvuusoletustemme perusteella sitten
aaltosulkulausekkeen sisällä fx (ξ3 , b) → fx (a, b), g ′ (ξ1 ) → g ′ (a) ja fy (a + h, ξ2 ) → fy (a, b). Yhdistämällä
nämä tulokset saamme erotusosamäärälle väitetyn raja-arvon lim
h→0
Esimerkki 4.66.
F (a + h) − F (a) = fx (a, b) + g ′ (a)fy (a, b). h
Lasketaan uudestaan Esimerkin 4.39 derivaatta Dxx käyttäen Lauseen 4.65 tulosta.
Ratkaisu. Ajatellaan tässä, että f (x, y) = xy , ja g(x) = x, jolloin F (x) = f (x, g(x)) = xx . Tässä ∂f = yxy−1 ∂x
ja
∂f = xy ln x ∂y
potenssifunktion ja eksponenttifunktion derivointisääntöjen nojalla. Edelleen tällä kertaa g ′ (x) = 1. Lause 4.65 sanoo sitten, että pisteessä x = a derivaataksi tulee F ′ (a) = fx (a, a) + fy (a, a) · g ′ (a) = aaa−1 + ln aaa · 1 = aa (1 + ln a).
Siis F ′ (x) = xx (1 + ln x) kuten saimme jo Esimerkin 4.39 ratkaisussa logaritmista derivointia käyttäen. 133
Luku 5
Tasokäyrät ja dierentiaalilaskenta Monisteen viimeisessä luvussa tarkastelemme derivaatan sovelluksia. Erityisen huomion kohteena ovat yhden muuttujan reaalifunktioiden ääriarvot sekä tasokäyrien tutkiminen opittuja työkaluja käyttäen. Tyypillisesti käyrä saadaan yhden muuttujan reaalifunktion kuvaajana. Kuten jo kurssin alussa oli puhetta funktio voidaan antaa myös implisiittisesti tai parametriesityksen avulla. Nyt näemme näistä runsaasti esimerkkejä, sillä joissakin tilanteissa on luontevampaa määritellä, tai ainakin kuvata käyrä parametriesityksen avulla. Lisäksi tavallisten karteesisten koordinaattien asemesta voi joskus olla tarkoituksenmukaisempaa käyttää napakoordinaatteja. Tämä pitää paikkansa erityisesti esimerkiksi pyörimisliikettä kuvattaessa.
5.1 Funktion ääriarvoista Määritelmä 5.1.
Olkoon funktio f määritelty välillä I . Piste c ∈ I on funktion f (paikallinen l. lokaalinen)
maksimikohta, jos c:llä on sellainen ympäristö Y (c; r), että f (x) ≤ f (c) ,
∀x ∈ Y (c; r) ∩ I .
Analogisesti määritellään (lokaalinen) minimikohta. Näiden kohtien yhteisnimitys on (lokaaliset) ääriarvokohdat. Funktion arvo f (c) on tällöin vastaavasti (lokaalinen) maksimi tai (lokaalinen) minimi ja näiden yhteisnimityksenä on (lokaaliset) ääriarvot.
Lause 5.2.
Oletetaan, että f on määritelty välillä [a, b], f :llä on ääriarvo pisteessä c ∈ (a, b) ja f on
derivoituva c:ssä. Silloin f ′ (c) = 0 .
Todistus.
Tarkastellaan tapausta, jossa f :llä on c:ssä maksimi. Samanlaisella tarkastelulla kuin Rollen
lauseen (Lause 4.45) todistuksen loppuosassa (valitaan |h| kyllin pieneksi), saadaan f ′ (c) = 0 . Tapaus, jossa f :llä on minimi, käsitellään vastaavasti.
Edellinen lause ei tietenkään ole välttämättä voimassa välin [a, b] päätepisteissä. Lause ei myöskään ole käännettävissä, sillä esim. funktiolla f (x) = x3 on f ′ (0) = 0 , mutta kuitenkaan x = 0 ei ole ääriarvokohta.
134
Funktion mahdolliset ääriarvokohdat välillä I ovat siis I :n mahdolliset päätepisteet ja I :n ne sisäpisteet c, joissa joko f ′ (c) = 0 tai f ′ (c) ei ole olemassa. Määritelmän 5.1 mukaisesti funktion ei tarvitse ääriarvo-
kohdassa olla derivoituva eikä edes jatkuva.
Lause 5.3.
Oletetaan, että välillä (a, b) funktio f on jatkuva ja lisäksi mahdollisesti pistettä c lukuunotta-
matta derivoituva. (i) Jos f ′ (x) > 0 välillä (a, c) ja f ′ (x) < 0 välillä (c, b), niin c on f :n maksimikohta. (ii) Jos f ′ (x) < 0 välillä (a, c) ja f ′ (x) > 0 välillä (c, b), niin c on f :n minimikohta. (iii) Jos f ′ (x) on väleillä (a, c) ja (c, b) samanmerkkinen, niin c ei ole f :n ääriarvokohta.
Todistus. Tapauksessa (i) on funktio f
Seurauksen 4.52 nojalla aidosti kasvava välillä [c − h, c] ja aidosti
vähenevä välillä [c, c + h] , kun h > 0 on tarpeeksi pieni. Täten c on f :n maksimikohta. Tapaukset (ii) ja (iii) käsitellään vastaavasti.
Jos on etsittävä välillä I jatkuvan funktion suurin ja pienin arvo, on huomattava, että nämä voivat olla paitsi em. ääriarvokohdissa myös välin päätepisteissä. Jos I on suljettu, niin Lauseen 3.39 mukaisesti suurin ja pienin arvo ovat joka tapauksessa olemassa. Funktion suurinta ja pienintä arvoa sanotaan joskus globaaleiksi ääriarvoiksi erona lokaalisiin ääriarvoihin.
Esimerkki 5.4.
Määrää funktion f (x) = x2 − 2x globaalit ääriarvot.
Ratkaisu. Alkeisfunktion f on kaikkialla derivoituva. Sen derivaatalla f ′ (x) = 2x−2 on vain yksi nollakohta x = 1. Jos x < 1, niin f ′ (x) < 0 joten f on aidosti vähenevä välillä (−∞, 1). Vastaavasti jos x > 1, niin f ′ (x) > 0, ja näin ollen f on aidosti kasvava välillä (1, ∞). Siis funktiolla f on globaali minimi f (1) = −1
pisteessä x = 1. Sillä ei ole globaalia maksimia (mikä on aika ilmeistä, koska limx→±∞ f (x) = ∞).
Esimerkki 5.5.
Etsitään polynomin y = f (x) = x5 − 3x4 + 4x2
lokaalit ääriarvokohdat ja selvitetään niiden luonne.
Ratkaisu. Derivoimalla saadaan f ′ (x) = 5x4 − 12x3 + 8x = x(5x3 − 12x2 + 8),
mistä nähdään nollakohta x1 = 0. Kokeilemalla rationaalisia juuria löydetään tälle toinenkin nollakohta x2 = 2. Näin ollen myös x − 2 on polynomin f ′ (x) tekijä, ja polynomien jakolaskulla saadaan f ′ (x) = x(x − 2)(5x2 − 2x − 4).
135
y 4
2
-1
PSfrag repla ements
1
2
x
-2
Kuva 5.1: Polynomin x5 − 3x4 + 4x2 kuvaaja √ Toisen asteen yhtälön ratkaisukaavan avulla nähdään, että derivaatalla on myös nollakohdat x3 = (1− 21)/5 √ ja x4 = (1 + 21)/5. Suuruusjärjestyksessä ne ovat x3 < x1 < x4 < x2 . Merkkitarkastelun avulla nähdään,
että f ′ (x) on positiivinen väleillä (−∞, x3 ), (x1 , x4 ) ja (x2 , ∞). Vastaavasti f ′ (x) on negatiivinen väleillä (x3 , x1 ) ja (x4 , x2 ). Siis x1 ja x2 ovat lokaaleja minimikohtia, ja x3 ja x4 lokaaleja maksimikohtia. Funktion
kuvaaja on Kuvassa 5.1. Sattumalta molemmat lokaalit minimiarvot = 0.
Esimerkki 5.6.
Kolmiosta tunnetaan sen yksi sivu a > 0 ja sen vastainen kulma α ∈ (0, π). Osoita, että
tällaisista kolmioista pinta-alaltaan suurin on tasakylkinen.
Ratkaisu. Olkoon β toinen kolmion muista kulmista. Koska kolmion kummien summa = π, niin tiedämme, että β on rajoitettu suljetulle välille 0 ≤ β ≤ π − α, ja että kolmion kolmas kulma on γ = π − (α + β).
Sinilauseen nojalla
b a = sin β sin α
⇔
b=a
sin β . sin α
Kolmion pinta-ala on tällöin (käyttäen kaavaa sin(π − x) = sin x): A=
a2 sin β 1 ab sin γ = sin(α + β) = A(β) 2 2 sin α
tuntemattoman kulman β funktio A(β). Tässä voimme `tulot summiksi' -kaavojen avulla muuttaa tämän kahden sinin tulon kahden kosinin erotukseksi a2 a2 cos(β − (α + β)) − cos(β + (α + β)) sin β sin(β + α) = A(β) = 2 sin α 4 sin α a2 = cos(α) − cos(2β + α) . 4 sin α
Tästä derivoimalla saamme A′ (β) =
dA a2 = sin(2β + α). dβ 2 sin α
Tässä esiintyvä kulma 2β + α on oletustemme mukaan välillä [α, α + 2(π − α)] = [α, 2π − α]. Ainoa funktion sin x nollakohta tällä välillä on kohdassa x = π , joten A′ (β) = 0 silloin ja vain silloin kun 2β + α = π eli
silloin, kun β = (π − α)/2. Tällöin γ = π − α − β = (π − α)/2 = β , joten tämä vastaa juuri tasakylkistä 136
tilannetta. Välin päätepisteissä A(0) = 0 = A(π − α) funktio A(β) häviää, joten koska A((π − α)/2) > 0, niin tasakylkinen kolmio on pinta-alaltaan suurin.
Tälle tulokselle saadaan toinen todistus käyttäen geometrian perustuloksia. Geometriassa todistetaan, että kulman α kärki on erään sellaisen ympyrän kehällä, jonka keskipiste on sivun a keskinormaalilla. Tällöin on kohtuullisen ilmeistä, että tarkasteltavan kolmion sivun a vastainen korkeus (ja sen myötä kolmion pintaala) tulee maksimoitua, kun ko. kärki on sekin mainitulla keskinormaalilla. Tämä symmetrinen tilanne vastaa tasakylkistä kolmiota.
5.2 Funktion kuvaajan tutkiminen Edellä esitetyt ääriarvotarkastelut ovat funktion kulun tutkimisen kannalta ensiarvoisen tärkeitä. Käyrän äärettömien haarojen tutkimuksessa ovat asymptootit keskeisiä. Asymptootilla tarkoitetaan tässä yhteydessä yksinkertaista käyrää (yleensä ja etenkin tällä kurssilla suoraa), jota tutkittava käyrä lähestyy kaukana origosta. Tarkempi määrittely alla. Niiden ja muutamien erikoispisteiden avulla esimerkiksi rationaalifunktion kuvaajan pystyy hahmottelemaan sangen nopeasti.
Määritelmä 5.7.
Suora y = kx + b on käyrän y = f (x) asymptootti, jos lim (f (x) − (kx + b)) = 0 tai
lim (f (x) − (kx + b)) = 0 .
x→∞
x→−∞
Pystysuora suora x = a on käyrän y = f (x) asymptootti, jos lim |f (x)| = ∞ tai
x→a+
lim |f (x)| = ∞ .
x→a−
Vaakasuorien ja vinojen asymptoottien löytämiseksi tutkitaan aluksi raja-arvoa lim
x→±∞
f (x) . x
Jos jompikumpi (tai molemmat) näistä raja-arvoista on äärellisenä olemassa, tulee siitä asymptootin kulmakerroin k . Tämän jälkeen, mikäli mahdollista, määritetään sellainen b, että Määritelmän 5.7 ehto toteutuu.
Esimerkki 5.8.
Selvitetään funktion f (x) = (x2 + 2)/(x − 1) asymptootit ja lokaalit ääriarvot.
Ratkaisu. Koska limx→1+ f (x) = ∞ = − limx→1− f (x), niin suora x = 1 on pystysuora asymptootti (ratio-
naalifunktion tapauksessa nämä vastaavat nimittäjän sellaisia nollakohtia, jotka eivät ole osoittajan nollakohtia). Todetaan sitten, että
x2 + 2 1 + (2/x2 ) f (x) = 2 = x x −x 1 − (1/x)
x→±∞
→
1.
Näin ollen vinon asymptootin kulmakertoimen on oltava 1. Jakolaskusta x(x − 1) + (x − 1) + 3 3 x2 + 2 = =x+1+ x−1 x−1 x−1
137
näemme, että suora x + 1 on asymptootti. Alkeisfunktiona f (x) on derivoituva määrittelyjoukossaan R \ {1}, joten lokaaleja ääriarvoja voi esiintyä
vain derivaatan nollakohdissa.
3 3 , =1− x−1 (x − 1)2 √ joten f ′ (x) = 0 ⇔ 3 = (x − 1)2 , eli derivaatta häviää pisteissä x = 1 ± 3. Koska funktio (x − 1)2 on kasvava f ′ (x) = D(x + 1) + D
välillä x > 1, niin 1 − 3/(x − 1)2 on sekin kasvava välillä (1, ∞). Näin ollen sen merkki muuttuu miinuksesta √ plussaksi ohitettaessa piste x = 1 + 3, mikä on näin ollen lokaali minimikohta (Lause 5.3). Vastaavasti √ nähdään, että x = 1 − 3 on lokaali maksimi. Tämän funkion kuvaaja on Kuvassa 5.2, asymptootit on merkitty harmaalla.
y 8
4
2
-6 -4 -2
4
6
x
-4
PSfrag repla ements -8
Kuva 5.2: Funktion (x2 + 2)/(x − 1) kuvaaja asymptootteineen Nyt siirrytään tarkastelemaan toisen derivaatan merkitystä käyrän kulun kannalta. Käyrä `taipuu ylöspäin' tietyllä välillä, jos se kulkee käyrän pisteisiin piirrettyjen tangenttien yläpuolella. Tämä merkitsee, että x:n kasvaessa ko. välillä samalla tangentin suuntakulma ja kulmakerroin kasvavat. Täten siis myös derivaatta
kasvaa. Tätä ajatusta käyttäen voidaan derivaatan avulla määritellä käyrän kuperuuden suunta.
Määritelmä 5.9.
Olkoon funktio f derivoituva välillä I . Funktion f kuvaaja on kupera alaspäin (ylöspäin),
jos f on kasvava (vähenevä) ko. välillä. ′
Jos funktio on kahdesti derivoituva, niin f ′ :n kasvavuutta voidaan Seurauksen 4.52 mukaisesti tutkia f ′′ :n avulla.
Lause 5.10.
Olkoon funktio f kahdesti derivoituva välillä I .
138
(i) Jos f ′′ (x) > 0 , ∀x ∈ I , niin f :n kuvaaja on kupera alaspäin välillä I . (ii) Jos f ′′ (x) < 0 , ∀x ∈ I , niin f :n kuvaaja on kupera ylöspäin välillä I .
Huomautus 5.11. Sanonnat `kupera alaspäin/ylöspäin' on valitettavan helppo sekoittaa keskenään. Muistisääntönä toimii, että ylöspäin aukeava paraabeli on alaspäin kupera ja vastaavasti alaspäin aukeava paraabeli on ylöspäin kupera. Aukeamissuunnastaan katsottunahan paraabeli tuo mieleen pikemminkin koveran kuin kuperan linssin! Koska D2 x2 = 2 > 0, niin edellisen Lauseen merkkisääntö, on helposti tästä johdettavissa. Ylöspäin kupera ∩ alaspäin kupera ∪. Koska minimipisteessä (maksimipisteessä) käyrä on kupera alaspäin (ylöspäin), voidaan kahdesti derivoituvan funktion ääriarvon laatu joskus selvittää Lauseen 5.3 sijasta seuraavaa lausetta käyttäen.
Lause 5.12.
Olkoon funktio f kahdesti derivoituva välillä (a, b), c välin (a, b) piste ja f ′ (c) = 0.
(i) Jos f ′′ (c) > 0, niin c on f :n minimikohta. (ii) Jos f ′′ (c) < 0, niin c on f :n maksimikohta. Jos edellisessä lauseessa f ′′ (c) = 0, niin tätä lausetta ei voi käyttää. Tällöin c mahdollisesti ei ole edes ääriarvokohta. Tämä tilanne tulee vielä osittain esille seuraavassa.
Määritelmä 5.13. Pistettä, jossa jatkuvan funktion kuperuuden suunta muuttuu, sanotaan käännepisteeksi. Käännepisteiden löytämiseksi on täten ensiksi etsittävä ne pisteet, joissa f ′′ (x) = 0 tai f ′′ (x) ei ole olemassa ja sitten valittava ko. pisteistä ne, joissa kuperuuden suunta muutuu.
Esimerkki 5.14.
Tutkitaan Esimerkin 5.8 käyrän kuperuussuunnan muuttumista ja käännepisteitä.
Ratkaisu. Näimme
jo, että f ′ (x) = 1 − 3/(x − 1)2 . Derivoimalla uudelleen saamme f ′′ (x) = 6/(x − 1)3 .
Tästä näemme, että käyrä on kupera alaspäin välillä x > 1 ja kupera ylöspäin välillä (−∞, 1). Tämä vastaa aikaisemmin selvitettyä ääriarvojen luonnetta. Kuperuussuunta vaihtuu, kun ohitetaan piste x = 1, mutta koska funktio ei ole edes määritelty pisteessä x = 1, ei siellä tietenkään voida puhua käännepisteestä (Kuva 5.2).
Esimerkki 5.15.
Määrää funktion f (x) =
x x2 + 1
kuvaajasta asymptootit, ääriarvot ja käännepisteet.
Ratkaisu.
Tämä rationaalifunktio on määritelty kaikkialla ja sen kaikkien kertalukujen derivaatat ovat
kaikkialla olemassa. Huomaamme, että limx→±∞ f (x) = 0, joten x-akseli on sen ainoa asymptootti. Ääriarvokohdat löydämme derivaattojen nollakohdista. Derivoimalla saamme f ′ (x) =
1(x2 + 1) − x(2x) 1 − x2 = , (x2 + 1)2 (x2 + 1)2
139
y
PSfrag repla ements
P2
0.5
K3 x
-4
-3
-2 K1
-1 K2 -0.5
1
2
3
4
P1
Kuva 5.3: Funktion x/(x2 + 1) kuvaaja käännepisteineen ja ääriarvokohtineen
josta näemme, että derivaatta häviää pisteissä x = ±1. Tutkimalla derivaatan merkkiä näemme, että funktio
on vähenevä väleillä (−∞, −1) ja (1, ∞) ja kasvava välillä (−1, 1). Näin ollen kohdassa x = −1 on lokaali
minimi f (−1) = −1/2 ja kohdassa x = 1 lokaali maksimi f (1) = 1/2. Ottamalla huomioon mainitut rajaarvot sekä sen, että f (x) on aina samanmerkkinen kuin x näemme helposti, että nämä ovat itse asiassa
globaaleja ääriarvoja (vrt. Esimerkki 3.42). Käännepisteiden selvittämiseksi derivoimme uudelleen (−2x)(x2 + 1)2 − (1 − x2 )2(x2 + 1)(2x) −2x3 − 2x − 4x + 4x3 2x3 − 6x = = 2 . 2 4 2 3 (x + 1) (x + 1) (x + 1)3 √ Tästä näemme, että toinen derivaatta häviää pisteissä x = 0 ja x = ± 3. Merkkitarkastelu osoittaa, että √ √ √ √ nämä kaikki johtavat käännepisteisiin K1 = (− 3, 3/4), K2 = (0, 0) ja K3 = ( 3, 3/4), sekä havaintoihin, √ √ √ että kuvaaja on ylöspäin kupera väleillä (−∞, − 3) ja (0, 3) sekä alaspäin kupera väleillä (− 3, 0) ja √ ( 3, ∞). Funktion kuvaaja käännepisteineen ja ääriarvoineen on nyt helppo nähdä Kuvan 5.3 mukaiseksi f ′′ (x) =
Funktion kulkuun liittyviä asioita on edellisissä tarkasteluissa suoritettu lähtien funktion eksplisiittimuodosta y = f (x). Luonnollisesti vastaavat asiat tulevat esille tarkasteltaessa implisiitti, parametri ja napakoordinaattimuotoa.
5.3 Parametrimuotoisen funktion derivointi ja parametrimuodossa annettu käyrä Nyt siirrytään tarkastelemaan parametrimuotoista funktiota (vrt. kohta 1.5.) Tämä on käytännössä kohtuullisen usein esiin tuleva tilanne. Jos tutkittavaa ilmiötä voidaan kuvata kahden muuttujan, x ja y , avulla (joskus tarvitaan valitettavasti useampia, jolloin tilannetta ei voida kuvata 2-ulotteisessa avaruudessa, mutta tällöinkin voidaan soveltaa samanlaisia periaatteita), ja nämä muuttujat muuttuvat kumpikin esimerkiksi ajan funktioina, x = x(t), y = y(t), niin tällöin aika on luonteva parametri. Näin esimerkiksi kuvattaessa mekaanista tapahtumaa tai vaikkapa tietokonepelin olion liikettä. Jälkimmäisessä tapauksessa tosin pelaaja yleensä voi tuottaa odottamia muutoksia funktioiden x(t) ja y(t) derivaattoihin. Toinen usein käytettävä parametri on jokin luonteva kulmasuure. 140
1
0.5
-1
-0.5
0.5
1
-0.5
PSfrag repla ements -1
Kuva 5.4: Lissajoux-käyrä x = sin 2t, y = sin 3t y
PSfrag repla ements P A t O
x
B
Kuva 5.5: Sykloidin parametriesityksen johto
Esimerkki 5.16.
Oskilloskoopilla saadaan tuotettua ns. Lissajouxin käyriä johtamalla katodisädettä x- tai
y -suuntiin poikkeuttamaan eritaajuisia siniaallon (tai kosiniaallon) muotoisia jännitteitä. ( x(t) = sin nt , y(t) = sin mt ,
missä n ja m ovat kokonaislukuja. Tällöin funktioilla x(t) ja y(t) on molemmilla jaksona 2π , joten kun t käy läpi välin [0, 2π] käyrä sulkeutuu ja alkaa toistaa itseään, jolloin oskilloskoopin ruudulle piirtyy stationäärinen käyrä. Esimerkki tällaisesta käyrästä on Kuvassa 5.4. Siinä on valittu n = 2, m = 3.
Esimerkki 5.17.
Pyörä (säde R) vierii (sutimatta) pitkin x-akselia. Määrää sen kehältä valitun kiinteän
pisteen (esimerkiksi auton talvirenkaan tietyn nastan, tai polkupyörän renkaan venttiilitapin) piirtämän käyrän, ns. sykloidin (ks. Kuva 5.5), parametriesitys käyttäen parametrina t pyörän kääntymää kulmaa.
Ratkaisu.
Asetetaan koordinaatisto siten, että parametrin ollessa t = 0 kyseinen kehäpiste koskettaa x-
akselia origossa. Kun pyörä on pyörähtänyt kulman t verran (eli se on Kuvan 5.5 asemassa), on oletuksemme 141
mukaisesti kaari BP yhtä pitkä kuin jana OB . Koska kaaren pituus on P B = Rt, niin näemme, että B = −−→ −→ (Rt, 0) ja täten A = (Rt, R). Vektori AB osoittaa suoraan alaspäin suuntaan −π/2, joten vektorin AP suuntakulma on φ = −π/2 − t. Näin ollen
−→ AP = R(cos φ, sin φ) = R(cos(π/2 + t), − sin(π/2 + t) = R(− sin t, − cos t). −−→ −→ −→ Koska (x(t), y(t)) = OP = OA + AP , saamme halutun parametriesityksen ( x(t) = R(t − sin t) , y(t) = R(1 − cos t) .
Harjoitustehtävänä todistetaan, että tässä x(t) on monotonisesti kasvava kulman t funktio, ja että limt→∞ x(t) = ∞ ja limt→−∞ x(t) = −∞. Näin ollen t 7→ x(t) on bijektio R → R. Sillä on siis, aina-
kin periaatteessa, käänteisfunktio t = t(x), jonka avulla t voitaisiin eliminoida, ja esittää y tavalliseen tapaan x:n funktiona y = y(t(x)). Tässä tapauksessa emme kuitenkaan pysty esittämään tätä käänteisfunktiota
alkeisfunktiona, kun taas parametriesityksen käyttö ei ole mikään ongelma! Olkoon annettuna esitys (
x = x(t) , ∀t ∈ I ,
y = y(t) ,
missä x ja y ovat parametrin t derivoituvia funktioita välillä I . Jos x′ (t) ei muuta merkkiään välillä I , niin x(t) on bijektio (ks. Lause 4.54) ja sen käänteisfunktion derivaatta on Lauseen 4.26 nojalla t′ (x) = 1/x′ (t).
Yhdistetyn funktion y = y(t(x)) derivaatta on siis y ′ (t) dy/dt dy = y ′ (t) · t′ (x) = ′ = . dx x (t) dx/dt
Esimerkki 5.18.
Ympyrällä x2 + y 2 = 25 on parametrisointi vaihekulman t avulla: x(t) = 5 cos t , y(t) = 5 sin t ,
Määrää ympyrän pisteeseen P = (3, 4) piirretyn tangentin yhtälö.
Ratkaisu.
Pistettä P vastaa ensimmäisen neljänneksen kulma t0 , jolle cos t0 = 3/5 ja sin t0 = 4/5. Nyt
dx/dt = x (t) = −5 sin t ja dy/dt = y ′ (t) = 5 cos t, joten pisteessä P saadaan ′
4 dx (P ) = x′ (t0 ) = −5 · = −4, ja dt 5 dy (P ) = y ′ (t0 ) = dt
5·
3 = 5
3.
Joten tangentin kulmakerroin pisteessä P on y ′ (t0 ) 3 dy (P ) = ′ =− . dx x (t0 ) 4
Etsitty tangentin yhtälö on siten 3 (y − 4) = − (x − 3) 4
142
⇔
3x + 4y = 25.
Niissä parametrisoidun käyrän pisteissä, joissa x′ (t) = 0 ei tätä menetelmää tietenkään voida soveltaa. Joskus tämä ongelma korjaantuu vaihtamalla parametri toiseksi, mutta tyypillisempi tilanne on se, että itse käyrässä on kyseisen pisteen (x(t), y(t)) ympäristössä jotakin poikkeuksellista. Esimerkin 5.18 ympyrän x = 5 cos t, y = 5 sin t pisteessä (5, 0) (vastaten parametrin arvo t = 0) on x′ (0) = −5 sin 0 = 0 ja y ′ (0) =
5 cos 0 = 5 eikä derivaattaa dy/dx saada muodostettua. Ympyrän tähän pisteeseen piirretty tangentti onkin
pystysuora. Itse ympyrä on kuitenkin mainitussa pisteessä yhtä sileä kuin muuallakin! Menetelmiämme voidaan tähänkin tilanteeseen soveltaa, kunhan huomaamme vaihtaa koordinaattien x ja y roolit keskenään! Tässähän y ′ (t = 0) = 5 6= 0, joten funktio y(t) on kohdan t = 0 eräässä ympäristössä monotonisesti kasvava. Näin ollen sillä on käänteisfunktio t = t(y), ja sijoittamalla tämä saamme kuitenkin (ainakin eräällä välillä I )
x-koordinaatin lausuttua y -koordinaatin funktiona x = x(t) = x(t(y)). Toistamalla aikaisempi lasku saamme
tämän funktion derivaatalle lausekkeen
x′ (t) dx = ′ . dy y (t)
Ympyrän tapauksessa oli x′ (0) = 0 ja y ′ (0) = 5, joten pisteessä (x, y) = (5, 0) saadaan dx/dy = 0/5 = 0. Ottamalla huomioon koordinaattien muuttuneet roolit tarkoittaa `tangentin kulmakerroin =0' tällä kertaa juuri y -akselin suuntaista eli pystysuoraa tangenttia, mikä vastaa mielikuvaamme ympyrästä tuon pisteen lähellä. Pahempi ongelma syntyy niissä pisteissä, joissa samanaikaisesti x′ (t) = 0 = y ′ (t). Nähdään (harjoitustehtävä) että sykloidissa (ks. Esimerkki 5.17) näin käy, kun t = n 2π, n ∈ Z. Sykloidilla nämä pisteet vastaavat
`kärkiä', joihin tällöin ei oikein voi helposti kuvitella (yksikäsitteistä) tangenttia. Sykloidin tapauksessa tosin
voidaan kärkeen ajatella muodostuvan `toispuoleinen' pystysuora tangentti (tästä enemmän laskuharjoituksissa). Muunkinlaisista tilanteista, jotka olisivat tiukassa xy -maailmassa pulmallisia, voi parametriesityksen avulla selvitä.
Esimerkki 5.19.
Parametrisoinnin
x(t) = t2 − 1 , y(t) = t3 − t .
määräämä käyrä leikkaa itsensä origossa (Kuva 5.6). Määrää `derivaatan' dy/dx origossa saamat 2 arvoa!
Ratkaisu.
Tällä käyrällä x(t) = 0 ⇔ t = ±1. Näemme, että myös y(±1) = 0, joten tämä käyrä osuu
origoon kahdella parametrin t eri arvolla. Kuvasta katsoen on ilmeistä, ettei missään origon ympäristössä kumpaakaan koordinaateista x tai y voida lausua toisen funktiona, koska funktion on oltava yksikäsitteinen. Parametriesityksen käyttö sallii meidän tarkastella ko. käyrän kahta `haaraa' kumpaakin erikseen. Kaikilla t:n arvoilla saamme
dy 3t2 − 1 = . dx 2t
Kun t on rajoitettu pisteen t = 1 sopivaan ympäristöön, saadaan origoon piirretyn tangentin kulmaker-
143
y 1.5
1
0.5
-1
-0.5
0.5
1
x 1.5
-0.5
-1
PSfrag repla ements
-1.5
Kuva 5.6: Parametrisoitu käyrä voi leikata itsensä kanssa
toimeksi
3−1 dy = = 1, dx 2·1
ja tämä vastaa käyrän origon kautta kulkevaa nousevaa haaraa. Vastaavasti, kun t on rajoitettu pisteen t = −1 sopivaan ympäristöön, saadaan origoon piirretyn tangentin
kulmakertoimeksi
dy 3−1 = = −1, dx 2 · (−1)
ja tämä vastaa käyrän origon kautta kulkevaa laskevaa haaraa.
Esimerkki 5.20.
Selvitä Kuvan 5.4 käyrän origon kautta kulkevien haarojen tangentit.
Ratkaisu. Nyt x = sin 2t ja y = sin 3t. Piste osuu origoon, jos nämä molemmat = 0, ja helposti näemme, että välillä [0, 2π) näin käy kun t = 0 tai t = π . Nyt x′ (t) = 2 cos 2t ja y ′ (t) = 3 cos 3t. Kun t = 0, niin saamme tästä dy/dx = y ′ (0)/x′ (0) = 3/2, ja tämä vastaa kuvan nousevaa haaraa. Kun taas t = π , niin dy/dx = y ′ (π)/x′ (π) = −3/2, ja tämä on laskevan haaran tangentin kulmakerroin
origossa. Etsityt tangenttien yhtälöt ovat siis
3 y = ± x. 2
Joskus määritellään käyrä edellisen muotoisena parametriesityksenä, missä x(t) ja y(t) ovat jatkuvia ja väli I voidaan jakaa sellaisiin osiin I1 , I2 , I3 , . . . , Ir , että kullakin osavälillä yhtälöpari määrittelee y :n x:n 144
funktiona (tai päinvastoin). Esimerkiksi alfakäyrän tapauksessa tähän päästään tarkastelemalla erikseen väliä I1 = (−∞, 0] ja väliä I2 = [0, ∞).
Esimerkki 5.21.
Viiden metrin mittaiset tikapuut nojaavat seinää (kohtisuorassa lattiaan nähden) vasten.
Lattian liukkauden vuoksi tikkaiden alapää alkaa liukua lattiaa pitkin poispäin seinästä siten, että tikkaiden yläpää samalla liukuu seinää pitkin suoraan alas. Havaintohetkellämme tikkaiden alapää on neljän metrin päässä seinästä, ja liukuu lattiaa pitkin hetkellisellä nopeudella 1 m/s. Millä (hetkellisellä) nopeudella tällöin tikkaiden yläpää putoaa?
Ratkaisu. Olkoot x(t) tikkaiden alapään etäisyys seinästä, ja y(t) tikkaiden yläpään korkeus lattiasta. Koska tikkaat eivät liukumisen kuluessa veny eivätkä kutistu, niin koko ajan on voimassa Pythagoraan lauseen mukainen yhtälö 5=
p x(t)2 + y(t)2 ⇔ 25 = x(t)2 + y(t)2 .
Derivoimalla tämä yhtälö puolittain ajan t suhteen saamme tulokseksi 0=
d d (25) = (x(t)2 + y(t)2 ) = 2x(t)x′ (t) + 2y(t)y ′ (t). dt dt
Tästä ratkeaa y ′ (t) = −
x(t) ′ x (t). y(t)
Havaintohetkellä t = t0 oli meille annettu x(t0 ) = 4, joten ensimmäisestä yhtälöstä voimme ratkaista y(t0 ) = p 25 − x(t0 )2 = 3. Lisäksi meille oli annettu tieto x′ (t0 ) = 1m/s. Sijoittamalla nämä saatuun lausekkeeseen saamme tulokseksi
y ′ (t) = −
4 4 · 1m/s = − m/s. 3 3
Tässä miinusmerkki tarkoittaa sitä, että korkeus y(t) on vähenemässä (sopii kuvaan!). Vastaukseksi saadaan, että tikkaiden yläpää on tuolla hetkellä putoamassa 4/3 metriä sekunnissa. Tehtävän voi ratkaista myös ratkaisemalla ensimmäisestä yhtälöstä korkeuden y(t) toisen muuttujan x(t) funktiona, ja derivoimalla sen. Ratkaisumme voidaan tulkita myös perustuneen implisiittiseen derivointiin (selitetään tarkemmin myöhemmin tässä luvussa).
5.4 Napakoordinaattien avulla määritelty käyrä Tässä pykälässä käsittelemme napakoordinaattien avulla esitettyjä käyriä. Sellainen esitetään yleensä muodossa r = r(ϕ),
missä etäisyys origosta r on esitetty vaihekulman ϕ funktiona. Käyrän pisteitä saadaan tällöin laskettua antamalla kulmalle ϕ jokin arvo ja laskemalla mikä ko. suunnassa olevista pisteistä on etäisyydellä r(ϕ) origosta. 145
Yksinkertaisin esimerkki tällä tavalla määräytyvästä käyrästä saadaan asettamalla r(ϕ) = R on vakio (R > 0). Selvästi tämän napakoordinaattiyhtälön määräämä käyrä on origokeskinen R-säteinen ympyrä. Mikään ei pakota meitä rajaamaan vaihekulmaa 2π -mittaiselle välille.
Esimerkki 5.22.
Hahmottele käyrää, jonka yhtälö r = r(ϕ) = ϕ/π
määrää, kun vaihekulma käy läpi välin ϕ ∈ [0, ∞). 2
1
-3
-2
-1
1
2
3
4
-1
-2
-3
Kuva 5.7: Arkhimedeen spiraalin kaksi sisintä kierrosta
Ratkaisu. Kun ϕ = 0 saadaan r = 0, joten käyrä alkaa origosta. Kun ϕ kasvaa arvoon π/4 saadaan r = 1/4, √ √ mikä vastaa pistettä (cos π/4, sin π/4) · (1/4) = ( 2/8, 2/8). Edelleen, kun ϕ saavuttaa arvon π/2, niin
r = 1/2 ja olemme pisteesä (0, 1/2). Jatkamalla samaan tapaan: ϕ = π antaa pisteen (−1, 0), ϕ = 3π/2
pisteen (0, −3/2) ja ϕ = 2π pisteen (2, 0). Tästä eteenpäin päästäksemme teemme havainnon, että ∀ ϕ ≥ 0 on voimassa yhtälö
r(ϕ + 2π) = r(ϕ) + 2.
Tämä tarkoittaa sitä, että käyrä jatkaa loputtomiin uudelle kierrokselle etäisyydellä, joka on kahta suurempi kuin edellisellä kierroksella. Muodostuu ulospäin kiertyvä spiraali, jota kutsutaan Arkhimedeen spiraaliksi (Kuva 5.7). Tällä tavalla napakoordinaateissa annettu käyrä voidaan helposti muuttaa parametrimuotoiseksi käyräksi ottamalla parametriksi vaihekulma ϕ ja huomioimalla aikaisemmin johtamamme `napakoordinaateista karteesisiksi' -muunnosyhtälöt. Tämä seurauksena saamme ( x = x(ϕ) = r(ϕ) cos ϕ , y = y(ϕ) = r(ϕ) sin ϕ . Tämä parametrimuotoinen yhtälö tarjoaa myös luonnollisen tavan sallia r-koordinaatille negatiivisia arvoja. Jos tässä nimittäin onkin r(ϕ) < 0, niin piste (x(ϕ), y(ϕ)) onkin kulman ϕ + π suunnassa etäisyydellä −r(ϕ). Tämä laajennus johtaa jouhevasti etenevään käyrään, kuten seuraavasta esimerkistä ilmenee.
146
0.75
0.5
0.25
-0.75
-0.5
-0.25
0.25
0.5
0.75
-0.25
-0.5
-0.75
Kuva 5.8: Yhtälön r = sin 2ϕ kuvaama napakoordinaattikäyrä
Esimerkki 5.23.
Selvitä minkälainen on napakoordinaattien välisen yhtälön r = sin 2ϕ kuvaama käyrä,
kun negatiiviset koordinaatin r arvot tulkitaan siten, että vastaava piste on suunnassa ϕ + π etäisyydellä −r.
Ratkaisu. Koska nyt 2π
on funktion r(ϕ) eräs jakso, ei meidän tarvitse käsitellä kuin jokin 2π -mittainen
väli, esimerkiksi väli ϕ ∈ [0, 2π]. Seuraavalla kierroksella käyrä vain toistaa itseään.
Lopputulos on Kuvassa 5.8. Käymme sen muodostumisen pääpiirteittäin läpi. Välillä ϕ ∈ [0, π/4] funktio
sin 2ϕ kasvaa arvosta nolla arvoon 1, ja vastaavasti välillä ϕ ∈ [π/4, π/2] taas vähenee arvoon nolla. Nämä
yhdessä tuottavat ensimmäisessä neljänneksessä olevan silmukan. Kun ϕ edelleen kasvaa välillä [π/2, 3π/4], niin sin 2ϕ edelleen pienenee nollasta arvoon −1. Tällöin `piirrettävä' piste onkin toisen neljänneksen asemesta neljännessä neljänneksessä. Kun välillä ϕ ∈ [3π/4, π] funktio sin 2ϕ kasvaa −1 → 0, niin käyrän neljännessä
neljänneksessä oleva silmukka sulkeutuu palatessamme takaisin origoon.
Vastaavasti, kun ϕ on kolmannen neljänneksen kulma, niin sin 2ϕ on jälleen positiivinen, ja saamme kolmannen neljänneksen silmukan. Kun lopulta ϕ on neljännen neljänneksen kulma, niin sin 2ϕ on negatiivinen, ja toisen neljänneksen silmukka piirtyy. Jos seuraat kynällä käyrän piirtymistä kulman ϕ kasvaessa 0 → 2π , niin huomaat, ettei sinun origoon
tullessasi tarvitse tehdä käännöksiä, vaan käyrä jatkuu luontevasti origon yli suoraan.
Voimme käyttää sitten derivointia työkaluna tällaisten käyrien ominaisuuksien tutkimiseen.
Esimerkki 5.24.
Selvitä, missä nelilehtiapilan (Kuva 5.8) pisteissä x-koordinaatti saa suurimman arvonsa.
Ratkaisu. Tässä tapauksessa x(ϕ) = r(ϕ) cos ϕ = cos ϕ sin 2ϕ,
147
ja kyse on tämän funktion (globaalin) maksimin etsimisestä. Nyt dx = − sin ϕ sin 2ϕ + 2 cos ϕ cos 2ϕ, dϕ
joten dx/dϕ = 0 silloin ja vain silloin, kun sin ϕ sin 2ϕ = 2 cos ϕ cos 2ϕ.
(∗)
Jaksollisuuden takia riittää selvitäää tämän yhtälön ratkaisut välillä ϕ ∈ (−π, π]. Jos cos ϕ = 0, niin silloin myös sin 2ϕ = 2 sin ϕ cos ϕ = 0, joten yhtälön molemmat puolet häviävät, ja saamme ratkaisut ϕ = π/2 ja
ϕ = −π/2. Kuten kuvasta näemme, näissä pisteissä x(ϕ) = 0, joten ne eivät vastaa x:n suurinta arvoa. Jos
cos 2ϕ = 0, niin cos2 ϕ = sin2 ϕ = 1/2 (kaksinkertaisen kulman kosinin kaavoista), ja näissä pisteissä yhtälön (∗) vasen puoli 6= 0. Voimme siis olettaa, että yhtälön (∗) oikea puoli 6= 0, ja jakaa sillä, jolloin yhtälö saa
muodon
tan ϕ tan 2ϕ = 2.
Merkitään nyt t = tan ϕ, jolloin käyttämällä kaksinkertaisen kulman tangentin kaavaa saamme 2t = 2. 1 − t2 √ √ Tällä on ratkaisuina t = ±1/ 2. Olkoon ϕ0 = arctan(1/ 2) positiivista t:n arvoa vastaava ensimmäisen t
neljänneksen kulma. Tällöin muut kulmat ovat −ϕ0 sekä ±(π−ϕ0 ), joista π−ϕ0 antaa nyt pisteen neljännessä neljänneksessä.
Käyrän symmetrian vuoksi on ilmeistä, että ratkaisuja tulee olemaan kaksi, ja ne erovat toisistaan y koordinaatin merkkien suhteen. Toiset kaksi peilikuvapistettä vastaavat niitä pisteiä, joissa x-koordinaatti saa pienimmän mahdollisen arvonsa. √ Kun tan ϕ0 = 1/ 2, ja ϕ0 on 1. neljänneksen kulma, niin kohdan 1.6 kaavojen perusteella √ 1 1/ 2 tan ϕ0 = √ , = p sin ϕ0 = p 2 3 3/2 1 + tan ϕ0 ja
√ 2 =√ . cos ϕ0 = p 2 3 1 + tan ϕ0 1
√ √ Siis sin 2ϕ0 = 2 sin ϕ0 cos ϕ0 = 2 2/3, ja kohdassa ϕ0 siten x(ϕ0 ) = cos ϕ0 sin 2ϕ0 = 4/(3 3), ja y(ϕ0 ) = √ √ √ √ (2 2)/(3 3). Etsitty x-koordinaatin suurin arvo on siis 4/(3 3) = 4 3/9 ≈ 0,7698 ja se saavutetaan √ √ pisteissä (4 3/9, ±2 6/9).
Koska napakoordinaattien avulla annettu käyrä on erikoistapaus parametrin avulla esitetystä, voimme käyttää edellisen pykälän menetelmää tangenttien laskemiseksi. Nyt ( x′ (ϕ) = r′ (ϕ) cos ϕ − r(ϕ) sin ϕ , y ′ (ϕ) = r′ (ϕ) sin ϕ + r(ϕ) cos ϕ , 148
joten tangentin kulmakertoimelle saamme kaavan
Esimerkki 5.25.
dy/dϕ r′ sin ϕ + r cos ϕ dy = = ′ . dx dx/dϕ r cos ϕ − r sin ϕ
Mikä (xy -koordinaateissa annettua) piste vastaa käyrällä r = sin 2ϕ parametrin arvoa
ϕ = π/6? Mikä on nelilehtiapilan ko. pisteeseen piirretyn tangentin yhtälö? √ √ 3/2, sin ϕ = 1/2 ja r(ϕ) = sin 2ϕ = 3/2 sekä r′ (ϕ) = 2 cos 2ϕ = 1. √ √ √ √ Siten x = cos ϕ sin 2ϕ = 3/4, y = sin ϕ sin 2ϕ = 3/4, ja dx/dϕ = 1 · 3/2 − ( 3/2)(1/2) = 3/4, √ √ dy/dϕ = 1 · (1/2) + ( 3/2)( 3/2) = 5/4. Tästä saamme kulmakertoimelle arvon
Ratkaisu. Kun ϕ = π/6, niin cos ϕ =
dy/dϕ 5 dy = =√ dx dx/dϕ 3 √ Etsitty piste on siis (x, y) = (3/4, 3/4), ja vastaavan tangentin yhtälöksi saadaan sieventämällä 5x −
√
3y = 3.
Kulmakerroin on hieman alle 3, eli käyrä nousee tässä kohtaa suhteellisen jyrkästi. Tämä sopii hyvin kuvaan, sillä x = 3/4 on vain hieman Esimerkissä 5.24 laskettua maksimiarvoa pienempi, ja maksimia vastaava kulma on vain hieman nyt valittua suurempi.
5.5 Implisiittisesti määritellyn funktion derivointi Implisiittifunktion (vrt. kohta 1.5.) eli ratkaisemattomassa muodossa olevan funktion määräytymiseen liittyy muutamia sangen syvällisiä kysymyksiä, joita ns. Implisiittifunktiolause käsittelee perinpohjaisesti. Tämän kurssin kannalta riittää seuraava versio. Mutkikkaampia versioita tulet näkemään kursseilla Analyysi II ja Usean Muuttujan Funktiot. Syvällisemmällä kurssilla Modernin Analyysin Perusteet lopulta esitetään sille myös todistus. Yksinkertaisesti ilmaistuna implisiittifunktiolause kertoo, että jos yhtälöllä F (x, y) = 0,
on jokin ratkaisu (a, b), niin tietyin edellytyksin pisteen (a, b) sisältävän (ehkä hyvin pienen) laatikon sisällä tällä yhtälöllä on yksi ja vain yksi ratkaisu y kutakin x:n arvoa kohti, ja että tämän ratkaisun implisiittisesti määräämä funktio y = y(x) on derivoituva.
Lause 5.26.
(Implisiittifunktiolause) Oletetaan, että funktio F (x, y) ja sen osittaisderivaatat Fx ja Fy ovat
jatkuvia pisteen (a, b) ympäristössä. Oletetaan lisäksi, että F (a, b) = 0 ja Fy (a, b) 6= 0. Tällöin on olemassa sellaiset välit I1 ja I2 (a ∈ I1 , b ∈ I2 ) ja sellainen funktio f : I1 → I2 , joille (i) f (a) = b,
149
(ii) jos (x, y) ∈ I1 × I2 , niin F (x, y) = 0
⇔
y = f (x),
(iii) funktio f (x) on derivoituva välillä I1 , ja pisteessä a on voimassa f ′ (a) = −
Fx (a, b) . Fy (a, b)
Todistus. Sivuutetaan. Todetaan kuitenkin, että jos oletamme, että ehdot (i) ja (ii) toteuttava funktio f (x) on olemassa, niin tällöin funktio G(x) = F (x, f (x)) = 0 kaikilla x ∈ I1 . Tällöin myös G′ (x) = 0 koko välillä I1 . Toisaalta Lauseen 4.65 nojalla
0 = G′ (a) = Fx (a, f (a)) + Fy (a, f (a)) · f ′ (a).
Kohdan (iii) lauseke implisiittisesti määräytyneen funktion derivaatalle f ′ (a) seuraa tästä. Esimerkeissämme funktio F (x, y) on kahden muuttujan polynomi, ja tällöin meidän ei tarvitse vedota Lauseeseen 4.65, kunhan pidämme Implisiittifunktiolauseen muita osia tunnettuina. Voimme mm. käyttääkin Seurausta 4.15 sen asemesta.
Esimerkki 5.27.
Ratkaistaan Esimerkki 5.18 uudelleen käyttämällä implisiittistä derivointia, eli määrätään
ympyrän x2 + y 2 = 25
pisteeseen (3, 4) piirretyn tangentin yhtälö.
Ratkaisu. Ympyrä on yhtälön F (x, y) = x2 + y 2 − 25 = 0
(∗)
ratkaisujen joukko. Tässä Fx = 2x ja Fy = 2y . Joten ympyrän sellaisen pisteen (x0 , y0 ) ympäristössä, jossa y0 6= 0 implisiittifunktiolause takaa, että y voidaan ratkaista yksikäsitteisesti x:n funktiona y = y(x). Lisäksi y ′ (x0 ) = −2x0 /(2y0 ) = −x0 /y0 , joten pisteessä (3, 4) tangentin kulmakertoimeksi tulee −3/4.
Yksinkertaisemmin tässä voidaan edetä sijoittamalla yhtälöön (∗) muuttujan y paikalle funktio y(x) x2 + y(x)2 = 25.
Derivoimalla tämä funktioiden välinen yhtälö puolittain x:n suhteen saadaan Seurauksen 4.15 nojalla 2x + 2yy ′ = 0,
mistä ratkeaa y ′ = −x/y,
tai tarkemmin y ′ (x) = −x/y(x). 150
Huomaa, että implisiittifunktiolause automaattisesti myös diagnosoi aikaisemmin havaitsemamme ongelman tämän ympyrän pisteen Q = (5, 0) lähellä, missä emme voi ratkaista y :tä yksikäsitteisesti x:n funktiona (ratkaisuja y :n arvoksi on pienessäkin ympäristössä 2, 1 tai 0 sen mukaan onko x < 5, = 5 vai > 5). Nimittäin Fy (Q) = 0, joten implisiittifunktiolause ei lupaakaan mitään! y 10
5
P -10
5
-5
10
x
-5
PSfrag repla ements
-10
Kuva 5.9: Asteroidi x2/3 + y 2/3 = 5
Esimerkki 5.28.
Yhtälö x2/3 + y 2/3 = 5.
määrää asteroidiksi kutsutun käyrän (Kuva 5.9). Totea, että piste P = (8, 1) on tällä käyrällä, ja määrää pisteeseen P piirretyn tangentin kulmakerroin.
Ratkaisu. Koska 82/3 = 4 ja 12/3 = 1, niin piste P
on asteroidilla. Derivoimalla asteroidin yhtälö implisiiit-
tisesti saadaan 2 −1/3 2 −1/3 ′ x + y y = 0. 3 3
Tästä ratkeaa
r y dy x−1/3 y = = − −1/3 = − 3 . dx x y ′
p Pisteessä P saadaan siten y ′ (P ) = − 3 1/8 = −1/2.
Usein voidaan derivaatta laskea monellakin eri tavalla.
Esimerkki 5.29.
Tutkitaan hyperbeliä x2 − y 2 = 1
√ pisteen P = ( 2, −1) läheisyydessä (Kuva 5.10). Määrää hyperbelin tähän pisteeseen piirretyn tangentin
yhtälö käyttäen A) ekplisiittistä derivointia, B) implisiittistä derivointia, C) parametriesitystä. 151
y
2
1
-3
-2
-1
1
-1
PSfrag repla ements
2
3
x
P
-2
-3
Kuva 5.10: Hyperbeli x2 − y 2 = 1
Ratkaisu. Eksplisiittistä derivointia varten meidän on ratkaistava y
suljetussa muodossa. Hyperbelin yh√ tälöstä saadaan y = ± x2 − 1, kun |x| ≥ 1. Tällä kertaa meidän on käytettävä miinusmerkkistä versiota, √ joten y = y(x) = − x2 − 1. Tästä saadaan suoraan derivoimalla 1 −x y ′ (x) = −D(x2 − 1)1/2 = − (x2 − 1)−1/2 · 2x = √ . 2 x2 − 1 √ √ √ Erityisesti siis kohdassa x = 2 saadaan y ′ ( 2) = − 2. Etsitty tangentin yhtälö on siis √ √ √ (y − 1) = − 2(x − 2) ⇔ y + 2x = 3.
Derivoimalla hyperbelin yhtälö implisiittisesti saadaan 2x − 2yy ′ = 0, √ √ √ josta dy/dx = y ′ = x/y . Siis pisteessä ( 2, −1) saadaan dy/dx = − 2/1 = − 2 kuten suljettua muotoa
käyttämällä.
Voimme käyttää myös hyperbelin parametriesitystä. Nimittäin pisteet (cosh t, sinh t) toteuttavat yhtälön x2 − y 2 = 1 hyperbelifunktioiden perusominaisuuksien vuoksi. Koska kaikille t ∈ R on cosh t ≥ 1, ja koska
sinh t : R → R on bijektio, niin meidän on helppo vakuuttua siitä, että tällä tavalla voimme parametrisoida
hyperbelin oikeanpuoleisen haaran (kutakin lukua y kohti yhtälöllä x2 − y 2 = 1 on yksi ratkaisu x ≥ 1). Siis
parametrisointina on x(t) = cosh t, y(t) = sinh t. Pisteeseen P osutaan, kun sinh t = −1 eli kun t = t0 =
152
ln(−1 +
√ 2). Nyt kulmakertoimeksi saadaan
y ′ (t0 ) cosh t0 dy = ′ = dx x (t0 ) sinh t0 1 t0 (e + e−t0 ) = 2 −1 √ √ −1 + 2 + 1/(−1 + 2) . = −2 √ √ √ 2 Tässä viimeisen muodon osoittaja sievenee, kun huomataan, että ( 2 − 1)( 2 + 1) = 2 − 12 = 1. Näin √ √ √ √ ollen ko. osoittaja on −1 + 2 + (1 + 2) = 2 2, ja jälleen dy/dx = − 2.
Kuten olemme nähneet, implisiittinen derivointi on erittäin mukava työkalu silloin, kun tarkasteltavasta pisteestä jo tiedämme sen x− ja y -koordinaatit. Rajoituksena sillä on, että joskus derivaatalle dy/dx saadaan 0/0-muotoinen lauseke. Tällöinhän ei implisiittifunktiolause lupaa meille apuaan. Parametriesitys on yleis-
pätevämpi. Eri menetelmiä yhdessä käyttämällä saadaan yleensä hyvä kokonaiskuva tutkittavasta käyrästä. Kuten seuraavassa esimerkissä näemme, implisiittinen derivointi toimii silloinkin, kun emme osaa ratkaista y :tä algebrallisin menetelmin.
Esimerkki 5.30.
Tutkitaan ns. Kartesiuksen lehteä, joka on yhtälön x3 + y 3 − 3xy = 0
ratkaisupisteiden (x, y) muodostama käyrä (Kuva 5.11).
Ratkaisu.
Huomaamme heti yhtälöstä, että kyseinen käyrä on symmetrinen suoran y = x suhteen, sillä
jos piste (x, y) on käyrällä, niin myös piste (y, x) on käyrällä. Implisiittinen derivointi johtaa tällä kertaa tulokseen 3x2 + 3y 2 y ′ − 3y − 3xy ′ = 0,
josta voimme ratkaista
x2 − y dy . = dx x − y2
Tästä voimme yrittää ratkaista esimerkiksi ääriarvokohtia asettamalla tämän nollaksi. Saamme tällöin yhtälön x2 = y . Sijoittamalla tämä alkuperäiseen yhtälöön seuraa x3 + (x2 )3 − 3x(x2 ) = 0
⇔
0 = x6 − 2x3 = x3 (x3 − 2).
Näemme, että tällä yhtälöllä on kaksi reaalista ratkaisua x = 0 ja x =
√ 3 2. Jos x = 0, niin tällöin myös y = 0.
Tässä pisteessä emme voi käyttää kaavaa y ′ = (x2 − y)/(x − y 2), koska se johtaa 0/0-muotoon (kuvasta näet,
että origossa käyrä leikkaa itsensä, joten tilanne on samanlainen kuin aikaisemmin alfakäyrällä). Sen sijaan √ √ pisteessä P = (x = 3 2, y = x2 = 3 4) käyrällä on vaakasuora tangentti. Symmetrian nojalla tällöin pisteessä √ √ Q = ( 3 4, 3 2) käyrällä on pystysuora tangentti.
153
y P 1.5
Q 1
0.5
-1.5
-1
-0.5
0.5
1
1.5
x
-0.5
PSfrag repla ements -1
-1.5
Kuva 5.11: Kartesiuksen lehti x3 + y 3 − 3xy = 0 ja sen asymptoottisuora x + y + 1 = 0. Käyrän muiden ominaisuuksien analysoimiseksi tarvitsemme sille parametriesityksen. Tällä kertaa sellainen saadaan kirjoittamalla t = y/x ⇔ y = tx. Sijoittamalla tämä käyrän yhtälöön saadaan ratkaisu
(harjoitustehtävä), kunhan t 6= −1
3t , 1 + t3 2 y = y(t) = 3t . 1 + t3 Tässä siis parametrin t arvo −1 johtaa äärettömyyksiin. Helposti nähdään, että vasemmanpuoleiset raja x = x(t) =
arvot ovat limt→−1− x(t) = ∞, limt→−1− y(t) = −∞ ja oikeanpuoleiset vastaavasti limt→−1+ x(t) = −∞, limt→−1+ y(t) = ∞. Vastaavasti, kun parametri t lähestyy ääretöntä saadaan helposti lim (x(t), y(t)) = (0, 0),
t→±∞
joten käyrän piste tällöin lähestyy origoa (origon kautta kulkeva pystysuora käyrän osa). Toisena harjoitustehtävänä voit todistaa parametriesityksen avulla, että lim (x(t) + y(t)) = −1.
t→−1
Tämä selittää sen, että Kartesiuksen lehdellä on vino asymptootti x + y + 1 = 0 (kuvan harmaa suora). Yksityiskohtaisempaa analyysia varten muodostamme derivaatat x′ (t) ja y ′ (t): dx 3(1 − 2t3 ) , = dt (1 + t3 )2 3t(2 − t3 ) dy . = dt (1 + t3 )2
154
√ √ Tästä nähdään, että funktio x(t) on kasvava, kun t < 1/ 3 2 ja vähenevä, kun t > 1/ 3 2. Parametrin arvo √ √ √ t = 1/ 3 2 vastaa pistettä Q = ( 3 4, 3 2), jossa jo näimme käyrällä olevan pystysuoran tangentin (vastaten √ x(t):n lokaalia maksimia). Vastaavasti y(t) on kasvava välillä t ∈ (0, 3 2) ja vähenevä väleillä t < 0, t 6= −1 √ ja t > 3 2. Kohdassa t = 0 on y -koordinaatilla lokaali minimi (origon kautta kulkeva vaakasuora käyrän osa) √ √ √ ja kohdassa t = 3 2 lokaali maksimi vastaten aiemmin löytämäämme pistettä P = ( 3 2, 3 4).
Ottamalla huomioon nämä koordinaattifunktioiden x(t) ja y(t) raja-arvot ja ääriarvokohdat voimme tehdä yhteenvedon: (i) Kun t kasvaa välillä (−∞, −1), piirtyy käyrän oikealle alaviistoon suuntautuva häntä origosta alkaen (x kasvaa → ∞ ja y vähenee → −∞).
(ii) Kun t kasvaa välillä (−1, 0], piirtyy käyrän vasemmalle yläviistoon suuntautuva häntä äärettömyydestä alkaen ja origoon päättyen (x kasvaa ja y vähenee). √ (iii) Kun t kasvaa välillä [0, 1/ 3 2], x kasvaa ja y kasvaa, ja piirtyy käyrän `lehden' alareunan se osa, joka
alkaa origosta ja päättyy pisteeseen Q. √ √ (iv) Kun t kasvaa välillä [1/ 3 2, 3 2] x vähenee ja y kasvaa, ja piirtyy lehden kaaren se osa, joka alkaa x-koordinaatin lokaalista maksimikohdasta Q ja päättyy y -koordinaatin lokaaliin maksimikohtaan P . √ (v) Kun t kasvaa välillä [ 3 2, ∞) molemmat koordinaatit vähenevät, ja piirtyy lehden yläreuna alkaen
pisteestä P ja päättyen origoon.
5.6 Korkeammat derivaatat ja parametrimuodossa tai implisiittisesti annettu käyrä Samoja periaatteita soveltaen voimme laskea toisen tai korkeamman derivaatan arvon tutkittavan käyrän annetussa pisteessä. Tarkastellaan ensin tapausta, missä käyrä on annettu parametrimuodossa x = x(t), y = y(t), missä funktiot x(t) ja y(t) ovat parametrin t vaihteluvälillä kahdesti derivoituvia. Oletetaan, että
tarkasteltavassa pisteessä x′ (t) 6= 0. Kuten yllä, tiedämme (rajoittumalla tarvittaessa pienemmälle välille)
funktiolla x = x(t) olevan käänteisfunktion t = t(x) , joten voimme laskea ketjusäännön ja käänteisfunktion
derivaatan kaavan avulla d dt d 1 d dy = y(t(x)) = y(t) = ′ y(t). dx dx dx dt x (t) dt
Aikaisemmin johdimme tästä tuloksen dy/dx = y ′ (t)/x′ (t). Nyt teemme havainnon, että tämä sama lasku osoittaa minkä tahansa funktiolle f (t) = f (t(x)) derivaattojen df /dt ja df /dx välillä olevan yhteyden 1 d d f (t(x)) = ′ f (t). dx x (t) dt
155
Soveltamalla tätä tulosta funktioon f = dy/dx = y ′ (t)/x′ (t) saamme etsimämme lausekkeen toiselle derivaatalle
d2 y d = 2 dx dx
dy dx
=
d dx
y ′ (t) x′ (t)
=
1 d ′ x (t) dt
y ′ (t) x′ (t)
=
y ′′ (t)x′ (t) − y ′ (t)x′′ (t) , x′ (t)3
missä viimeisessä vaiheessa käytimme osamäärän derivointikaavaa.
Esimerkki 5.31.
Tutkitaan funktion y = e2x kuvaajaa. Koska funktion t = t(x) = 2x käänteisfunktio on
x = x(t) = t/2, voimme ajatella kuvaajan olevan parametrimuodossa annettu käyrä y = et , x = t/2. Tarkista
laskemalla, että johtamamme kaavat antavat derivaatoille dy/dx ja d2 y/dx2 oikeat lausekkeet.
Ratkaisu. Nyt y′ (t) = y′′ (t) = et , x′ (t) = 1/2, ja x′′ (t) = 0. Sijoittamalla nämä derivaatat (parametrin t suhteen) kaavoihimme saamme
ja
y ′ (t) et dy = ′ = = 2et = 2e2x , dx x (t) 1/2
y ′′ (t)x′ (t) − y ′ (t)x′′ (t) et · (1/2) − et · 0 d2 y = = = 4et = 4e2x . 2 ′ 3 dx x (t) (1/2)3
Nämä ovat funktion f (x) = e2x ensimmäinen ja toinen derivaatta (x:n suhteen) kuten pitikin.
Esimerkki 5.32. Ratkaisu.
Määrää alfa-käyrän (Esimerkki 5.19 ja Kuva 5.6) kuperuussuunta sen kaikissa pisteissä.
Alfa-käyrän parametrisointi on x(t) = t2 − 1, y(t) = t3 − t. Suoraan derivoimalla saamme
x′ (t) = 2t, x′′ (t) = 2, y ′ (t) = 3t2 − 1, y ′′ (t) = 6t. Kaavamme mukaan pisteessä P = (x(t), y(t)) toisella
derivaatalla d2 y/dx2 on arvo
6t · 2t − (3t2 − 1)2 6t2 + 2 3t2 + 1 d2 y = = = . dx2 (2t)3 8t3 4t3
Tässä osoittaja 3t2 + 1 on aina positiivinen, joten toisen derivaatan merkki määräytyy nimittäjästä. Käyrä on siis pisteessä P ylöspäin kupera, jos t < 0, ja vastaavasti alaspäin kupera, jos t > 0. Parametrin arvo t = 0 vastaa pistettä P0 = (x(0), y(0)) = (−1, 0). Käyrän kuperuussuunta vaihtuu parametrin t vaihtaessa merkkiään, mutta on hiukan ongelmallista kutsua pistettä P0 käännepisteeksi, koska tässä pisteessä x-koordinaatti saavuttaa minimiarvonsa (vrt. Kuva 5.6). Tämä näkyy myös siinä, että x′ (t = 0) = 0, joten derivaattojen lausekkeita johdettaessa tehty oletus ei ole voimassa. Kohdan t = 0 missään ympäristössä ei funktiolla x(t) myöskään ole käänteisfunktiota. Parametrin arvot t = 1 ja t = −1 vastaavat molemmat origoa, mutta muutoin käyrä ei leikkaa itseään.
Ei ole erityisen mielekästä puhua käyrän kuperuussuunnasta origossa. Pystyimme kuitenkin selvittämään kummankin haaran kuperuussuunnan erikseen ne ovat vastakkaiset. Kun käyrä on annettu implisiittisesti muodossa F (x, y) = 0, voimme derivoida määrittelevän yhtälön puolittain tarvittavan monta kertaa. Emme esitä mitään tähän liittyvää teoriaa vaan tyydymme valaisemaan menetelmää esimerkein.
156
Esimerkki 5.33.
Perustele implisiittistä derivointia käyttäen, että ylempi puoliympyrä on ylöspäin kupera.
Ratkaisu. Voidaan siirtää ympyrän keskipiste origoon, jolloin ympyrän määrittelee yhtälö x2 + y2
= R2 ,
missä R > 0 on vakio (=ympyrän säde). Edetään kuten Esimerkin 5.27 vaihtoehtoisessa ratkaisussa, ja derivoidaan yhtälöä implisiittisesti puolittain. Ensimmäinen derivointikerta antaa tulokseksi 2x + 2yy ′ = 0 ⇔ x + yy ′ = 0,
josta jo aikaisemmin ratkaisimme y ′ = −x/y . Derivoidaan yhtälö puolittain implisiittistä uudelleen. Tulon
derivoimissäännön nojalla D(yy ′ ) = y ′ · y ′ + yD(y ′ ) = y ′2 + yy ′′ , joten saamme 1 + y ′2 + yy ′′ = 0,
mistä ratkeaa
x2
1 + y2 1 + y ′2 R2 x2 + y 2 y =− = − . =− =− y y y3 y3 ′′
Tästä väite seuraakin, sillä ylemmällä puoliympyrällä y > 0, jolloin y ′′ = −R2 /y 3 < 0.
Huomautamme vielä, että pisteissä joissa y = 0, emme saa toista derivaattaa lainkaan määritettyä.
Aikaisemmin jo näimme, että näissä pisteissä ympyrällä on pystysuora tangentti. Implisiittisellä derivoinnilla voidaan myös käsitellä käyrän eri haaroja sellaistenkin pisteiden ympäristössä, joissa implisiittifunktiolause ei voi tarjota apua. Tällöin turvaudutaan hieman likaisiin temppuihin. Sivuutamme siis teorian, ja valaisemme käytettävää tekniikkaa esimerkin avulla.
Esimerkki 5.34.
Yhtälön x3 + y 3 − 3xy = 0 määräämä Kartesiuksen lehti (ks. Kuva 5.11) jakautuu kuvan
perusteella origon läheisyydessä kahteen haaraan. Rajoitetaan tarkastelu vaakasuoraan haaraan. Perustele implisiittistä derivointia käyttäen, että kyseisellä haaralla on origossa vaakasuora tangentti ja lokaali minimikohta.
Ratkaisu. Esimerkissä 5.30 saimme määrittelevän yhtälön implisiittisen derivoinnin seurauksena yhtälön x2 − y = y ′ (x − y 2 ).
Sijoittamalla tähän x = 0, y(0) = 0 emme voi saada tulokseksi mitään hyödyllistä (muutoinhan implisiittilause kertoisi, että käyrällä olisikin vain yksi haara origon ympäristössä). Derivoidaan tämä yhtälö uudelleen implisiittisesti. Saadaan 2x − y ′ = y ′′ (x − y 2 ) + y ′ (1 − 2yy ′ ) = y ′′ (x − y 2 ) − 2yy ′2 + y ′ .
Jos oletamme, että toisella derivaatalla y ′′ on origossa jokin (äärellinen) arvo, niin sijoittamalla tähän yhtälöön x = 0, y(0) = 0 saadaan 0 − y ′ (0) = 0 − 2 · 0 + y ′ (0),
157
mistä ratkeaa y ′ (0) = 0. Tämä tulos ei tietenkään ole voimassa käyrän pystysuoralla haaralla, sillä siellä ei toisella derivaatalla ole äärellistä arvoa (nähdään joko kuvasta katsomalla tai varmemmin käyttämällä kartesiuksen lehden parametriesitystä). Toisen derivaatan löytämiseksi derivoidaan vielä kertaalleen implisiittisesti: 2 − y ′′ = y ′′′ (x − y 2 ) + y ′′ (1 − 2yy ′ ) − 2y ′3 − 4yy ′ y ′′ + y ′′ .
Sijoitetaan tähän yhtälöön x = 0, y(0) = 0 ja äsken ratkaistu y ′ (0) = 0. Olettaen että kolmannella derivaatalla on jokin äärellinen arvo saadaan 2 − y ′′ (0) = 0 + y ′′ (0)(1 − 0) − 2 · 0 − 4 · 0 + y ′′ (0) ⇔ 2 = 3y ′′ (0),
mistä ratkeaa y ′′ (0) = 2/3. Koska tämä on positiivinen luku, on käyrän tämä haara tarkastelupisteen lähistöllä alaspäin kupera. Koska lisäksi y ′ (0) = 0, niin kyseessä on lokaali minimikohta. Ratkaisumenetelmä perustuu siihen olettamukseen, että tutkittavaa käyrän haaraa vastaa eräs muuttujan x funktio, jolla on kaikkien kertalukujen derivaatat pisteen x = 0 jossakin ympäristössä. Tällöin jatkamalla
implisiittistä derivointia voidaan nämä korkeammat derivaatat y (n) (0) ratkaista sijoittamalla aina seuraavaan yhtälöön koordinaattien x = 0, y(0) = 0 arvojen lisäksi aikaisemmissa vaiheissa selvitettyjen derivaattojen y (k) (0), k < n arvot.
5.7 Aika käyrän parametrina. Hetkellinen nopeus ja kiihtyvyys Neljännessä luvussa jo totesimmekin, että kappaleen paikkaa kuvaavan funktion derivaatta ajan suhteen kertoo sen nopeuden ja toinen derivaatta ajan suhteen kiihtyvyyden (ks. Esimerkit 4.24 ja 4.42). Siellä liike oli luonteeltaan 1-ulotteista, tai ainakin sellaista, että se voitiin hallita ajan yhden funktion avulla. Tyypillinen liike tasossa (tai 3-ulotteisessa avaruudessa) on esitettävissä siten, että hetkellä t kappale on paikassa P (t) = (x(t), y(t)). Jos tässä funktiot x(t) ja y(t) ovat (ainakin paloittain) derivoituvia, niin liikettä kuvaa parametrimuodossa oleva käyrä, jonka parametrina on aika. Tällöin aikavälillä [t, t + ∆t] kappale on siirtynyt pisteestä P (t) pisteeseen P (t + ∆t). Näiden erotusvektori jaettuna aikavälin pituudella ∆t kuvaa siten liikkeen keskimääräistä suuntaa ja nopeutta ko. välillä. Normaalin tapaan raja-arvona (kun ∆t → 0)
saadaan hetkellinen nopeusvektori v(t). Aiemmasta poiketen raja-arvo on luonteeltaan vektorisuure, eli sillä on sekä suunta että pituus P (t + ∆t) − P (t) = v(t) = lim ∆t→0 ∆t
x(t + ∆t) − x(t) y(t + ∆t) − y(t) lim , lim ∆t→0 ∆t→0 ∆t ∆t
= (x′ (t), y ′ (t)).
Tämän nopeusvektorin pituutta (=skalaari) voidaan kutsua hetkelliseksi nopeudeksi v(t). Pythagoraan lauseen nojalla äskeinen lasku antaa meille tuloksen v(t) =
p x′ (t)2 + y ′ (t)2 .
158
Esimerkki 5.35.
Erään jousisysteemin varassa tasossa liikkuva kappale liikkuu pitkin Kuvan 5.4 Lissajoux-
käyrää x(t) = sin 2t, y(t) = sin 3t (kunhan kappaleen lähtöpaikka ja alkunopeusvektori asetetaan sopiviksi). Etsi tällaista jaksollista tasoliikettä tekevän kappaleen hetkellisen nopeuden suurin arvo.
Ratkaisu. Suoraan derivoimalla saadaan x′ (t) = 2 cos 2t, y′ (t) = 3 cos 3t. Nopeuden suurin arvo saavutetaan samalla hetkellä kuin sen neliön suurin arvo, joten tehtävänä on selvittää funktion v 2 (t) = x′ (t)2 + y ′ (t)2 suurin arvo. Käyttämällä kaavaa cos2 x = (1 + cos 2x)/2 saadaan v 2 (t) = 4 cos2 2t + 9 cos2 3t = 2 (1 + cos 4t) +
13 1 9 (1 + cos 6t) = + (9 cos 6t + 4 cos 4t) . 2 2 2
Tässä sulkulausekkeen arvo on selvästi ≤ 13. Se on tasan 13 silloin ja vain silloin, kun samanaikaisesti cos 6t = 1 ja cos 4t = 1. Näin on aina, kun t on funktioiden cos 6t ja cos 4t pienimmän yhteisen jakson π
kokonaislukumonikerta, eli kun t = nπ, n ∈ Z. Näillä ajan hetkillä 13 1 13 1 + (9 cos 6t + 4 cos 4t) = + (9 · 1 + 4 · 1) = 13. 2 2 2 2 √ Vastaukseksi saamme, että suurin hetkellinen nopeus on v(t) = 13, ja se saavutetaan hetkellä t = nπ , v 2 (t) =
n ∈ Z.
Huomaa, että mainittuina ajan hetkinä kappale on origossa. Mekaniikan kurssin tietojen avulla tämä
voidaan selittää siten, että tämän liikkeen sallivan jousisysteemin potentiaalienergia on minimissään origossa. Näin ollen energian säilymislain seurauksena kappaleen liike-energia on suurimmillaan sen ollessa origossa. Jos liikettä kuvaavilla ajan funktioilla x(t) ja y(t) on myös toisen kertaluvun derivaatat (Newtonin liikelakien seurauksena näin on käytännöllisesti katsoen aina), niin tällöin hetkellinen nopeus v(t) = (x′ (t), y ′ (t)) vastaa sekin tasokäyrää, ja voimme samaan tapaan muodostaa sen derivaatan, minkä seurauksena saadaan hetkellinen kiihtyvyys(vektori) a(t) = (x′′ (t), y ′′ (t)).
Esimerkki 5.36.
Tasaisessa ympyräliikkeessä kappale liikkuu kulmanopeudella ω > 0 ajan t parametrisoi-
mana pitkin ympyrärataa x(t) = R cos ωt, y(t) = R sin ωt, missä R > 0 on kyseisen ympyrän säde. Osoita, että pisteessä P = (x(t), y(t)) kappaleeseen kiihtyvyys a(t) on suoraan kohti ympyrän keskipistettä, eli ~ vastakkaissuuntainen. vektorille OP
Ratkaisu. Derivoimalla kahdesti ajan t suhteen saadaan ensin v(t) = (−Rω sin ωt, Rω cos ωt)
ja sitten a(t) = (−Rω 2 cos ωt, −Rω 2 sin ωt) = −ω 2 r(t), ~ = (x(t), y(t)). Tässä kerroin −ω 2 < 0, joten väite seuraa. missä r(t) = OP
159