148 78 425KB
Finnish Pages 60 Year 2007
Algebran peruskurssi I Turun yliopisto
Markku Koppinen
10. tammikuuta 2007
Alkusanat Algebran peruskurssit I ja II ovat jatkoa lineaarialgebran kurssille. Perehdytään erilaisiin algebrallisiin systeemeihin: ryhmiin, vektoriavaruuksiin, renkaisiin, kuntiin. Näitä tärkeitä rakenteita tarvitaan, paitsi matematiikan eri alueilla, kaikkialla muuallakin, missä matematiikkaa sovelletaan. Nämä Algebran peruskurssit I ja II noudattavat melko tarkoin Tauno Metsänkylän aikaisemmin kirjoittamia monisteita. Suurin ero on, että nyt lineaarikuvauksiin tutustutaan jo lineaarialgebran kurssilla (vektoriavaruuksien Rn tapauksessa) ja abstraktit vektori- ja sisätuloavaruudet tulevat Algebran peruskursseissa; aikaisemmin nämä olivat päinvastoin. Lisäksi aineistoa on järjestelty muutenkin uudestaan, käsittelyä on paikoin muutettu ja esimerkkejä on lisätty. Useista esimerkeistä ei ratkaisua ole kirjoitettu näkyviin. Niitä ratkottaneen luennoilla ja demonstraatioissa. Kaikkia ei varmasti ehditä kurssilla käsitellä, joten loput jäävät omakohtaista harjoittelua varten. Osa on melko vaikeitakin. Monisteen kolmas luku, yleiset vektoriavaruudet, on suurelta osin lineaarialgebran kurssilta tuttua asiaa, jota nyt vain käsitellään yleisemmällä tasolla. Siksi sitä ei käytäne luennoilla aivan yksityiskohtaisesti läpi.
i
Sisältö 1 Lukuteoriaa 1.1 1.2
1.3
Ekvivalenssirelaatio . . . . . . . Kokonaislukujen tekijöihinjako 1.2.1 Suurin yhteinen tekijä . 1.2.2 Aritmetiikan peruslause Kongruenssi . . . . . . . . . . .
1 . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
2 Ryhmä 2.1
2.2 2.3 2.4 2.5
13
Ryhmän käsite . . . . . . . . . . . . . . 2.1.1 Perusominaisuuksia . . . . . . . 2.1.2 Ryhmätaulu . . . . . . . . . . . . 2.1.3 Ryhmien suora tulo . . . . . . . Aliryhmä . . . . . . . . . . . . . . . . . 2.2.1 Osajoukon generoima aliryhmä . Syklinen ryhmä . . . . . . . . . . . . . . Sivuluokat . . . . . . . . . . . . . . . . . 2.4.1 Normaali aliryhmä. Tekijäryhmä Ryhmähomomorsmit . . . . . . . . . . 2.5.1 Kuva ja ydin . . . . . . . . . . . 2.5.2 Ryhmien isomora . . . . . . . . 2.5.3 Homomoralause . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
3 Vektoriavaruus 3.1 3.2 3.3 3.4 3.5 3.6
1 4 6 8 9
13 17 18 19 20 22 23 24 27 30 32 34 35
37
Johdanto . . . . . . . . . . . . . . . . . . Yleinen reaalinen vektoriavaruus . . . . . Aliavaruus . . . . . . . . . . . . . . . . . . 3.3.1 Vektorijoukon virittämä aliavaruus Lineaarinen riippuvuus . . . . . . . . . . . Kanta ja dimensio . . . . . . . . . . . . . Koordinaattivektorit ja kannan vaihto . .
ii
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
37 37 40 41 42 44 48
SISÄLTÖ 3.7 3.8 3.9 3.10
Aliavaruuksien suora summa . . . . . . . . Lineaarikuvaus . . . . . . . . . . . . . . . . Lineaarikuvauksen ydin ja kuva . . . . . . . Säännöllinen lineaarikuvaus . . . . . . . . . 3.10.1 Vektoriavaruuksien isomorsmi . . . 3.11 Lineaarikuvauksen matriisi . . . . . . . . . 3.12 Lineaarikuvauksen ominaisarvot ja -vektorit
iii . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
49 50 51 53 53 54 56
Luku 1
Lukuteoriaa 1.1 Ekvivalenssirelaatio Joukkojen A1 ja A2 karteesisella tulolla A1 × A2 tarkoitetaan joukkoa, jonka muodostavat kaikki järjestetyt parit (a1 , a2 ), missä a1 ∈ A1 ja a2 ∈ A2 ; toisin sanoen
A1 × A2 = {(a1 , a2 ) | a1 ∈ A1 , a2 ∈ A2 }. Karteesisesta tulosta A × A käytetään myös merkintää A2 . Olkoon R ⊆ A × A jokin osajoukko. Silloin sanotaan, että R on relaatio joukossa A. Kun (a, b) ∈ R, sanotaan, että alkio a on relaatiossa R alkion b kanssa, ja merkitään lyhyesti a R b. Usein relaatio määritellään antamalla sääntö sille, milloin a R b on voimassa. Tällöin relaatioksi R voidaan kutsua myös tätä sääntöä (hiukan epätäsmällisesti).
Esimerkki 1.1.1 a) Määritellään joukossa R relaatio R asettamalla sääntö x R y ⇔ x < y . Siis R on reaalilukujen tavallinen pienemmyysrelaatio. Usein tämä ilmaistaan sanomalla, että R on relaatio < , mutta tarkasti ottaen R määritellään joukkona R = {(x, y) ∈ R2 | x < y}. b) Olkoon A = {x, y, z} ja R = {(x, y), (x, z), (y, z)}. Silloin R:n määrittämässä relaatiossa on x R y , x R z ja y R z . c) Määritellään n×n-matriisien joukossa relaatio sanomalla, että matriisi A on relaatiossa matriisin B kanssa, jos ne kommutoivat.
Määritelmä 1.1.2 Joukossa A määriteltyä relaatiota R sanotaan ekvivalenssirelaatioksi tai ekvivalenssiksi, jos se täyttää seuraavat ehdot: E1. Kun a ∈ A, niin a R a.
(reeksiivisyys )
E2. Kun a, b ∈ A ja a R b, niin b R a.
(symmetrisyys )
E3. Kun a, b, c ∈ A ja a R b ja b R c, niin a R c.
(transitiivisuus )
1
LUKU 1. LUKUTEORIAA
2
Ekvivalenssirelaatiota merkitään usein symbolilla ∼ . Jos a ∼ b, sanotaan, että a on ekvivalentti b:n kanssa tai että a ja b ovat ekvivalentit.
Esimerkki 1.1.3 Tutkitaan, millä esimerkin 1.1.1 relaatioista on mitkäkin ominaisuuksista E1 E3.
Esimerkki 1.1.4 Jokaisessa joukossa A yhtäsuuruusrelaatio on ekvivalenssirelaatio. Esimerkki 1.1.5 Matriisien vaakariviekvivalenssi on ekvivalenssirelaatio joukossa Mm×n (R). Esimerkki 1.1.6 Matriisien similaarisuus on ekvivalenssirelaatio joukossa Mn (R). Esimerkki 1.1.7 Tason suorien joukossa yhdensuuntaisuus L1 kL2 on ekvivalenssirelaatio. Määritelmä 1.1.8 Olkoon ∼ jokin joukon A ekvivalenssirelaatio. Alkion a ∈ A kanssa ekvivalenttien alkioiden joukkoa sanotaan a:n ekvivalenssiluokaksi [a]; siis (1.1)
[a] = {b ∈ A | b ∼ a}.
Lemma 1.1.9 Olkoon ∼ joukon A ekvivalenssirelaatio. Jos b ∈ [a], niin [a] = [b]. Todistus. Oletetaan, että b ∈ [a]; siis b ∼ a. Olkoon ensin c ∈ [b], toisin sanoen c ∼ b. Silloin c ∼ b ∼ a, joten transitiivisuuden nojalla c ∼ a, eli c ∈ [a]. Näin ollen [b] ⊆ [a]. Koska b ∼ a, niin symmetrisyyden perusteella a ∼ b. Jo todistetun nojalla [a] ⊆ [b]. 2 Ekvivalenssiluokan [a] jokaista alkiota sanotaan luokan edustajaksi. Lemman mukaan ekvivalenssiluokka [a] määräytyy jokaisesta edustajastaan. Kun kustakin ekvivalenssiluokasta valitaan tarkalleen yksi edustaja, saatua joukkoa sanotaan ekvivalenssiluokkien edustajistoksi.
Lause 1.1.10 Olkoon ∼ joukon A ekvivalenssirelaatio. Silloin A on erillisten (eli alkiovieraiden) ekvivalenssiluokkien unioni. Tarkemmin: Jos D on jokin ekvivalenssiluokkien edustajisto, niin [ A= [a], [a] ∩ [a0 ] = ∅ kun a, a0 ∈ D, a 6= a0 . (1.2) a∈D
S Todistus. Koska ehdon E1 nojalla aina a ∈ [a], niin A = a∈A [a]. Kaksi ekvivalenssiluokkaa ovat joko erilliset tai yhtäsuuret; jos nimittäin [a] ∩ [b] 6= ∅, niin valitaan c ∈ [a] ∩ [b], jolloin S lemmasta seuraa [a] = [c] = [b]. Kun nyt unionissa A = a∈A [a] annetaan a:n käydä vain jokin edustajisto D, unioniin tulee jokainen erisuuri ekvivalenssiluokka tarkalleen kerran. 2
Esimerkki 1.1.11 Määritellään kokonaislukujen joukossa Z ekvivalenssirelaatio: n ∼ m ⇔ |n| = |m|. Silloin [0] = {0},
[1] = [−1] = {−1, 1},
[2] = [−2] = {−2, 2},
... .
LUKU 1. LUKUTEORIAA
3
Edustajistoksi voidaan valita vaikkapa D = {0, 1, 2, . . .}. Lauseen antama hajotelma on
Z=
∞ [
[n] = {0} ∪ {±1} ∪ {±2} ∪ · · · .
n=0
Esimerkki 1.1.12 Vaikka edustajisto voidaankin yleensä valita monella eri tavalla, niin toisinaan on jokin muita luonnollisempi valinta. Niinpä esimerkin 1.1.5 ekvivalenssiluokille saadaan lineaarialgebran kurssista eräs edustajisto. Mikä? Jos joukko A on erillisten osajoukkojensa Ai 6= ∅ unioni (i käy jonkin indeksijoukon I ), siis jos
A=
[
Ai ,
Ai ∩ Aj = ∅
kun i, j ∈ I , i 6= j,
(1.3)
i∈I
sanotaan, että nämä osajoukot muodostavat A:n partition. Lause 1.1.10 voidaankin muotoilla näin: Jos joukossa A on määritelty ekvivalenssirelaatio, niin ekvivalenssiluokat muodostavat A:n partition. Myös käänteinen pätee: Jos joukossa A on annettu jokin partitio (1.3), niin voidaan määritellä relaatio A:ssa asettamalla, että a ∼ b jos a ja b ovat samassa osajoukossa Ai . Tämä on ilmeisestikin ekvivalenssirelaatio, ja Ai :t ovat juuri sen ekvivalenssiluokat.
Esimerkki 1.1.13 Katsotaan, millaisia ovat ekvivalenssiluokkien antamat partitiot eo. esimerkeissä esiintyneissä ekvivalenssirelaatioissa.
Esimerkki 1.1.14 Kirjoitetaan reaalilukujen joukko alkiovieraana unionina R =
S
n∈Z [n, n+1).
Voidaanko vastaava ekvivalenssirelaatio lausua millään mukavalla säännöllä? Kaikkien ekvivalenssiluokkien joukkoa (eli parvea; parvi = joukkojen joukko) sanotaan A:n osamääräjoukoksi tai tekijäjoukoksi ko. ekvivalenssirelaation suhteen. Sitä merkitään symbolilla A/∼ ; siis A/∼ = { [a] | a ∈ A} = { [a] | a ∈ D}. (1.4) Tähän liittyy kuvaus A → A/∼ , a 7→ [a], jossa siis kukin alkio kuvautuu edustamakseen ekvivalenssiluokaksi. Voidaan ajatella, että kuvaus samaistaa samaan ekvivalenssiluokkaan kuuluvat alkiot keskenään.
Esimerkki 1.1.15 Millainen on joukko R/∼ esimerkin 1.1.14 relaatiolle? Esimerkki 1.1.16 a) Määritellään R:ssä relaatio x ∼ y ⇔ x − y ∈ Z . Osoitetaan, että se on ekvivalenssirelaatio. Havainnollistetaan vastaavaa osamääräjoukkoa. b) Tarkastellaan samalla tavoin R2 :n relaatiota (x, y) ∼ (x0 , y 0 ) ⇔ y − y 0 ∈ Z.
LUKU 1. LUKUTEORIAA
4
1.2 Kokonaislukujen tekijöihinjako Seuraavassa tutkitaan kokonaislukujen joukkoa Z = {0, ±1, ±2, . . .}. Jos kokonaisluku a on jaollinen kokonaisluvulla b, toisin sanoen jos on sellainen c ∈ Z, että a = bc, merkitään b | a. Käytetään myös sanontoja: b jakaa a:n, b on a:n tekijä, a on b:n monikerta. Vastakohta merkitään b - a. Esimerkiksi 2 | 8 ja 3 | 15 mutta 6 - 21. Jaollisuudella on seuraavat yksinkertaiset ominaisuudet (perustele ne!): Kun a, b, c ∈ Z, niin (i)
a | a;
(ii)
jos a | b ja b | a, niin a = ±b ;
(iii)
jos a | b ja b | c, niin a | c ;
(iv)
jos a | b ja a | c, niin a | (b + c).
Kokonaislukua p > 1, jonka ainoat tekijät ovat ±1 ja ±p, sanotaan alkuluvuksi tai jaottomaksi luvuksi (engl. prime). Muita kokonaislukuja n > 1 sanotaan yhdistetyiksi luvuiksi (composite number). Yhdistetty luku n voidaan siis hajottaa muotoon (hajottaa tekijöihin)
n = n1 n2 ,
1 < n1 < n,
1 < n2 < n.
Jatkamalla tässä tekijöiden n1 ja n2 hajottamista (jos mahdollista) saadaan lopulta luvun n alkutekijähajotelma n = p1 p2 · · · ps (p1 , . . . , ps alkulukuja). (1.5) Se voidaan kirjoittaa myös muodossa
n = q1h1 q2h2 · · · qrhr
(q1 , . . . , qs erisuuria alkulukuja, hi ≥ 1 ∀ i).
(1.6)
Myöhemmin todistetaan ns. aritmetiikan peruslause, jonka mukaan luvun n alkutekijähajotelma (1.5) on yksikäsitteinen, samoin siis (1.6), tekijöiden järjestystä lukuun ottamatta. Jälkimmäistä sanotaan luvun n kanoniseksi (alkutekijä)hajotelmaksi.
Esimerkki 1.2.1
700 = 2 · 2 · 5 · 5 · 7 = 22 · 52 · 7.
Alkulukujen joukkoa merkitään P:llä; siis
P = {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 57, . . .}.
Lause 1.2.2 (Eukleides) Alkulukuja on äärettömän monta. Todistus. Tehdään vastaoletus: p1 , . . . , pr ovat kaikki alkuluvut. Muodostetaan luku n = p1 · · · pr + 1.
LUKU 1. LUKUTEORIAA
5
Koska n > 1, se voidaan hajottaa alkutekijöihin. Olkoon q jokin alkutekijöistä. Vastaoletuksen mukaan q on jokin pi . Nyt siis q | n − p1 · · · pr = 1, ristiriita!
2
Kun kokonaisluku jaetaan toisella kokonaisluvulla, jää yleensä jakojäännös. Seuraavassa lauseessa tämä seikka muotoillaan tarkasti. (Lauseen nimi on hiukan harhaanjohtava; algoritmiksi voi kutsua sitä menetelmää, jolla jakolasku suoritetaan esimerkiksi jakokulmassa.)
Lause 1.2.3 (Jakoalgoritmi) Jos a, b ∈ Z ja b 6= 0, on yksikäsitteiset sellaiset q, r ∈ Z, että a = qb + r,
0 ≤ r < |b|.
(1.7)
Todistus. Todistetaan lukujen q, r olemassaolo. Olkoon ensin b > 0. Valitaan joukosta {a − nb | n ∈ Z} pienin epänegatiivinen luku r. (Miksi se on mahdollista?) Merkitään r = a − qb, missä q ∈ Z. Silloin a = qb + r. Lisäksi r < b = |b|, sillä muuten em. joukossa olisi r:ää pienempikin epänegatiivinen luku r − b = a − (q + 1)b. Olkoon nyt b < 0. Tämä tapaus palautuu edelliseen seuraavasti: Koska −b > 0, niin a = q(−b) + r, missä 0 ≤ r < |−b|, ja nyt a = (−q)b + r ja 0 ≤ r < |b|. Lopuksi todistetaan yksikäsitteisyys. Oletetaan, että myös luvut q 0 ja r0 toteuttavat lauseen ehdot. Yhtälöstä qb + r = q 0 b + r0 saadaan r − r0 = (q 0 − q)b, ja koska 0 ≤ r < |b| ja 0 ≤ r0 < |b|, niin
0 ≤ |r − r0 | < |b|. Jos olisi q 6= q 0 , niin |q 0 − q| ≥ 1 ja siis |r − r0 | = |(q 0 − q)b| ≥ |b|, ristiriita. Näin ollen q = q 0 , ja nyt yhtälöstä qb + r = q 0 b + r0 seuraa r = r0 . 2
Esimerkki 1.2.4
50 = 4 · 11 + 6,
19 = (−2)(−7) + 5, −8 = (−1) · 10 + 2.
Huomautus 1.2.5 Jakoalgoritmin todistuksessa haluttiin pitäytyä kokonaisluvuissa. Katsomalla Z:aa R:n osajoukkona jakoalgoritmia voi ajatella myös seuraavasti. Tarkastellaan tapausta b > 0. Vastaavasti kuin esimerkissä 1.1.14 reaalilukujen joukolle saadaan partitio käyttämällä S b:n mittaisia välejä: R = n∈Z [nb, (n + 1)b). Koska kyseessä on partitio, niin annettu luku a ∈ Z kuuluu tarkalleen yhteen väleistä; kun ko. väli on [qb, (q + 1)b) ja merkitään r = a − qb, saadaan lauseen luvut q, r. Edellä esitetty todistus on silti hyvin hyödyllinen, kun halutaan johtaa vastaavanlaisia tuloksia muissa tilanteissa. Esimerkiksi polynomeille on aivan analoginen jakoalgoritmi kuin kokonaisluvuille, ja todistuskin käy saman mallin mukaan; tämä tulee esille Algebran peruskurssissa II.
LUKU 1. LUKUTEORIAA
6
1.2.1 Suurin yhteinen tekijä Kahdella kokonaisluvulla a ja b, joista ainakin toinen on 6= 0, on aina vähintään yksi yhteinen positiivinen tekijä, nimittäin 1. Suurimmasta yhteisestä tekijästä (joka siis on aina ≥ 1) käytetään merkintää syt(a, b) tai (a, b). Jos syt(a, b) = 1, sanotaan, että a ja b ovat suhteellisia alkulukuja tai keskenään jaottomia.
Lemma 1.2.6 Kun a, b ∈ Z ja ainakin toinen on 6= 0, niin syt(a, b) on joukon {xa + yb | x, y ∈ Z} pienin positiivinen luku.
Todistus. Kyseisessä joukossa on varmasti pienin positiivinen luku; olkoon se d = ua + vb, missä u, v ∈ Z. Näytetään ensin, että d | a. Jakoalgoritmin mukaan a = qd + r, missä 0 ≤ r < d. Silloin r = a − qd = (1 − qu)a + (−qv)b, joten myös r kuuluu mainittuun joukkoon. Jos r > 0, tämä on ristiriidassa d:n minimaalisuuden kanssa. Näin ollen r = 0 ja siis d | a. Symmetrian perusteella myös d | b. Siis d on a:n ja b:n yhteinen tekijä. Jos myös c on niiden yhteinen tekijä, niin c | (ua + vb) eli c | d. Koska d > 0, tästä seuraa c ≤ d. Siispä d = syt(a, b). 2 Seuraava tulos saadaan suoraan lemmasta ja sen todistuksesta.
Lause 1.2.7 Luku d = syt(a, b) täyttää seuraavat ehdot: (i) d on jaollinen jokaisella lukujen a ja b yhteisellä tekijällä; (ii) on sellaiset kokonaisluvut u ja v , että
d = ua + vb
(Bezout'n identiteetti).
Huomaa, etteivät kertoimet u ja v ole yksikäsitteisiä: esimerkiksi syt(4, 6) = 2 = 2 · 4 − 1 · 6 = (−1) · 4 + 1 · 6. Suurin yhteinen tekijä syt(a, b) voidaan laskea Eukleideen algoritmilla. Siinä sovelletaan jakoalgoritmia toistuvasti. Olkoon b 6= 0. Jos a | b, niin syt(a, b) = a. Oletetaan, että a - b. Saadaan
a = q1 b + r 1 , 0 < r1 < |b|, b = q2 r1 + r2 , 0 < r2 < r1 , r1 = q3 r2 + r3 , 0 < r3 < r2 , ....................................... rn−2 = qn rn−1 + rn , 0 < rn < rn−1 , rn−1 = qn+1 rn + 0.
LUKU 1. LUKUTEORIAA
7
Menettely päättyy, koska jakojäännökset ri muodostavat aidosti vähenevän jonon kokonaislukuja ≥ 0. Viimeinen nollasta poikkeva jakojäännös rn on haettu syt:
rn = syt(a, b). Tämä nähdään seuraavasti. Viimeisen yhtälön mukaan rn | rn−1 ; siis edellisen yhtälön mukaan rn | rn−2 , ja niin edelleen. Jatkamalla näin yhtälöketjussa ylöspäin saadaan lopulta rn | b ja rn | a. Siis rn on lukujen a ja b yhteinen tekijä. Jos toisaalta c | a ja c | b, niin ensimmäinen yhtälö antaa c | r1 , toinen c | r2 , ja niin edelleen, ja lopuksi saadaan c | rn . Näin ollen rn on yhteisistä tekijöistä suurin. Eukleideen algoritmilla voidaan myös ratkaista sellaiset u, v ∈ Z, että rn = ua+bv . Tämä käy eliminoimalla rn−1 , rn−2 , . . . , r1 yhtälöketjusta, esimerkiksi sijoitusmenettelyllä alhaalta lähtien.
Esimerkki 1.2.8 Saadaanko kaikki kokonaisluvut k muodossa k = 13n + 16m, missä n, m ∈ Z? Kyllä. Nimittäin syt(13, 16) = 1, joten on sellaiset u, v ∈ Z, että 1 = 13u + 16v . Siis k = 13(uk)+16(vk). Jos tarvitaan jokin ratkaisu (n, m) eksplisiittisesti, sellainen löydetään etsimällä jotkin u ja v . Käytetään Eukleideen algoritmia:
16 = 1 · 13 + 3, 13 = 4 · 3 + 1, 3 = 3 · 1 + 0. Saadaan 1 = 13 − 4 · 3 = 13 − 4 · (16 − 1 · 13) = 5 · 13 − 4 · 16. Näin ollen (u, v) = (5, −4), ja k = 13(5k) + 16(−4k) ∀ k ∈ Z.
Esimerkki 1.2.9 Hallussamme on esine, jonka pitäisi painaa 82 grammaa, ja haluaisimme tarkistaa tämän. Käytössämme on kaksivartinen vaaka ja suuri määrä 12 ja 18 gramman punnuksia. Onnistuuko? Esimerkki 1.2.10 Lasketaan syt(306, 657) ja lausutaan se muodossa 306u + 657v (u, v ∈ Z). Suurimman yhteisen tekijän käsitteen kanssa analoginen on lukujen a ja b pienin yhteinen monikerta (eli pienin yhteinen jaettava ) pyj(a, b). Jos a ja b ovat positiivisia, niin nämä käsitteet sitoo toisiinsa kaava syt(a, b) · pyj(a, b) = ab. Tämä näkee helpoiten alkutekijähajotelmista.
Huomautus 1.2.11 Lukujen suurin yhteinen tekijä syt(a1 , . . . , an ) voidaan tietenkin määritellä useammallekin kuin kahdelle luvulle, kun ainakin yksi luvuista ai on 6= 0. Samoin kuin lemmassa 1.2.6 todistetaan, että syt(a1 , . . . , an ) on joukon
{x1 a1 + · · · + xn an | x1 , . . . , xn ∈ Z}
LUKU 1. LUKUTEORIAA
8
pienin positiiviluku, ja sen voi siis aina esittää muodossa u1 a1 +· · ·+un an , missä u1 , . . . , un ∈ Z. Sen voi laskea myös rekursiivisesti kaavasta
syt(a1 , a2 , . . . , an ) = syt(a1 , syt(a2 , . . . , an )), kun ainakin yksi luvuista a2 , . . . , an on 6= 0. Emme todista tätä, vaikka todistus olisikin helppo.
1.2.2 Aritmetiikan peruslause Seuraavan lauseen antama ominaisuus karakterisoi alkuluvut uudella tavalla, sillä yhdistetyt luvut selvästikään eivät toteuta lauseen ehtoa. Ensimmäisenä sovelluksena siitä johdetaan aritmetiikan peruslause.
Lause 1.2.12 Olkoon p alkuluku. Jos p | ab (a, b ∈ Z), niin p | a tai p | b. Todistus. Koska p on alkuluku, niin syt(p, a) on p tai 1. Edellisessä tapauksessa p | a. Jälkimmäisessä tapauksessa Bezout'n identiteetti antaa 1 = up + va joillakin kokonaisluvuilla u, v . Siis b = 1b = (up + va)b = (ub)p + v(ab). Koska p | ab, nähdään että p | b.
2
Seuraus 1.2.13 Jos p on alkuluku ja jos p | a1 · · · ak (ai ∈ Z), niin p jakaa jonkin luvuista ai . Todistus. Tämä saadaan lauseesta induktiolla.
2
Lause 1.2.14 (Aritmetiikan peruslause) Jokainen kokonaisluku n > 1 voidaan esittää alkulukujen tulona eli muodossa n = p1 p2 · · · ps
(pi ∈ P ∀ i)
tekijöiden järjestystä vaille yksikäsitteisesti. Todistus. Alkutekijähajotelman olemassaolo perusteltiin pykälän 1.2 alussa. Yksikäsitteisyyden todistamiseksi oletetaan, että n:llä on myös esitys n = q1 q2 · · · qr , missä qi :t ovat alkulukuja. Siis p1 · · · ps = q1 · · · qr . Silloin p1 | q1 · · · qr , joten seurauksen 1.2.13 nojalla p1 jakaa jonkin qi :n. Voidaan olettaa, että p1 | q1 ; tarvittaessa muutetaan qi :den numerointia. Koska kyseessä on alkuluvut, niin p1 = q1 . Seuraa p2 · · · ps = q2 · · · qr . Jatkamalla samoin saadaan (mahdollisesti numerointia muuttamalla) p2 = q2 , . . . , ps = qs ja r = s. 2
LUKU 1. LUKUTEORIAA
9
On luonnollista sopia, että luvulla 1 on esitys tyhjänä alkulukutulona (siis s = 0). Negatiivisilla kokonaisluvuilla taas on yksikäsitteinen esitys muodossa −p1 · · · ps . Kahden luvun syt voidaan laskea tietysti määrittämällä ensin niiden alkutekijähajotelmat. Suurilla luvuilla Eukleideen algoritmi on kuitenkin nopeampi menetelmä.
Esimerkki 1.2.15 Koska 72 = 23 · 32 ja 60 = 22 · 3 · 5, niin syt(72, 60) = 22 · 3 = 12. Huomautus 1.2.16 Jaollisuuskäsite voidaan yleistää tietyt ehdot täyttäviin renkaisiin, joista
√ Z on vain erikoistapaus; esimerkkinä mainittakoon muotoa a+b n olevien lukujen joukko, missä a, b ∈ Z ja n on sopivasti valittu kiinteä kokonaisluku. Näiden lukujen jaottomuus määritellään vastaavasti kuin Z:ssa. Mutta lukujen esitys jaottomien lukujen tulona ei tällaisessa renkaassa ole yleensä yksikäsitteinen!
1.3 Kongruenssi Seuraavassa esitettävä kongruenssin käsite mahdollistaa jaollisuuteen liittyvien asioiden käsittelyn yhtälöiden tapaan.
Määritelmä 1.3.1 Olkoon m positiivinen kokonaisluku. Jos a, b ∈ Z ja jos a − b on jaollinen luvulla m, sanotaan, että a on kongruentti b:n kanssa modulo m, ja merkitään
a≡b
(mod m).
Tätä joukon Z relaatiota nimitetään kongruenssiksi ; luku m on sen moduli. Edellisen vastakohta: a on epäkongruentti (eli inkongruentti ) b:n kanssa modulo m, merkintä a 6≡ b (mod m).
Esimerkki 1.3.2
38 ≡ 2 (mod 6),
12 ≡ −13 (mod 5),
100 6≡ 1 (mod 10).
Määritelmän mukaan a ≡ b (mod m) tarkalleen silloin kun m | a − b, eli
a ≡ b (mod m)
⇐⇒
a = b + mq,
q ∈ Z.
(1.8)
Tästä nähdään helposti, että kongruenssi modulo m on joukon Z ekvivalenssirelaatio (tarkista ehdot E1E3), joka hajottaa Z:n seuraavanlaisiin ekvivalenssiluokkiin:
[a] = {a + mk | k ∈ Z}
(a ∈ Z).
(1.9)
Ekvivalenssiluokkaa [a] sanotaan luvun a jäännösluokaksi modulo m (tai mod m); siitä käytetään yleensä merkintää a tai a + mZ. Samaan jäännösluokkaan a kuuluvat luvut antavat m:llä jaettaessa saman jakojäännöksen. Kaikki mahdolliset jakojäännökset ovat 0, 1, . . . , m − 1, kokonaislukujen pienimmät epänegatiiviset jäännökset modulo m, ja nämä muodostavatkin jäännösluokkien mod m erään edustajiston.
LUKU 1. LUKUTEORIAA
10
Jäännösluokkien joukkoa merkitään Zm (siis merkinnän (1.4) mukaisesti Zm on Z/≡), ja se voidaan kirjoittaa seuraavasti: Zm = { 0, 1, . . . , m−1 }. (1.10)
Esimerkki 1.3.3 Z3 = { 0, 1, 2 }, missä 0= 3Z = {3k | k ∈ Z} = {. . . , −9, −6, −3, 0, 3, 6, 9, . . .}, 1 = 1 + 3Z = {1 + 3k | k ∈ Z} = {. . . , −8, −5, −2, 1, 4, 7, 10, . . .}, 2 = 2 + 3Z = {2 + 3k | k ∈ Z} = {. . . , −7, −4, −1, 2, 5, 8, 11, . . .}. Joukko Z3 voidaan esittää myös esimerkiksi muodoissa { −1, 0, 1 } tai { 7, 33, 2 }.
Esimerkki 1.3.4 Rajatapauksessa m = 1 kongruenssi on triviaali: a ≡ b (mod 1) kaikilla kokonaisluvuilla a, b. Erityisesti siis Z1 = {0}, missä 0 = Z.
Lause 1.3.5
(i) Jos a ≡ b (mod m) ja c ≡ d (mod m), niin
a + c ≡ b + d,
ac ≡ bd
(mod m).
(ii) Jos ca ≡ cb (mod m) ja syt(c, m) = 1, niin a ≡ b (mod m). (iii) Jos a ≡ b (mod km), missä k on kokonaisluku > 0, niin a ≡ b (mod m).
Todistus. (i) Luku (a + c) − (b + d) = (a − b) + (c − d) on jaollinen m:llä, koska a − b ja c − d ovat. Samoin nähdään, että ac − bd = (a − b)c + b(c − d) on jaollinen m:llä. (ii) Ehdoista m | c(a − b) ja syt(c, m) = 1 yhdessä seuraa, että m | a − b (ajattele lukujen kanonisia hajotelmia). (iii) Jos km | a − b, niin m | a − b. 2 Lauseen (i)-kohdan mukaan kongruensseja mod m voidaan laskea yhteen ja kertoa puolittain, samoin siis vähentää puolittain. Huomaa erikoistapaus c = d : jos a ≡ b (mod m) niin ca ≡ cb (mod m). Kohdan (ii) mukaan kongruenssin jakaminen puolittain c:llä on luvallista, jos syt(c, m) = 1; vertaa tätä siihen, että tavallisen yhtälön saa jakaa puolittain luvulla 6= 0.
Esimerkki 1.3.6 Lasketaan jakojäännös jaettaessa 182 + 2100 luvulla 11. Esimerkki 1.3.7 Jakamalla kongruenssi 3 ≡ 15 (mod 12) puolittain 3:lla saataisiin 1 ≡ 3 mod 12, mikä ei pidä paikkaansa. Lauseen (ii)-kohdasta ei siis oletusta syt(c, m) = 1 voi jättää pois. Huomaa kuitenkin, että 1 ≡ 5 (mod 4). Keksi tästä ja perustele yleinen tulos!
Esimerkki 1.3.8 Jos a ≡ b (mod m), niin lauseen 1.3.5 nojalla esimerkiksi 2 + 5a + 3a2 ≡ 2 + 5b + 3b2 (mod m). Yleisesti, jos P (x) on jokin kokonaiskertoiminen polynomi, siis jos P (x) = c0 + c1 x + · · · + ct xt
(c0 , . . . , ct ∈ Z),
niin kongruenssista a ≡ b (mod m) seuraa P (a) ≡ P (b) (mod m).
LUKU 1. LUKUTEORIAA
11
Esimerkki 1.3.9 Mitkä jakojäännökset ovat mahdollisia, kun kokonaisluvun a neliö a2 jaetaan luvulla 8? Jos a ≡ b (mod 8), niin a2 ≡ b2 (mod 8). Siksi kaikki mahdolliset jakojäännökset löydetään jo, kun a käy jäännösluokkien mod 8 edustajiston, esimerkiksi luvut 0, 1, . . . , 7.
a
0
1 2
3
a2
0
1
1 0 1
4
4
5 6
7
4 1
Siis mahdolliset jakojäännökset ovat 0, 1, 4. Jäännösluokkien joukosta Zm saadaan tärkeä algebrallinen systeemi, kun siinä määritellään yhteen- ja kertolasku sopivasti. Tätä käsitellään jäljempänä ryhmien ja Algebran peruskurssissa II renkaiden yhteydessä. Asian valmistelemiseksi esitellään kyseisten laskutoimitusten määritelmät jo tässä: Kun a ∈ Zm ja b ∈ Zm , niin
a + b = a + b,
(1.11)
a · b = ab.
Ongelmana kuitenkin on, että jäännösluokat ilmaistaan edustajien avulla, esimerkiksi jäännösluokka a edustajansa a avulla, eikä edustajan valinta ole yksikäsitteinen. On siis näytettävä, että näin määritellyt summa ja tulo ovat silti yksikäsitteisiä, toisin sanoen riippumattomia edustajien valinnasta. Tällainen tilanne, jossa määritelmä sisältää näennäisen riippuvuuden (ekvivalenssi)luokan edustajan valinnasta, on matematiikassa tavallinen. Kun on osoitettu, ettei riippuvuus ole todellinen, on tapana sanoa, että ko. käsite on hyvinmääritelty (well dened).
Lause 1.3.10 Yhtälöiden (1.11) mukaiset jäännösluokkien summa ja tulo ovat hyvinmääritellyt. Todistus. Oletetaan, että a = a0 ja b = b0 . Silloin a ≡ a0 ja b ≡ b0 (mod m). Lauseen 1.3.5 kohdan (i) mukaan siis a + b ≡ a0 + b0 ,
ab ≡ a0 b0
(mod m).
Tästä seuraa, että a + b = a0 + b0 ja ab = a0 b0 , mikä todistaa väitteen.
2
Esimerkki 1.3.11 Jäännösluokkien mod 7 joukossa 4 + 5 = 2. Toisaalta 4 = 60 ja 5 = 75, siis 4 + 5 = 60 + 75 = 135. Varmistu laskemalla, että 135 = 2. Kongruensseja sovelletaan mm. tutkittaessa Diofantoksen yhtälöitä. Nämä ovat yhtälöitä, joille haetaan kokonaislukuratkaisuja.
Esimerkki 1.3.12 Tarkastellaan Diofantoksen yhtälöä x2 − 2y 2 = 5. Osoitetaan, ettei sillä ole (kokonaisluku)ratkaisuja. Tutkitaan ensin kongruenssia x2 − 2y 2 ≡ 5 (mod 8). Esimerkistä 1.3.9 nähdään, että x2 ≡ 0, 1, 4 (mod 8) ja samoin y 2 ≡ 0, 1, 4 (mod 8). Laskemalla kaikki mahdolliset kombinaatiot todetaan, että x2 − 2y 2 ≡ 0, 1, 2, 4, 6, 7 (mod 8). Näin ollen kongruenssilla x2 − 2y 2 ≡ 5 (mod 8) ei ole kokonaislukuratkaisuja, eikä siis ole alkuperäisellä yhtälölläkään.
LUKU 1. LUKUTEORIAA
12
Esimerkki 1.3.13 A osti isoja munkkeja hintaan 15 mk/kpl ja pieniä 11 mk/kpl. (Tästä on joitakin vuosia.) Lasku oli 137 mk. Montako kumpaakin lajia oli? Ratkaistavana on Diofantoksen yhtälö 15x+11y = 137. Ratkaistaan se siirtymällä kongruenssiin 15x ≡ 137 (mod 11). Yleisestikin lineaarisen kahden tuntemattoman Diofantoksen yhtälön (1.12)
ax + my = c ratkaiseminen on ekvivalentti tehtävä kongruenssin
(1.13)
ax ≡ c (mod m)
ratkaisemisen kanssa. Jotta ratkaisuja olisi olemassa, on oltava syt(a, m) | c (katso (1.12)), ja tällöin tehtävä voidaan palauttaa tapaukseen syt(a, m) = 1. (Miten?) Ratkaisuja koskee seuraava tulos.
Lause 1.3.14 Jos syt(a, m) = 1, niin kongruenssilla (1.13) on yksikäsitteinen ratkaisu x ∈ Z välillä 0 ≤ x ≤ m − 1. Todistus. Oletuksen nojalla on sellaiset luvut u, v ∈ Z, että au + mv = 1 ja siis a(uc) + m(vc) = c. Kongruenssilla on täten ratkaisu x = uc. Tämän ratkaisun kanssa kongruentit luvut x = uc+km (k ∈ Z) ovat myös ratkaisuja. Toisaalta kongruenssin kaikki ratkaisut ovat keskenään kongruentteja mod m, sillä lauseen 1.3.5 (ii)-kohdan mukaan
ax1 ≡ ax2
(mod m)
=⇒
x1 ≡ x2
Ratkaisuista siis tarkalleen yksi on välillä 0 ≤ x ≤ m − 1.
(mod m).
2
Todistuksessa saatiin jopa:
Seuraus 1.3.15 Jos syt(a, m) = 1, niin kongruenssin (1.13) ratkaisut muodostavat yhden jäännösluokan mod m. Pienillä m:n arvoilla ratkaisu x ∈ {0, . . . , m − 1} löydetään usein helpoiten kokeilemalla. Joskus voi myös käyttää lauseen 1.3.14 todistuksen ideaa.
Esimerkki 1.3.16 Ratkaistaan kongruenssit 4x ≡ 3 (mod 7),
3x ≡ 6
(mod 12),
5x ≡ 7
(mod 10).
Kongruensseja käsitellään tarkemmin lukuteorian kurssissa.
Esimerkki 1.3.17 Olkoon syt(a, b) = 1. Bezout'n identiteetissä 1 = au + bv kertoimet u ja v eivät ole yksikäsitteiset. Millaisen joukon ratkaisut (u, v) muodostavat?
Luku 2
Ryhmä 2.1 Ryhmän käsite Joukossa S määritellyllä binäärioperaatiolla ∗ tarkoitetaan kuvausta S × S → S , merkitään (a, b) 7→ a ∗ b. Siis jos ∗ on annettu binäärioperaato joukossa S , niin jokaista alkioparia a, b ∈ S kohti määräytyy yksikäsitteinen kolmas saman joukon alkio a ∗ b.
Esimerkki 2.1.1 Kokonaislukujen joukossa Z on aiemmin määritelty ainakin kolme binäärioperaatiota, summa, tulo ja erotus ( + , · , − ). Määrittelemällä a ¦ b = ab + a + b ∀ a, b ∈ Z saataisiin uusi binäärioperaatio ¦ .
Esimerkki 2.1.2 Olkoon X joukko. Merkitään FX :llä kaikkien kuvausten X → X joukkoa. Kuvaustulo ◦ eli kuvausten yhdistäminen on binäärioperaatio joukossa FX . Algebran peruskursseissa I ja II esitellään muutama algebrallinen systeemi : ryhmä, rengas, kunta, yleinen vektoriavaruus ja sisätuloavaruus. Algebralliset systeemit ovat joukkoja, joissa on määritelty yksi tai useampi laskutoimitus ja jotka toteuttavat jotkin annetut aksioomat. Usein laskutoimitukset ovat binäärioperaatioita. Aloitamme määrittelemällä ryhmän (group), joka on yksinkertaisimpia ja samalla tärkeimpiä algebrallisia systeemejä.
Määritelmä 2.1.3 Olkoon G epätyhjä joukko. Paria (G, ∗) sanotaan ryhmäksi, jos ∗ on joukossa G määritelty binäärioperaatio, joka täyttää seuraavat ehdot: G1. On voimassa assosiatiivilaki
a ∗ (b ∗ c) = (a ∗ b) ∗ c
∀ a, b, c ∈ G.
G2. On sellainen alkio e ∈ G (neutraalialkio ), että
a∗e=e∗a=a 13
∀ a ∈ G.
LUKU 2. RYHMÄ
14
G3. Jokaista G:n alkiota a kohti on sellainen alkio a−1 ∈ G (a:n käänteisalkio ), että
a ∗ a−1 = a−1 ∗ a = e. Pari (G, ∗) on kommutatiivinen ryhmä eli Abelin ryhmä, jos se toteuttaa lisäksi seuraavan ehdon: G4. On voimassa kommutatiivilaki
a∗b=b∗a
∀ a, b ∈ G.
Kun (G, ∗) on ryhmä, sanotaan myös, että G on ryhmä (binäärioperaation ∗ suhteen).
Esimerkki 2.1.4 (Lukuryhmät) Joukot Z, Q, R ja C ovat Abelin ryhmiä yhteenlaskun suhteen. Neutraalialkiona on 0 ja luvun a käänteisalkiona vastaluku −a. Merkitään Q∗ = Q \ {0},
R∗ = R \ {0},
C∗ = C \ {0}.
Nämä lukujoukot ovat Abelin ryhmiä kertolaskun suhteen. Neutraalialkiona on 1 ja luvun a käänteisalkiona käänteisluku 1/a. Mikseivät Q, R ja C ole ryhmiä kertolaskun suhteen? Entä Z tai Z \ {0}?
Lause 2.1.5 Ryhmän G neutraalialkio on yksikäsitteinen, samoin kunkin alkion a käänteisalkio a−1 .
Todistus. Jos myös e0 on G:n neutraalialkio, niin G2 antaa e0 = e0 ∗ e = e. Jos alkiolla a on myös käänteisalkio a0 , niin a0 = a0 ∗ e = a0 ∗ (a ∗ a−1 ) = (a0 ∗ a) ∗ a−1 = e ∗ a−1 = a−1 . Tässä tarvittiin kaikki aksioomat G1G3 sekä oletus, että myös a0 on a:n käänteisalkio.
2
Ryhmäteoriassa ryhmän G laskutoimitus ∗ merkitään yleensä kertolaskuna:
a ∗ b = a · b = ab. Tällöin neutraalialkiota kutsutaan myös ykkösalkioksi ja merkitään e = 1 = 1G . Sanotaan, että (G, · ) on multiplikatiivinen ryhmä (tai että ryhmä G merkitään multiplikatiivisesti). Toisinaan ryhmäoperaatiolle käytetään yhteenlaskumerkintää,
a ∗ b = a + b. Tässä tapauksessa neutraalialkiota kutsutaan nolla-alkioksi ja merkitään e = 0 = 0G , ja alkion a käänteisalkiota a−1 kutsutaan vasta-alkioksi, merkitään −a. Tällöin sanotaan, että (G, +) on additiivinen ryhmä (tai että ryhmä G merkitään additiivisesti). Additiivista merkintätapaa käytetään usein, kun G on Abelin ryhmä, sekä tietenkin silloin, kun käsiteltävä laskutoimitus on todellinen yhteenlasku, kuten vaikkapa esimerkin 2.1.4 ryhmän (Z, +) tapauksessa.
LUKU 2. RYHMÄ
15
Mitkä esimerkin 2.1.4 ryhmistä tuntuu luonnolliselta merkitä additiivisesti ja mitkä multiplikatiivisesti? Ryhmän G alkioiden lukumäärää #G sanotaan G:n kertaluvuksi (order). (Tässä kurssissa joukon S alkioiden lukumäärälle käytetään merkintää #S ; muita tavallisia merkintöjä ovat esimerkiksi |S| tai card S .)
Esimerkki 2.1.6 Reaalisen vektoriavaruuden Rn vektorit muodostavat additiivisen Abelin ryhmän vektorien yhteenlaskun
(a1 , . . . , an ) + (b1 , . . . , bn ) = (a1 + b1 , . . . , an + bn ) suhteen, nolla-alkiona on nollavektori ja vektorin a = (a1 , . . . , an ) vasta-alkiona vastavektori −a.
Esimerkki 2.1.7 Matriisijoukko Mm×n (R) on additiivinen Abelin ryhmä, nolla-alkiona nollamatriisi ja matriisin A vasta-alkiona −A.
Esimerkki 2.1.8 Säännöllisten n×n-matriisien joukko GLn (R) = {A ∈ Mn (R) | det(A) 6= 0} on multiplikatiivinen ryhmä, ykkösalkiona identiteettimatriisi In ja matriisin A käänteisalkiona käänteismatriisi A−1 . Tätä ryhmää sanotaan yleiseksi lineaariseksi ryhmäksi (general linear group). Se ei ole kommutatiivinen, kun n > 1.
Esimerkki 2.1.9 (Jäännösluokkaryhmät) Jäännösluokat mod m muodostavat additiivisen Abelin ryhmän (Zm , +), kun yhteenlasku määritellään kuten oli jo esillä, siis a+b = a + b. Nollaalkiona on 0 ja alkion a vasta-alkiona −a. Tämä on esimerkki äärellisestä ryhmästä: joukkona Zm on {0, . . . , m−1 }, joten #Zm = m. Joukossa Zm määriteltiin myös kertolasku, a · b = ab, joka heti todetaan assosiatiiviseksi (sillä ( a · b ) · c = abc = a · ( b · c ) ) ja jolla on neutraalialkio 1 (sillä 1 · a = a = a · 1 ). Sen sijaan kaikilla jäännösluokilla ei ole käänteisalkiota; triviaalisti esimerkiksi 0:lla ei ole. Siksi Zm ei ole kertolaskun suhteen ryhmä. Tutkitaan, millä jäännösluokilla a on käänteisalkio x . Ehto a · x = x · a = 1, eli ax = 1, saadaan muotoon ax ≡ 1 (mod m). Lauseen 1.3.14 ja sitä edeltävän huomautuksen mukaan tällainen x on olemassa jos ja vain jos syt(a, m) = 1. Tämän ehdon toteuttavia jäännösluokkia a kutsutaan alkuluokiksi mod m ja niiden joukkoa merkitään Z∗m :llä; siis
Z∗m = { a ∈ Zm | syt(a, m) = 1} = { a ∈ Zm | on sellainen x ∈ Zm että a · x = 1 }.
(2.1)
(Huomaa, että vaikka edellinen muoto näyttääkin riippuvan jäännösluokkien edustajien valinnasta, niin jälkimmäisestä muodosta nähdään, ettei riippuvuus ole todellinen.)
LUKU 2. RYHMÄ
16
Alkuluokkien mod m joukko Z∗m on kertolaskun suhteen Abelin ryhmä, ykkösalkiona 1 ja alkion a käänteisalkiona sellainen x, että ax ≡ 1 (mod m). Tämän osoittamista varten pitäisi ensinnäkin todeta, että kertolasku antaa myös Z∗m :lle binäärioperaation, toisin sanoen että
a, b ∈ Z∗m
=⇒
a · b ∈ Z∗m ,
ja toiseksi pitäisi tarkistaa, että aksioomat G1G4 toteutuvat. Sivuutamme tässä tämän suoraviivaisen työn. Ryhmää (Z∗m , · ) sanotaan multiplikatiiviseksi jäännösluokkaryhmäksi mod m. Merkitään sen kertalukua #Z∗m = ϕ(m); tätä m:n funktiota sanotaan Eulerin ϕ-funktioksi. Esimerkiksi Z∗9 = { 1, 2, 4, 5, 7, 8 } ja #Z∗9 = ϕ(9) = 6. Kun p ∈ P, niin Z∗p = { 1, . . . , p−1 } ja ϕ(p) = p − 1.
Esimerkki 2.1.10 Olkoon X joukko ja olkoon FX kuvausten X → X joukko. Kuvaustulo ◦ on binäärioperaatio joukossa FX . Selvästikin se on assosiatiivinen, ja identiteettikuvaus idX : X → X toimii sen neutraalialkiona. Joukosta FX ei operaatiolla ◦ varustettuna kuitenkaan tule ryhmää, koska kaikilla kuvauksilla ei ole käänteisalkiota (jos #X > 1). Jotta kuvauksella f ∈ FX olisi käänteisalkio g ∈ FX , niin pitäisi olla f ◦ g = g ◦ f = idX , toisin sanoen g :n olisi oltava f :n käänteiskuvaus totutussa mielessä. Merkitään ∗ FX = {f : X → X | f on bijektio}. ∗ ∗ Helposti todetaan, että (FX , ◦) todellakin on ryhmä; neutraalialkio on idX ja alkion f ∈ FX käänteisalkio on sen käänteiskuvaus f −1 .
Esimerkki 2.1.11 (Symmetriset ryhmät) Äärellisen joukon Jn = {1, 2, . . . , n} permutaatioksi sanotaan bijektiivistä kuvausta α : Jn → Jn . Kun α(j) = kj ∀ j ∈ Jn , permutaatio α voidaan merkitä muodossa à ! 1 2 ... n α= , (2.2) k1 k2 . . . kn missä siis k1 , k2 , . . . , kn ovat luvut 1, 2, . . . , n jossakin järjestyksessä. (Vertaa lineaarialgebran kurssiin, jossa permutaatioiksi sanottiin jonoja (k1 , k2 , . . . , kn ).) Esimerkin 2.1.10 mukaan joukon Jn = {1, 2, . . . , n} permutaatiot muodostavat kuvaustulon suhteen ryhmän. Sitä sanotaan n-alkioisen joukon symmetriseksi ryhmäksi, merkitään
Sn = {α : Jn → Jn | α on bijektio}.
(2.3)
Ykkösalkiona on Jn :n identiteettikuvaus ja permutaation α käänteisalkiona käänteiskuvaus α−1 . Jos n > 2, Sn ei ole Abelin ryhmä. Tunnetusti #Sn = n! .
LUKU 2. RYHMÄ
17
Permutaatioiden merkintätapa (2.2) sopii hyvin kuvaustulon laskemiseen. Esimerkiksi ryhmässä S3 Ã !Ã ! Ã ! Ã !Ã ! Ã ! 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 = , = . 1 3 2 3 2 1 2 3 1 3 2 1 1 3 2 3 1 2 Huomaa, missä järjestyksessä tulokuvaukset muodostetaan; esimerkiksi vasemmanpuoleisessa tulossa alkiot kuvautuvat näin: 1 7→ 3 7→ 2, 2 7→ 2 7→ 3, 3 → 7 1 7→ 1.
Huomautus 2.1.12 Olkoon ∗ joukon G binäärioperaatio. Jos pari (G, ∗) täyttää ryhmän määritelmän postulaatin G1, sitä sanotaan puoliryhmäksi, ja jos lisäksi G:ssä on neutraalialkio, toisin sanoen myös G2 on voimassa, niin kyseessä on monoidi. Esimerkiksi Z ja 2Z ( = parillisten kokonaislukujen joukko) ovat kertolaskun suhteen puoliryhmiä, ja edellinen on jopa monoidi. Matriisien joukko Mn (R) on matriisikertolaskun suhteen monoidi. Esimerkissä 2.1.10 (FX , ◦) on monoidi. Puoliryhmien ja monoidien teoriaa ei käsitellä tässä kurssissa.
2.1.1 Perusominaisuuksia Seuraavassa ryhmä G merkitään multiplikatiivisesti, ellei toisin mainita. Koska a(bc) = (ab)c, kolmen ja useamman alkion tulo ryhmässä voidaan merkitä ilman sulkeita, esimerkiksi a(bc) = abc. Ryhmän alkion potenssi määritellään tavalliseen tapaan:
a0 = 1,
an = a · a · · · a
(n tekijää, n ≥ 1),
a−n = (a−1 )n
(n ≥ 1).
(2.4)
Määritelmästä saadaan helposti johdettua laskusäännöt
am an = am+n ,
(am )n = amn .
(2.5)
(Huomaa, että negatiivisten eksponenttien tapauksessa tarvitaan eri perustelu.) Sen sijaan sääntö (ab)n = an bn ei tietenkään päde, ellei G ole kommutatiivinen! Samalla päättelyllä, jolla lineaarialgebrassa todistettiin säännöllisille matriiseille (AB)−1 = B −1 A−1 , saadaan nyt yleisemmin
(ab)−1 = b−1 a−1
(2.6)
∀ a, b ∈ G.
Huomautus 2.1.13 Additiivista merkintätapaa käytettäessä potenssia an vastaa monikerta na. Muotoile kaavat (2.4)(2.6) tässä tapauksessa. Ã ! Ã 1 2 3 1 2 Esimerkki 2.1.14 Merkitään S3 :ssa τ = ja σ = 2 1 3 2 3 τ 2 = 1,
σ 3 = 1,
τ στ = σ 2
( = σ −1 ).
! 3 . Silloin 1 (2.7)
Voidaan todeta, että S3 = {1, τ, σ, στ, σ 2 , σ 2 τ }, esimerkiksi laskemalla ko. 6 kuvausta, jolloin ne osoittautuvat erisuuriksi, ja käyttämällä sitä, että #S3 = 3! = 6.
LUKU 2. RYHMÄ
18
Lause 2.1.15 Olkoon G ryhmä. Kun a, b ∈ G, niin (i) yhtälöllä ax = b on ryhmässä G yksikäsitteinen ratkaisu x = a−1 b; (ii) yhtälöllä xa = b on ryhmässä G yksikäsitteinen ratkaisu x = ba−1 .
Todistus. Kertomalla yhtälö ax = b vasemmalta a−1 :llä saadaan x = a−1 b. Kääntäen, x = a−1 b toteuttaa yhtälön ax = b, koska a(a−1 b) = b. Toinen yhtälö käsitellään samoin. 2 Lauseen nojalla (tai suoraan, kertomalla c−1 :llä vasemmalta tai oikealta) nähdään, että ryhmässä on voimassa supistamissäännöt
ac = bc
=⇒
a = b;
ca = cb
=⇒
a = b.
(2.8)
Esimerkki 2.1.16 Nyt esimerkissä 2.1.14 mainitut S3 :n alkiot 1, τ, σ, στ, σ 2 , σ 2 τ on helpompi osoittaa erisuuriksi. Jos esimerkiksi olisi στ = σ 2 τ , niin kertomalla vasemmalta σ −1 :llä ja oikealta τ −1 :llä saataisiin 1 = σ , siis ristiriita. Samoin käsitellään muutkin tapaukset. (Huomaa kuitenkin, että S3 :ssa voi silti olla voimassa epätriviaalin näköisiä yhtäsuuruuksia, esimerkiksi στ σ = τ στ .)
2.1.2 Ryhmätaulu Äärellinen ryhmä voidaan esittää kirjoittamalla sen ryhmätaulu, johon merkitään taulukon muodossa kaikki tulot; vaaka- ja pystyrivit nimetään alkioiden mukaan ja vaakarivin a ja pystyrivin b risteyskohtaan kirjoitetaan se alkio c, joka on tulo c = ab. (On syytä muistaa, etteivät ab ja ba yleensä ole sama alkio.) Vaakariville a tulee silloin kaikki tulot ax, x ∈ G. Lauseesta 2.1.15 seuraa, että jokainen vaakarivi sisältää ryhmän kaikki alkiot, kunkin tarkalleen kerran, samoin jokainen pystyrivi.
Esimerkki 2.1.17 Additiivinen ryhmä (Z2 , +) on joukkona Z2 = { 0, 1 }, ja siinä on voimassa 0 + 0 = 0 , 0 + 1 = 1 , 1 + 0 = 1 , 1 + 1 = 0. Sen ryhmätaulu on vasemmanpuoleisena (kirjoitetaan lyhyesti a eikä a, ja ymmärretään, että luvut tulkitaan mod 2). (Z2 , +)
(Z∗3 , · )
+
0 1
·
1
2
0 1
0 1 1 0
1 2
1 2
2 1
Multiplikatiivinen ryhmä (Z∗3 , · ) on joukkona Z∗3 = { 1, 2 }; sen ryhmätaulu on oikealla (luvut tulkitaan mod 3). (Ryhmätaulut näyttävät rakenteeltaan samanlaisilta. Se merkitsee, että nämä ryhmät ovat keskenään isomorset ; tämä käsite määritellään myöhemmin tarkasti. Itse asiassa edellä mainitun ominaisuuden vuoksi ei muunlaisia kahden alkion ryhmiä voi ollakaan.)
LUKU 2. RYHMÄ
19
Esimerkki 2.1.18 Millaisia kolmen alkion ryhmiä on? Jos G = {1, a, b} on ryhmä, niin sen ryhmätaulu voidaan täyttää yleisten ominaisuuksien nojalla: ensin käytetään sitä, että 1 on ykkösalkio ja sitten sitä, että jokaisella vaaka- ja pystyrivillä kukin alkio esiintyy tarkalleen kerran. Saadaan vasemmanpuoleinen ryhmätaulu.
·
1
a
b
+
0
1 2
1 a b
1 a a b b 1
b 1 a
0 1 2
0 1 2
1 2 2 0 0 1
Onko G todella ryhmä? Tämä voitaisiin selvittää tarkistamalla, toteutuvatko aksioomat G1 G3. Helpommalla päästään, jos löydetään ryhmä, jolla on tämä ryhmätaulu. Tässä tapauksessa riittää löytää jokin kolmen alkion ryhmä, sillä edellä päätellyn mukaisesti sen ryhmätaulu on välttämättä juuri tämä. Eräs sellainen ryhmä on (Z3 , +), ja sen ryhmätaulu on oikealla. Tulos: Kolmen alkion ryhmiä on olennaisesti vain yksi. (Tarkemmin ilmaistuna : kolmen alkion ryhmiä on isomoraa vaille vain yksi. Tämä ryhmä voidaan esittää muodossa G = {1, a, a2 }, missä a3 = 1. Tällaista ryhmää kutsutaan sykliseksi ; tarkka määritelmä esitetään myöhemmin.)
Esimerkki 2.1.19 Näytetään, että neljän alkion ryhmiä on kaksi (olennaisesti erilaisia eli epäisomorsia). Niiden ryhmätaulut ovat seuraavat: syklinen ryhmä C4 a
b
Kleinin neliryhmä
·
1
c
·
1
a
b
c
1 a b c
1 a b c a b c 1 b c 1 a c 1 a b
1 a b c
1 a b c a 1 c b b c 1 a c b a 1
Esimerkki 2.1.20 Olkoon S3 = {1, τ, σ, στ, σ 2 , σ 2 τ } kuten esimerkissä 2.1.14. Näytetään, miten ominaisuuksista (2.7) voidaan laskea tulot S3 :ssa. Kirjoitetaan S3 :n ryhmätaulua.
2.1.3 Ryhmien suora tulo Lause 2.1.21 Ryhmien G1 ja G2 karteesinen tulo G1 × G2 on ryhmä seuraavan binäärioperaation suhteen: (a1 , a2 )(b1 , b2 ) = (a1 b1 , a2 b2 )
(a1 , b1 ∈ G1 , a2 , b2 ∈ G2 ).
(2.9)
Todistus. Aksioomien G1G3 voimassaolo on helppo tarkistaa. Ykkösalkio on (1, 1), ja käänteis−1 alkiot saadaan kaavasta (a1 , a2 )−1 = (a−1 2 1 , a2 ). Lauseessa muodostettua ryhmää G1 × G2 sanotaan ryhmien G1 ja G2 suoraksi tuloksi (tai suoraksi summaksi käytettäessä additiivista merkintää).
LUKU 2. RYHMÄ
20
Huomaa, että kaavan (2.9) tulossa a1 b1 on kyse ryhmän G1 operaatiosta ja tulossa a2 b2 ryhmän G2 operaatiosta.
Esimerkki 2.1.22 Kun G1 = G2 = R (additiivinen ryhmä), niin suora tulo on tuttu ryhmä R × R = R2 , jossa (u1 , u2 ) + (v1 , v2 ) = (u1 + v1 , u2 + v2 ); katso esimerkki 2.1.6. Suora tulo (ja summa) määritellään vastaavalla tavalla useammankin kuin kahden ryhmän tapauksessa.
2.2 Aliryhmä Määritelmä 2.2.1 Olkoon G ryhmä. Jos H ⊆ G ja jos H on ryhmä G:n binäärioperaation G × G → G restriktion suhteen, sanotaan, että H on G:n aliryhmä. Merkintä: H ≤ G. Kirjoitamme määritelmän konkreettisempaan muotoon.
Lause 2.2.2 Kun G on ryhmä ja H sen osajoukko, niin H on G:n aliryhmä tarkalleen silloin kun seuraavat ehdot toteutuvat: AR1.
a, b ∈ H
AR2.
1G ∈ H ;
AR3.
a∈H
=⇒
=⇒
ab ∈ H ;
a−1 ∈ H .
Todistus. Oletetaan ensin, että H ≤ G. Silloin G:n binäärioperaatio G × G → G antaa restriktiona binäärioperaation (kuvauksen) H × H → H ; siis AR1 on voimassa. Osoitetaan että G:n ja H :n ykkösalkiot 1G ja 1H ovat sama alkio, jolloin AR2 seuraa. Yhtäsuuruus 1H 1H = 1H on voimassa, kun tulo lasketaan ryhmässä H , siis myös kun tulo lasketaan ryhmässä G (tulo on sama!). Näin ollen 1H toteuttaa G:ssä yhtälön x2 = x. Mutta ainoa G:n alkio, joka toteuttaa tämän yhtälön, on x = 1G (kerrotaan yhtälö x−1 :llä). Siis 1H = 1G . Kun a ∈ H ja b on a:n käänteisalkio H :ssa, niin ab = ba = 1H = 1G , joten b on a:n käänteisalkio myös G:ssä. Koska käänteisalkio on yksikäsitteinen, niin a−1 = b ∈ H . Oletetaan nyt, että ehdot AR1AR3 ovat voimassa. Ehdon AR1 nojalla G:n binäärioperaatio antaa restriktiona binäärioperaation H :lle. Assosiatiivilaki on voimassa H :ssa, koska se on voimassa koko G:ssä. Ehdon AR2 mukaan H :ssa on ykkösalkio, nimittäin 1G , ja ehdon AR3 mukaan jokaisella H :n alkiolla on käänteisalkio H :ssa, nimittäin sama kuin käänteisalkio G:ssä. 2
Esimerkki 2.2.3 Jokaisessa ryhmässä G on ns. triviaalit aliryhmät {1} ja G. Jos H ≤ G ja H 6= G, sanotaan, että H on G:n aito aliryhmä, merkitään H < G.
Esimerkki 2.2.4 Olkoon G = {1, a, b, c} Kleinin neliryhmä. Osajoukko H = {1, a} on sen aliryhmä.
LUKU 2. RYHMÄ
21
Esimerkki 2.2.5 Z < Q < R < C (additiiviset ryhmät) ja Q∗ < R∗ < C∗ (multiplikatiiviset ryhmät). Lauseen 2.2.2 ehtoja voi yksinkertaistaa:
Lause 2.2.6 (Aliryhmäkriteeri) Olkoon G ryhmä ja H ⊆ G. (i) Jos H 6= ∅ ja ab−1 ∈ H ∀ a, b ∈ H , niin H on G:n aliryhmä. (ii) Olkoon G äärellinen. Jos H 6= ∅ ja ab ∈ H ∀ a, b ∈ H , niin H on G:n aliryhmä.
Todistus. (i) Valitsemalla jokin c ∈ H (6= ∅) saadaan 1G = cc−1 ∈ H oletuksen (i) nojalla. Kun a, b ∈ H , niin b−1 = 1G b−1 ∈ H , joten ab = a(b−1 )−1 ∈ H . Ehdot AR1AR3 ovat siis voimassa, toisin sanoen H ≤ G. (ii) Oletetaan nyt, että G on äärellinen, H 6= ∅ ja ab ∈ H ∀ a, b ∈ H . Osoitetaan, että kun b ∈ H , niin b−1 ∈ H ; silloin seuraa, että ab−1 ∈ H ∀ a, b ∈ H , ja väite saadaan (i)-kohdasta. Kun b ∈ H , niin b, b2 , b3 , . . . ∈ H . Koska G on äärellinen, niin jotkin näistä ovat samoja; olkoon bk = bj , missä k > j > 0. Kertomalla yhtälö bk = bj puolittain b−j :llä saadaan bk−j = 1G , ja kertomalla vielä b−1 :llä saadaan b−1 = bk−j−1 ∈ H . 2
Seuraus 2.2.7 Jos H ≤ G ja K ≤ G, niin H ∩ K ≤ G. Todistus. Koska 1 ∈ H ∩ K , leikkaus ei ole tyhjä. Jos a, b ∈ H ∩ K , niin ab−1 ∈ H ja ab−1 ∈ K , sillä H ja K ovat aliryhmiä. Siis ab−1 ∈ H ∩ K . 2
Esimerkki 2.2.8 Tapaus G = Q∗ ja H = Z \ {0} osoittaa, ettei (ii)-kohdan äärellisyysoletusta voi ilman muuta jättää pois.
Esimerkki 2.2.9 Osoitetaan, että seuraavat ryhmien G osajoukot H ovat aliryhmiä: a) G = GLn (R), ∗ b) G = FX ,
∗ H = {f ∈ FX | f (x0 ) = x0 }
c) G = Z (addit.), d) G = C∗ ,
H = SLn (R) = {A ∈ GLn (R) | det(A) = 1} (special linear group ); (x0 ∈ X kiinnitetty piste);
H = mZ = {mk | k ∈ Z}.
H = {z ∈ C | |z| = 1}.
Esimerkki 2.2.10 Olkoon G = GLn (R) ja H = { (aij ) ∈ GLn (R) | aij ∈ Z ∀ i, j }. Onko H GLn (R):n aliryhmä? Entä H ∩ SLn (R)?
Esimerkki 2.2.11 Tunnistetaan S3 :sta joitakin aliryhmiä. Symmetristen ryhmien Sn aliryhmiä kutsutaan permutaatioryhmiksi.
Esimerkki 2.2.12 Ryhmän G alkiot a ja b kommutoivat, jos ab = ba. Osoitetaan, että ne G:n alkiot, jotka kommutoivat kaikkien G:n alkioiden kanssa, muodostavat aliryhmän. Sitä sanotaan G:n keskukseksi, merkitään usein Z(G):llä.
LUKU 2. RYHMÄ
22
2.2.1 Osajoukon generoima aliryhmä Olkoon G ryhmä ja S jokin sen osajoukko. Tarkastellaan kaikkien niiden G:n aliryhmien H parvea, jotka sisältävät S :n. Parvessa on ainakin yksi jäsen, nimittäin G. Otetaan niiden leikkaukselle käyttöön merkintä hSi; siis \ hSi = H. (2.10) S⊆H≤G
Samalla keinolla, jota käytettiin seurauksen 2.2.7 todistuksessa, nähdään, että hSi on G:n aliryhmä. Sanotaan, että hSi on joukon S generoima G:n aliryhmä. Joukon S alkioita sanotaan aliryhmän hSi generoijiksi. Jos generoijajoukko S on äärellinen, sanotaan, että hSi on äärellisesti generoitu ; kun S = {a1 , . . . , ak }, käytetään merkintää
hSi = ha1 , . . . , ak i.
(2.11)
Määritelmästä seuraa, että hSi on suppein S :n sisältävä G:n aliryhmä, toisin sanoen että
S⊆H≤G
=⇒
hSi ≤ H.
(2.12)
Esimerkiksi h∅i = {1} ja h1i = {1}. Jos H ≤ G, niin hHi = H .
Lause 2.2.13 Ryhmän G osajoukon S generoima aliryhmä hSi koostuu kaikista tuloista, jotka on muodostettu S :n alkioista ja niiden käänteisalkioista (mukaan luettuna tyhjä tulo = 1), toisin sanoen hSi = { a1 a2 · · · am | ai tai a−1 ∈ S kun i = 1, . . . , m; m ≥ 0}. i
(2.13)
Todistus. Merkitään H1 :llä yhtälön (2.13) oikean puolen joukkoa. Aliryhmäkriteeristä nähdään, että H1 on G:n aliryhmä. Lisäksi S ⊆ H1 , sillä H1 :ssä ovat mukana yhden alkion tulot a1 (a1 ∈ S ). Näin ollen H1 on eräs leikkauksessa (2.10) esiintyvä aliryhmä. Siis hSi ⊆ H1 . Toisaalta jokainen leikkauksessa (2.10) esiintyvä H sisältää H1 :n, koska H sisältää kaikki S :n alkiot ja siis aliryhmänä se sisältää myös kaikki tulot a1 a2 · · · am (ai ∈ S tai a−1 ∈ S ∀ i). Näin i ollen H1 sisältyy leikkaukseen (2.10), siis H1 ⊆ hSi. Nämä sisältymiset yhdessä antavat hSi = H1 . 2
Huomautus 2.2.14 Jos G on äärellinen ryhmä, niin kaava (2.13) saa yksinkertaisemman muodon
hSi = { a1 a2 · · · am | ai ∈ S ∀ i; m ≥ 0}.
(2.14)
Nimittäin lauseen 2.2.6 todistuksessa nähtiin, että äärellisen ryhmän tapauksessa alkion a käänteisalkio on aina jokin a:n positiivinen potenssi, a−1 = an .
Esimerkki 2.2.15 Esimerkin 2.1.19 syklinen ryhmä C4 = {1, a, b, c} on alkion a generoima, C4 = hai, sillä b = a2 ja c = a3 . Niin ikään hci = C4 , mutta hbi = {1, b}.
LUKU 2. RYHMÄ
23
Esimerkki 2.2.16 Kleinin neliryhmässä G (esimerkki 2.1.19) yhden alkion 6= 1 generoimat aliryhmät ovat
hai = {1, a},
hbi = {1, b},
hci = {1, c},
koska a2 = b2 = c2 = 1. Toisaalta G = ha, bi, sillä ab = c.
Esimerkki 2.2.17 Ääretön ryhmä Z on äärellisesti generoitu: Z = {n · 1 | n ∈ Z} = h1i. Esimerkki 2.2.18 Ryhmän R∗ osajoukko P generoi aliryhmän Q+ , joka koostuu kaikista positiivista rationaaliluvuista.
2.3 Syklinen ryhmä Ryhmää G sanotaan sykliseksi, jos se on yhden alkion generoima, toisin sanoen jos on sellainen a ∈ G, että G = hai.
Lause 2.3.1 Olkoon G syklinen ryhmä, G = hci. (i) Jos G on äärellinen, niin cn = 1 jollakin luvulla n > 0 ja
G = {1, c, c2 , . . . , cn−1 }.
(2.15)
Jos n > 0 on pienin, jolla cn = 1, niin alkiot 1, c, c2 , . . . , cn−1 ovat erisuuria, ja siis #G = n. (ii) Jos G on ääretön, niin
G = {. . . , c−2 , c−1 , 1, c, c2 , . . .}
(2.16)
ja kaikki alkiot cm ovat erisuuria (m ∈ Z). Todistus. Lauseen 2.2.13 nojalla G = {. . . , c−2 , c−1 , 1, c, c2 , . . .} = {cm | m ∈ Z}. Oletetaan ensin että G on äärellinen. Silloin jotkin alkiot cm ovat samoja; olkoot k ja j jotkin sellaiset, että ck = cj ja k > j . Seuraa ck−j = 1 ja k − j > 0. Olkoon n > 0 sellainen, että cn = 1. (Tällaisia on siis olemassa.) Jakoalgoritmin mukaan jokainen m ∈ Z voidaan kirjoittaa muotoon m = qn + r, missä 0 ≤ r < n, ja saadaan
cm = cqn+r = (cn )q cr = 1q cr = cr . Näin ollen G = {1, c, c2 , . . . , cn−1 }. Jos n > 0 on pienin, jolla cn = 1, niin alkiot 1, c, c2 , . . . , cn−1 ovat erisuuria. Muutenhan löydettäisiin sellaiset k, j ∈ {0, . . . , n − 1} että k > j ja ck−j = 1, mikä olisi ristiriidassa n:n minimaalisuuden kanssa. Olkoon nyt G ääretön. Silloin kaikki alkiot cm (m ∈ Z) ovat erisuuria, sillä muuten seuraisi kuten edellä, että G on äärellinen. 2
LUKU 2. RYHMÄ
24
Käytämme n alkion sykliselle ryhmälle merkintää Cn ja äärettömälle sykliselle ryhmälle merkintää C∞ . Siis jos c on Cn :n generoija, niin Cn = hci = {1, c, c2 , . . . , cn−1 }, missä cn = 1 ja alkiot 1, c, c2 , . . . , cn−1 ovat erisuuria. (Myöhemmin, kun olemme määritelleet ryhmien isomorakäsitteen, voimme sanoa, että kaikki samaa kertalukua n olevat sykliset ryhmät ovat keskenään isomorset ja samoin kaikki äärettömät sykliset ryhmät ovat keskenään isomorset. Tässä vaiheessa tyydymme toteamaan, että tässä isomorsiksi mainitut ryhmät ovat oleellisesti samanlaiset huomaamalla, että niiden ryhmätaulut ovat rakenteeltaan samanlaiset.)
Esimerkki 2.3.2 Kirjoitetaan ryhmän Cn ryhmätaulu. Esimerkki 2.3.3 Todetaan, että (Z, +) on ääretön syklinen ryhmä. Esimerkki 2.3.4 Kun m > 0, niin (Zm , +) on syklinen kertalukua m oleva ryhmä, Zm = { 0 , 1 , 2 , . . . , k , . . . , m−1 } = { m · 1 , 1 · 1 , 2 · 1 , . . . , k · 1 , . . . , (m − 1) · 1 } = h 1 i.
Esimerkki 2.3.5 Näytetään, että Z∗5 = h 2 i. Mistä syklisen ryhmän nimitys johtuu? Jos Cn = hci, niin lähtemällä jostakin alkiosta c ja kertomalla sitä c:llä yhä uudestaan saadaan jono cm , cm+1 , cm+2 , . . . , jossa samat alkiot cm , . . . , cm+n−1 alkavat toistua ja muodostavat siis syklin. Tarkemmin: m
ck = ch
⇐⇒
k≡h
(mod n).
(2.17)
Syklisyys näkyy myös Cn :n ryhmätaulun rivejä verrattaessa. (Ääretöntä syklistä ryhmää voi ajatella rajatapauksena, jossa on vain yksi äärettömän pitkä sykli.)
2.4 Sivuluokat Määritelmä 2.4.1 Olkoon H ≤ G ja olkoon a kiinnitetty G:n alkio. Osajoukkoa aH = {ah | h ∈ H} sanotaan aliryhmän H vasemmaksi sivuluokaksi G:ssä (left coset). Vastaavasti
Ha = {ha | h ∈ H} on H :n oikea sivuluokka G:ssä (right coset). (Additiivista merkintää käytettäessä sivuluokat kirjoitetaan a + H ja H + a.) Seuraavassa käsitellään lähinnä vain vasempia sivuluokkia; oikeat sivuluokat käyttäytyvät samalla tavalla. Jos G on Abelin ryhmä, niin aH = Ha ∀ a ∈ G ja määreet vasen ja oikea voidaan jättää pois.
LUKU 2. RYHMÄ
25
Siis jokainen G:n alkio a määrää yhden vasemman sivuluokan aH . Kaksi tällaista ovat joko sama osajoukko tai ne ovat alkiovieraat; nimittäin helposti päätellään, että
aH ∩ bH 6= ∅
=⇒
a ∈ bH, b ∈ aH
=⇒
aH ⊆ bH, bH ⊆ aH
=⇒
aH = bH.
Toisin sanoen H :n vasemmat sivuluokat muodostavat G:n partition
[
G=
aH,
a∈D
missä a käy jonkin vasempien sivuluokkien edustajiston D. Huomaa, että H on itsekin eräs sivuluokka, sillä H = 1H , ja että aina a ∈ aH , sillä a = a1. Seuraava huomio sivuluokkien yhtäsuuruudesta on usein hyödyllinen:
aH = bH
⇐⇒
b ∈ aH
⇐⇒
a−1 b ∈ H.
(2.18)
Esimerkki 2.4.2 Syklisen ryhmän C6 = {1, c, c2 , . . . , c5 } aliryhmän H = hc3 i = {1, c3 } sivuluokat ovat
1H = {1, c3 },
cH = {c, c4 },
c2 H = {c2 , c5 }.
Eräs sivuluokkien edustajisto on siis {1, c, c2 }.
Esimerkki 2.4.3 Additiivisen ryhmän G = Z aliryhmän H = mZ sivuluokat ovat samat kuin jäännösluokat mod m, siis mZ, 1 + mZ, 2 + mZ, . . . , (m − 1) + mZ. Additiivisen Abelin ryhmän tapauksessa aliryhmän sivuluokista käytetään usein yleisestikin nimitystä jäännösluokka.
Esimerkki 2.4.4 Havainnollistetaan ryhmän R2 aliryhmää H = h(1, 0), (0, 1)i = {(a, b) | a, b ∈ Z} ja sen sivuluokkaa ( 41 , 14 ) + H kuviolla.
Esimerkki 2.4.5 Etsitään C∗ :n aliryhmän H = {z ∈ C | |z| = 1} sivuluokille jokin edustajisto. Esimerkki 2.4.6 Olkoon S3 = {1, τ, σ, στ, σ 2 , σ 2 τ } esimerkin 2.1.14 merkinnöin. a) Aliryhmän H = hτ i vasemmat sivuluokat ovat
1H = H,
σH = {σ, στ },
σ 2 H = {σ 2 , σ 2 τ };
sivuluokista τ H , στ H ja σ 2 τ H tulee uudestaan samat kolme. Oikeat sivuluokat ovat
H1 = H,
Hσ = {σ, τ σ} = {σ, σ 2 τ },
Hσ 2 = {σ 2 , τ σ 2 } = {σ 2 , στ }.
b) Määritetään aliryhmän hσi oikeat ja vasemmat sivuluokat. Ryhmän aliryhmän vasempien sivuluokkien lukumäärää sanotaan H :n indeksiksi G:ssä ja merkitään [G : H]. Indeksi voi tietysti olla myös ääretön.
LUKU 2. RYHMÄ
26
Esimerkki 2.4.7 Esimerkissä 2.4.2 on [C6 : hc3 i] = 3. Esimerkissä 2.4.3 on [Z : mZ] = m. Indeksi [Q : Z] on ∞.
Huomautus 2.4.8 On helppo osoittaa, että kuvaus aH 7→ Ha−1 antaa bijektion vasempien sivuluokkien joukolta oikeiden sivuluokkien joukolle. Siis, kun indeksi [G : H] on äärellinen, se ilmoittaa myös oikeiden sivuluokkien lukumäärän.
Lause 2.4.9 (Lagrange) Jos G on äärellinen ryhmä ja H ≤ G, niin [G : H] =
#G . #H
Siis äärellisen ryhmän G aliryhmän kertaluku jakaa G:n kertaluvun. Todistus. Jokaisessa sivuluokassa aH on yhtä monta alkiota kuin H :ssa, sillä kuvaus H → aH , h 7→ ah, on bijektio, käänteiskuvauksena aH → H , k 7→ a−1 k . Saadaan siis X X #G = #(aH) = #H = [G : H] · #H. a∈D
Toinen väite seuraa siitä, että [G : H] ∈ Z.
a∈D
2
Ryhmän G alkion a kertaluvuksi ord(a) sanotaan sen generoiman aliryhmän kertalukua; siis ord(a) = #hai. Voi tietenkin olla ord(a) = ∞.
Seuraus 2.4.10 Äärellisen ryhmän G alkioiden kertaluvut jakavat G:n kertaluvun. Todistus. Kun a ∈ G, niin ord(a) = #hai | #G.
2
Seuraus 2.4.11 Jos G on äärellinen ryhmä ja g = #G, niin ag = 1 kaikilla G:n alkioilla a. Todistus. Kun h = ord(a), niin ah = 1. Seurauksen 2.4.10 mukaan h | g , siis g = th, missä t ∈ Z. Nyt ag = ath = (ah )t = 1. 2
Seuraus 2.4.12 Jos ryhmän G kertaluku on alkuluku p, niin G on syklinen. Todistus. Valitaan a ∈ G, a 6= 1. Koska ord(a) | p ja ord(a) > 1, niin ord(a) = p. Siis G = hai. 2
Esimerkki 2.4.13 Olkoon ryhmällä G aliryhmät H ja K . Oletetaan, että syt(#H, #K) = 1. Mikä on H ∩ K ? Lagrangen lauseen mukaan #(H ∩ K) jakaa sekä H :n että K :n kertaluvun. Siis H ∩ K = {1}.
Esimerkki 2.4.14 Olkoon G ryhmä ja olkoon #G = 6. Perustellaan seuraavat: a) Jos G:ssä on alkio a, jonka kertaluku on > 3, niin G on syklinen. b) Jos G:ssä on sellaiset alkiot a ja b, että ord(a) = 3 ja ord(b) = 2, niin G = ha, bi.
LUKU 2. RYHMÄ
27
Esimerkki 2.4.15 Lasketaan ryhmän Z∗13 alkioiden kertaluvut. Esimerkki 2.4.16 Ryhmään Z∗m sovellettuna seuraus 2.4.11 merkitsee, että a ϕ(m) = 1 kun a ∈ Z∗m . Kirjoittamalla tämä kongruenssimuotoon saadaan lukuteoriassa tärkeä Eulerin lause : aϕ(m) ≡ 1 (mod m)
kun syt(a, m) = 1.
(2.19)
Erikoistapauksena tästä seuraa Fermat'n (pikku) lause : Jos p ∈ P, niin
ap−1 ≡ 1
kun p - a.
(mod p)
(2.20)
2.4.1 Normaali aliryhmä. Tekijäryhmä Ryhmiäkin tutkittaessa on hyödyllistä jakaa kohde pienempiin osiin. Annetun ryhmän G sisältä voi löytyä epätriviaali aliryhmä H , joka on ehkä helpompi tutkia tai jonka ominaisuuksista on muuten hyötyä. Jo sellaisen aliryhmän olemassaolo kertoo paljon sen ulkopuolellekin jäävän osan S rakenteesta: G = a∈D aH (partitio), missä kunkin aH :n alkiot ovat kääntäen yksikäsitteisessä vastaavuudessa H :n alkioiden kanssa. Tässä pykälässä tarkastelemme, milloin sivuluokkien joukosta { aH | a ∈ D} tulee uusi ryhmä; sitä kutsutaan silloin tekijäryhmäksi G/H . Tapauksissa, joissa tämä onnistuu, G tulee jaetuksi kahdeksi pienemmäksi ryhmäksi, H ja G/H .
Määritelmä 2.4.17 Ryhmän G aliryhmää N sanotaan normaaliksi, jos sen vasemmat ja oikeat sivuluokat ovat samoja joukkoja, toisin sanoen jos
aN = N a
∀ a ∈ G.
Kun N on normaali aliryhmä, merkitään N £ G, ja jos N on lisäksi aito, merkitään N ¢ G.
Esimerkki 2.4.18 Jos G on Abelin ryhmä, niin jokainen aliryhmä on normaali. Esimerkki 2.4.19 Triviaalit aliryhmät {1} ja G ovat normaaleja. Esimerkki 2.4.20 Ryhmän S3 aliryhmä hτ i ei ole normaali (katso esimerkkejä 2.1.14 ja 2.4.6). Esimerkki 2.4.21 Osoitetaan, että jos [G : H] = 2, niin H £ G. Esimerkki 2.4.22 Ryhmän keskus on normaali aliryhmä (katso esimerkki 2.2.12). Lause 2.4.23 (Aliryhmän normaalisuuskriteeri) Olkoon N ≤ G. Silloin N £G
⇐⇒
ana−1 ∈ N
∀ a ∈ G, n ∈ N.
(2.21)
LUKU 2. RYHMÄ
28
Todistus. Oletetaan ensin, että N £ G. Kun a ∈ G ja n ∈ N , niin ehdosta aN = N a seuraa an = n1 a jollain N :n alkiolla n1 , joten ana−1 = n1 ∈ N . Oletetaan kääntäen, että ekvivalenssin (2.21) oikean puolen ehto on voimassa. Olkoon a ∈ G. On osoitettava, että aN = N a. Olkoon n ∈ N . Merkitään n1 = ana−1 . Oletuksen mukaan n1 ∈ N . Nyt an = n1 a ∈ N a. Täten aN ⊆ N a. Soveltamalla oletusta alkioihin a−1 ja n saadaan n2 = a−1 na ∈ N , siis na = an2 ∈ aN . Näin ollen N a ⊆ aN . Siispä N a = aN . 2
Esimerkki 2.4.24 Näytetään, että matriisiryhmän GLn (R) aliryhmistä SLn (R) = {A ∈ GLn (R) | det(A) = 1}, H = {A ∈ GLn (R) | A on lävistäjämatriisi} edellinen on normaali mutta jälkimmäinen ei ole (kun n > 1).
Esimerkki 2.4.25 Tarkastellaan taas ryhmää S3 esimerkin 2.1.14 merkinnöin. a) Esimerkissä 2.4.6 todettiin, ettei aliryhmä hτ i ole normaali. Sama saadaan normaalisuuskriteeristä huomaamalla, että στ σ −1 = τ σ ∈ / hτ i. b) Sen sijaan S3 :n aliryhmä K = hσi on normaali. Tämän toteamiseksi normaalisuuskriteerillä pitää osoittaa, että aba−1 ∈ K , kun a ∈ S3 ja b ∈ K ; esimerkiksi (στ )σ(στ )−1 = σ 2 ∈ S3 . (Tutkittavia tuloja on periaatteessa (#S3 )(#K) = 6 · 3 = 18 kappaletta. Tekemällä ensin hiukan teoreettista pohjustustyötä näkee, että riittääkin käydä läpi ryhmien S3 ja K generoijat. Koska S3 = hσ, τ i ja K = hσi, laskettavaksi jäisi vain σσσ −1 ja τ στ −1 . Miten ko. yleinen päätelmä suoritetaan?) (On vieläkin nopeampi keino todeta, että hσi £ S3 . Mikä?)
Huomautus 2.4.26 Oletetaan, että a, x ∈ G. Ryhmän alkiota y = axa−1 sanotaan alkion x konjugaattialkioksi ; sanotaan myös, että y on saatu x:stä konjugoimalla a:lla. Relaatio x∼y ⇐⇒ y = axa−1 jollain G:n alkiolla a
(2.22)
on G:n ekvivalenssirelaatio (vrt. matriisien similaarisuus). Sen ekvivalenssiluokkia
[x] = {axa−1 | a ∈ G} sanotaan ryhmän G konjugaattiluokiksi. Aliryhmän normaalisuuskriteeri (lause 2.4.23) voidaankin ilmaista myös seuraavasti: Ryhmän G aliryhmä N on normaali jos ja vain jos N on suljettu kaikilla G:n alkioilla konjugoinnin suhteen (eli jos ja vain jos N koostuu G:n kokonaisista konjugaattiluokista ). Kun N £ G, niin vasemmat sivuluokat ovat samat kuin oikeat sivuluokat. Niiden joukolle käytetään merkintää G/N ; siis
G/N = {aN | a ∈ G} = {aN | a ∈ D}, missä D on jokin sivuluokkien edustajisto.
(2.23)
LUKU 2. RYHMÄ
29
Lause 2.4.27 Olkoon N £ G. Joukko G/N on ryhmä seuraavasti määritellyn binäärioperaation suhteen: aN · bN = abN
(2.24)
(a, b ∈ G).
Todistus. Osoitetaan ensin, että binäärioperaatio on hyvin määritelty. Oletetaan, että aN = a0 N ja bN = b0 N ; pitää osoittaa, että abN = a0 b0 N . Nyt a ∈ a0 N ja b ∈ b0 N , siis a = a0 n1 ja b = b0 n2 , missä n1 , n2 ∈ N . Seuraa ab = a0 n1 b0 n2 . Koska aliryhmä N on normaali, niin N b0 = b0 N , joten n1 b0 = b0 n3 jollain N :n alkiolla n3 . Saadaan ab = a0 b0 n3 n2 ∈ a0 b0 N. Tämä osoittaa, että abN = a0 b0 N . Aksioomat G1G3 saadaan nyt G:n vastaavista ominaisuuksista: Assosiatiivisuus seuraa G:n tulon assosiatiivisuudesta, sillä
(aN · bN )cN = abN · cN = (ab)cN = a(bc)N = aN · bcN = aN (bN · cN ). Neutraalialkiona toimii N = 1N , sillä
N · aN = 1N · aN = 1aN = aN = a1N = aN · 1N = aN · N. Sivuluokalla aN on käänteisalkio a−1 N , sillä
aN · a−1 N = aa−1 N = N = a−1 aN = a−1 N · aN.
2
Määritelmä 2.4.28 Ryhmää G/N sanotaan G:n tekijäryhmäksi N :n suhteen. Huomaa, että #(G/N ) = [G : N ]. Jos G on äärellinen, niin Lagrangen lauseen mukaan #(G/N ) = #G/#N . Jos G on Abelin ryhmä ja H ≤ G (siis H £ G), niin myös G/H on Abelin ryhmä. Syklisen ryhmän tekijäryhmät ovat syklisiä: Jos G = hci ja H ≤ G, niin kaikki G:n alkiot ovat muotoa cm , joten kaikki (G/H):n alkiot ovat muotoa cm H = (cH)m ; siis G/H = hcHi.
Esimerkki 2.4.29 Lasketaan ryhmän C6 = hci tekijäryhmä aliryhmän H = hc3 i suhteen. Esimerkki 2.4.30 Kirjoitetaan tekijäryhmän S3 /hσi ryhmätaulu (merkinnät kuten esimerkissä 2.1.14). Verrataan edelliseen esimerkkiin. Esimerkki 2.4.31 Muodostetaan tekijäryhmän Z∗21 /h 4 i ryhmätaulu. Esimerkki 2.4.32 Ryhmän Z tekijäryhmä aliryhmän hmi = mZ suhteen on joukkona Z/mZ = {k + mZ | k ∈ Z} = {k + mZ | k = 0, 1, . . . , m − 1}, ja sen binäärioperaatio on
(k + mZ) + (h + mZ) = (k + h) + mZ.
LUKU 2. RYHMÄ
30
Kun merkitään sivuluokkia eli jäännösluokkia totuttuun tapaan, siis k + mZ = k , niin
Z/mZ = { 0, . . . , m−1 },
k + h = k + h.
Kyseessä onkin vanha tuttu, jäännösluokkaryhmä Zm . Siis Zm = Z/mZ.
Esimerkki 2.4.33 Millainen on tekijäryhmä GLn (R)/SLn (R)? Huomautus 2.4.34 Toinen tapa tarkastella binäärioperaatiota (2.24) on määritellä G:n osajoukoille operaatio X · Y = {xy | x ∈ X, y ∈ Y } (X, Y ⊆ G). Jos N ≤ G, niin tämän määritelmän S mukainen aN · bN on joidenkin sivuluokkien unioni i ci N , ja aliryhmän N normaalisuudesta seuraa, että unioni koostuu vain yhdestä sivuluokasta ( = abN ).
Huomautus 2.4.35 Jos N ≤ G ei ole normaali aliryhmä, niin (2.24) ei anna edes hyvinmääriteltyä binäärioperaatiota sivuluokkien joukossa. Tämän voi perustella esimerkiksi jäljempänä todistettavan lauseen 2.5.11 avulla.
2.5 Ryhmähomomorsmit Määritelmä 2.5.1 Olkoot (G, · ) ja (G0 , ∗) ryhmiä. Kuvausta f : G → G0 sanotaan (ryhmä)homomorsmiksi, jos se toteuttaa homomoraehdon f (a · b) = f (a) ∗ f (b)
∀ a, b ∈ G.
(2.25)
Kun kummankin ryhmän binäärioperaatiolle käytetään kertolaskumerkintää, niin homomoraehto saa muodon f (ab) = f (a)f (b) ∀ a, b ∈ G. (2.26)
Esimerkki 2.5.2 a) Identiteettikuvaus idG : G → G on homomorsmi. b) Samoin on ns. triviaali homomorsmi f : G → G0 , f (a) = 1G0 ∀ a ∈ G. c) Jos H ≤ G, niin sisältymiskuvaus eli inkluusio i : H → G, i(h) = h ∀ h ∈ H , on homomorsmi.
Esimerkki 2.5.3 Kuvaus f : Z → Zm , f (a) = a ∀ a ∈ Z, on ryhmähomomorsmi, koska aina a + b = a + b. Tässä esimerkissä oli Zm = Z/mZ ja tarkasteltava kuvaus oli Z → Z/mZ, a 7→ a + mZ. Yleisemmin: Kun N on ryhmän G normaali aliryhmä, niin tekijäryhmän G/N binäärioperaation määritelmästä aN · bN = abN nähdään, että kuvaus G → G/N , a 7→ aN , on ryhmähomomorsmi. (Voi ajatella näinkin päin: G/N :n binäärioperaatio määriteltiin juuri sillä tavalla, että luonnollisesta kuvauksesta G → G/N , a 7→ aN , tuli ryhmähomomorsmi.)
LUKU 2. RYHMÄ
31
Määritelmä 2.5.4 Olkoon N £ G. Homomorsmia π : G → G/N , π(a) = aN , sanotaan kanoniseksi homomorsmiksi G → G/N (tai kanoniseksi projektioksi, usein myös luonnolliseksi homomorsmiksi ).
Esimerkki 2.5.5 Kuvaus f : R∗ → R∗ , f (x) = x2 , on ryhmähomomorsmi, koska f (xy) = (xy)2 = x2 y 2 = f (x)f (y) ∀ x, y ∈ R.
Esimerkki 2.5.6 Merkitään R+ :lla positiivisten reaalilukujen muodostamaa multiplikatiivista ryhmää. Kuvaus R+ → R, f (x) = ln x, on homomorsmi, koska f (xy) = ln(xy) = ln x + ln y = f (x) + f (y). Vaikka ryhmähomomorsmilta ei määritelmässä vaaditakaan muuta kuin kertolaskua koskeva ehto, niin siitä seuraa lisäksi, että ykkösalkio kuvautuu ykkösalkioksi ja käänteisalkiot kuvautuvat käänteisalkioiksi:
Lause 2.5.7 Kun f : G → G0 on ryhmähomomorsmi, niin f (1G ) = 1G0 ja f (a−1 ) = f (a)−1 kun a ∈ G. Todistus. Kuvaamalla yhtälön 1G 1G = 1G kumpikin puoli f :llä saadaan f (1G )f (1G ) = f (1G ). Siis f (1G ) ∈ G0 toteuttaa yhtälön x2 = x. Koska ryhmässä yhtälöstä x2 = x seuraa x = 1, niin f (1G ) = 1G0 . Ehdosta aa−1 = a−1 a = 1G saadaan f :llä kuvaamalla f (a)f (a−1 ) = f (a−1 )f (a) = 1G0 , joten f (a−1 ) = f (a)−1 . 2 Todistuksessa käytettiin sitä, että jos alkio a ∈ G toteuttaa jonkin yhtälön (todistuksessa a = a), niin sen kuva-alkio f (a) toteuttaa saman yhtälön (f (a)2 = f (a)). Tähän sisältyy yksinkertainen mutta tärkeä ajatus: Jos jotkin G:n alkiot toteuttavat jonkin yhtälön, niin niiden kuvat G0 :ssa toteuttavat saman yhtälön. (Esimerkiksi a3 b2 = 1 ⇒ f (a)3 f (b)2 = 1.) Seuraavat esimerkit valottavat hiukan tämän merkitystä. 2
Esimerkki 2.5.8 Olkoon Cn = hci syklinen ryhmä ja olkoon f : Cn → G ryhmähomomorsmi. Silloin ensinnäkin f (c)n = 1. Toiseksi, jos c:n kuva f (c) tunnetaan, niin f määräytyy tästä jo täysin, sillä f (cm ) = f (c)m . Nämä seikat yhdessä rajoittavat suuresti sitä, millaiset homomorsmit Cn → G ovat mahdollisia.
Esimerkki 2.5.9 Tarkastellaan syklisiä ryhmiä C6 = hci ja C2 = hdi; siis c6 = 1 ja d2 = 1. a) Osoitetaan, että kuvaus C2 → C6 , jossa 1 7→ 1 ja d 7→ c3 , on ryhmähomomorsmi. b) Onko muita ryhmähomomorsmeja C2 → C6 kuin a-kohdassa annettu (paitsi triviaali)? c) Onko ryhmähomomorsmeja C6 → C2 (paitsi triviaali)? Ryhmähomomorsmissa aliryhmän kuva on aliryhmä, samoin aliryhmän alkukuva:
Lause 2.5.10 Olkoon f : G → G0 ryhmähomomorsmi.
LUKU 2. RYHMÄ
32
(i) Jos H ≤ G, niin f (H) ≤ G0 . (ii) Jos H 0 ≤ G0 , niin f −1 (H 0 ) ≤ G.
Todistus. Joukko f (H) on epätyhjä, koska H on. Jos a0 , b0 ∈ f (H), niin a0 = f (a) ja b0 = f (b) joillain alkioilla a, b ∈ H . Saadaan a0 b0−1 = f (a)f (b)−1 = f (ab−1 ) ∈ f (H), sillä ab−1 ∈ H . Väite (i) seuraa nyt aliryhmäkriteeristä. Koska f (1G ) = 1G0 ∈ H 0 , niin 1G ∈ f −1 (H 0 ), ja siis f −1 (H 0 ) 6= ∅. Kun a, b ∈ f −1 (H 0 ), niin f (a), f (b) ∈ H 0 , joten f (ab−1 ) = f (a)f (b)−1 ∈ H 0 eli ab−1 ∈ f −1 (H 0 ). Aliryhmäkriteerin nojalla f −1 (H 0 ) on aliryhmä. 2
2.5.1 Kuva ja ydin Valitsemalla lauseessa 2.5.10 aliryhmät H = G ja H 0 = {1} saadaan tärkeät erikoistapaukset: Homomorsmin f : G → G0 kuva
Im(f ) = f (G) = {f (a) | a ∈ G}
(2.27)
Ker(f ) = f −1 ({1}) = {a ∈ G | f (a) = 1}
(2.28)
ja ydin ovat aliryhmiä,
Im(f ) ≤ G0 ,
Ker(f ) ≤ G.
(2.29)
Ytimelle on voimassa vahvempikin tulos:
Lause 2.5.11 Ryhmähomomorsmin ydin on normaali aliryhmä. Todistus. Olkoon f : G → G0 ryhmähomomorsmi. Edellä jo todettiin, että Ker(f ) ≤ G. Kun x ∈ Ker(f ) ja a ∈ G, niin axa−1 ∈ Ker(f ), sillä f (axa−1 ) = f (a)f (x)f (a−1 ) = f (a)f (a−1 ) = f (aa−1 ) = f (1) = 1. Normaalisuuskriteerin nojalla Ker(f ) £ G.
2
Esimerkki 2.5.12 Koska det : GLn (R) → R∗ on ryhmähomomorsmi, niin SLn (R) = Ker(det) on normaali aliryhmä.
Huomautus 2.5.13 Kääntäen, jos N £ G, niin N on luonnollisen homomorsmin G → G/N ydin. Näin ollen G:n normaalit aliryhmät ovat samat kuin G:llä määriteltyjen homomorsmien ytimet.
LUKU 2. RYHMÄ
33
Huomautus 2.5.14 Vertaa ytimen määritelmää ja edellä todistettuja asioita vastaaviin lineaarikuvauksia koskeviin seikkoihin. Seuraavallakin tuloksella on vastineensa lineaarikuvauksille, ja todistuskin voitaisiin tehdä aivan analogisesti.
Lause 2.5.15 Ryhmähomomorsmi f : G → G0 on injektio jos ja vain jos Ker(f ) = {1}. Todistus. Homomorsmi f on injektio jos ja vain jos seuraava implikaatio on voimassa: f (a) = f (b)
=⇒
a = b,
ja tämä voidaan kirjoittaa ekvivalenttiin muotoon
f (ab−1 ) = 1G0
=⇒
ab−1 = 1G ,
=⇒
c = 1G
mikä edelleen on selvästi ekvivalentti ehdon
f (c) = 1G0
kanssa. Mutta tämähän sanoo juuri, että Ker(f ) = {1G }.
2
Esimerkki 2.5.16 Määritetään eo. esimerkkien homomorsmien ydin ja kuva. Kun f : G → G0 on ryhmähomomorsmiksi, niin ryhmä Im(f ) on G:n homomornen kuva. Sillä on samoja piirteitä kuin G:llä; toisaalta f yleensä hävittää joitain G:n ominaisuuksia, sitä enemmän, mitä useampia alkioita f kuvaa samaksi alkioksi. Jos f (a) = f (b), niin voi ajatella, että f samaistaa alkiot a ja b. Koska
f (a) = f (b)
⇐⇒
f (a−1 b) = 1
⇐⇒
a−1 b ∈ Ker(f )
⇐⇒
a Ker(f ) = b Ker(f ),
niin keskenään samaistuvat Ker(f ):n kunkin sivuluokan alkiot.
Lause 2.5.17 Olkoon f : G → G0 ryhmähomomorsmi. (i) Jos N £ G, niin f (N ) £ f (G). (ii) Jos N 0 £ G0 , niin f −1 (N 0 ) £ G.
Todistus. (i) Lauseen 2.5.10 nojalla f (N ) ≤ f (G). Normaalisuus saadaan aliryhmän normaalisuuskriteerin avulla seuraavasti. Olkoon b ∈ f (G) ja y ∈ f (N ); on näytettävä että byb−1 ∈ f (N ). Voidaan kirjoittaa b = f (a) ja y = f (x), missä a ∈ G ja x ∈ N . Silloin byb−1 = f (a)f (x)f (a)−1 = f (axa−1 ) ∈ f (N ), sillä axa−1 ∈ N aliryhmän N normaalisuuden nojalla. (ii) Lauseen 2.5.10 mukaan f −1 (N 0 ) ≤ G. Aliryhmän normaalisuuden todistamista varten otetaan mielivaltaiset a ∈ G ja x ∈ f −1 (N 0 ). Silloin f (x) ∈ N 0 , ja saadaan
f (axa−1 ) = f (a)f (x)f (a)−1 ∈ N 0 , koska N 0 on normaali. Siis axa−1 ∈ f −1 (N 0 ).
2
Valitsemalla lauseessa N 0 = {1} saadaan uudestaan lause 2.5.11.
LUKU 2. RYHMÄ
34
2.5.2 Ryhmien isomora Aiemmin on ollut esillä, että kahta ryhmää voi pitää oleellisesti samanlaisina, jos niillä on alkioiden nimeämistä vaille sama ryhmätaulu. Nyt muotoilemme tämän idean tarkasti.
Määritelmä 2.5.18 Ryhmähomomorsmia f : G → G0 sanotaan (ryhmä)isomorsmiksi, jos f on bijektiivinen. Ryhmä G on ryhmän G0 kanssa isomornen, jos on olemassa ryhmäisomorsmi G → G0 ; tällöin merkitään G ' G0 . Jos f : G → G0 on injektiivinen ryhmähomomorsmi, niin sen indusoima kuvaus G → Im(f ) on bijektiivinen homomorsmi G:ltä ryhmään Im(f ). Siis injektiivisessä homomorsmissa ryhmän G homomornen kuva on G:n kanssa isomornen.
Esimerkki 2.5.19 Esimerkin 2.5.6 kuvaus R+ → R, f (x) = ln x, on isomorsmi, joten R+ ' R (tarkemmin: (R+ , · ) ' (R, +)).
Esimerkki 2.5.20 Näytetään, etteivät ryhmät (R∗ , · ) ja (R, +) ole isomorset. Tehdään vastaoletus, että olisi ryhmäisomorsmi f : R∗ → R; siis f on bijektio ja
f (ab) = f (a) + f (b)
∀ a, b ∈ R∗ .
Lauseen 2.5.7 mukaan f (1) = 0. Toisaalta ryhmässä R∗ on (−1)2 = 1, ja ottamalla tästä f puolittain saadaan f ((−1)2 ) = f (1) eli 2f (−1) = 0; siis f (−1) = 0. Näin ollen f (1) = f (−1), joten f ei olekaan bijektio. Voi myös ajatella näin: Yhtälöllä x2 = 1 on ryhmässä (R∗ , · ) kaksi ratkaisua (x = ±1), mutta vastaavalla yhtälöllä 2x = 0 ryhmässä (R, +) on vain yksi ratkaisu (x = 0). Siksi ryhmät eivät voi olla isomorset.
Esimerkki 2.5.21 Ääretön ryhmä voi olla isomornen aidon aliryhmänsä kanssa: Z ' 2Z. ³
1x 0 1 ryhmän kanssa se on isomornen?
Esimerkki 2.5.22 Matriisien
´
(x ∈ R) joukko on GL2 (R):n aliryhmä. Minkä tutun
Esimerkki 2.5.23 Kirjoitetaan syklisen ryhmän C2 ryhmätaulu ja sen avulla suoran tulon C2 × C2 ryhmätaulu. Kyseessä on neljän alkion ryhmä. Miten tämä sopii kuvaan esimerkissä 2.1.19 todetun kanssa?
Esimerkki 2.5.24 Osoitetaan, että jos f : G → G0 on ryhmäisomorsmi, niin ord(a) = ord(f (a)) ∀ a ∈ G. Miten luvut ord(a) ja ord(f (a)) suhtautuvat toisiinsa, jos f :stä oletetaan vain homomorsuus?
Esimerkki 2.5.25 Kaikki samaa kertalukua n olevat sykliset ryhmät ovat keskenään isomorsia. Kaikki äärettömät sykliset ryhmät ovat keskenään isomorsia. Siis kertalukua n olevia syklisiä ryhmiä on isomoraa vaille yksi, merkitään Cn , samoin äärettömiä syklisiä ryhmiä, merkitään C∞ . (Tätä voi kutsua syklisten ryhmien luokitteluksi.)
LUKU 2. RYHMÄ
35
Lause 2.5.26 Olkoot f : G → G0 ja g : G0 → G00 ryhmähomomorsmeja. (i) Kuvaus g ◦ f : G → G00 on homomorsmi. (ii) Jos f ja g ovat isomorsmeja, samoin on g ◦ f . (iii) Jos f on isomorsmi, samoin on sen käänteiskuvaus f −1 : G0 → G.
Todistus. (i) g(f (ab)) = g(f (a)f (b)) = g(f (a))g(f (b)). (ii) Tunnetusti g ◦ f on bijektio, jos f ja g ovat; sen käänteiskuvaus on (g ◦ f )−1 = f −1 ◦ g −1 . Nyt (ii) seuraa (i)-kohdasta. (ii) Kuvaus f −1 on triviaalisti bijektiivinen, joten on vain todistettava sen homomorsuus. Olkoon a0 , b0 ∈ G. Merkitään a = f −1 (a0 ) ja b = f −1 (b0 ). Silloin f (ab) = f (a)f (b) = a0 b0 , ja ottamalla puolittain f −1 saadaan ab = f −1 (a0 b0 ) eli f −1 (a0 )f −1 (b0 ) = f −1 (a0 b0 ). 2 Lause merkitsee, että isomorsmi toteuttaa ekvivalenssirelaation ominaisuudet:
G ' G;
G ' G0 =⇒ G0 ' G;
G ' G0 , G0 ' G00 =⇒ G ' G00 .
Ryhmäisomorsmit G → G ovat G:n automorsmeja. Niiden joukolle käytetään merkintää Aut(G). Kuvaustulon suhteen Aut(G) on ryhmä, ns. G:n automorsmiryhmä.
Esimerkki 2.5.27 Olkoon G ryhmä ja u ∈ G kiinnitetty alkio. Kuvaus fu : G → G, fu (a) = uau−1 , on G:n automorsmi. Tällaisia kutsutaan G:n sisäisiksi automorsmeiksi.
Esimerkki 2.5.28 Kun G on Abelin ryhmä, niin kuvaus a 7→ a−1 on G:n automorsmi.
2.5.3 Homomoralause Seuraava tulos on ryhmäteorian peruslauseita.
Lause 2.5.29 (Homomoralause) Jos f : G → G0 on ryhmähomomorsmi, niin (2.30)
G/ Ker(f ) ' Im(f ).
Tarkemmin: homomorsmi f indusoi isomorsmin F : G/ Ker(f ) −→ Im(f ),
F (a Ker(f )) = f (a)
(a ∈ G).
(2.31)
Todistus. Merkitään K = Ker(f ). Osoitetaan ensiksi, että F : G/K → Im(f ), F (aK) = f (a), on hyvinmääritelty kuvaus. Jos aK = bK , niin a ∈ bK , siis a = bk , missä k ∈ K . Nyt F (aK) = f (a) = f (bk) = f (b)f (k) = f (b) · 1 = f (b) = F (bK), mikä todistaa väitteen. Kuvaus F on homomorsmi, sillä kun aK, bK ∈ G/K , niin
F (aK · bK) = F (abK) = f (ab) = f (a)f (b) = F (aK)F (bK). Kuvaus F on injektio, sillä jos F (aK) = 1, niin f (a) = 1, joten a ∈ K ja siis aK = K = 1G/K . Lopuksi Im(F ) = Im(f ), joten F on ryhmäisomorsmi G/K → Im(f ). 2
LUKU 2. RYHMÄ
36
Lauseen tilanteessa f = i ◦ F ◦ π , missä i : Im(f ) → G0 on inkluusio (esimerkki 2.5.2) f ja π : G → G/ Ker(f ) on kanoninen homomorsmi (mää..... . G G0 . ... ritelmä 2.5.4). Yhtäsuuruus f = i ◦ F ◦ π ilmaistaan myös ........ ... ... ... ... . ... i π ... ... sanomalla, että viereinen diagrammi kommutoi, millä tar... ... ... ... ...... ' koitetaan, ettei alkioiden kuvautuminen riipu reitistä. ..... . G/ Ker(f ) Im(f ) F
Huomautus 2.5.30 Homomoralauseen nojalla ryhmän homomorset kuvat ovat isomoraa vaille samat kuin sen tekijäryhmät.
Esimerkki 2.5.31 Kuvaus det : GLn (R) → R∗ on surjektiivinen ryhmähomomorsmi; siis GLn (R)/SLn (R) ' R∗ .
Esimerkki 2.5.32 Tutkitaan homomorsmin Z → Zm , a 7→ a, indusoimaa isomorsmia. Kirjoitetaan tulos myös multiplikatiivisesti.
Esimerkki 2.5.33 Lasketaan homomorsmin Z6 → Z6 , a 7→ 2a , ydin ja kuva. Todetaan, että # Im(f ) = #G/# Ker(f ), kuten homomoralauseen ja Lagrangen lauseen mukaan tulee ollakin.
Esimerkki 2.5.34 Selvitetään uudestaan ryhmä C6 /hc3 i. Huomautus 2.5.35 Homomoralauseen avulla saadaan joukko yleisiä isomoralakeja. Seuraavassa näistä esimerkkinä yksi. Kun H ≤ G ja K £ G, niin joukko
HK = {hk | h ∈ H, k ∈ K}
G
HK
..... ..... ...... ..... . . . . .....
...... ...... ...... ...... ...... ..
on G:n aliryhmä (tarkista aliryhmäkriteerillä; tässä tarvitaan K :n K H ...... normaalisuus). Oletuksesta seuraa, että K £ HK . Kuvaus f : H → ...... ...... ..... ...... . . . . ...... .... ...... ..... .. ...... HK/K , f (a) = aK , on homomorsmi (se on inkluusion H → HK H∩K ja kanonisen homomorsmin HK → HK/K yhdistetty kuvaus), ja pienellä työllä selvitetään, että Ker(f ) = H ∩ K ja Im(f ) = HK/K . Täten H ∩ K £ H ja
H/(H ∩ K) ' HK/K.
(2.32)
Tätä sanotaan suunnikassäännöksi.
Huomautus 2.5.36 Oletetaan edellisessä lisäksi H £G. Kun kuviossa kuljetaan ryhmästä HK ryhmään H ∩ K kahta eri tietä ja matkalla muodostetaan tekijäryhmät, toisaalta HK/H ja H/(H ∩ K), ja toisaalta HK/K ja K/(H ∩ K), niin saadaan isomoraa vaille samat kaksi ryhmää, mutta eri järjestyksessä. Kun tätä huomiota tutkitaan pitemmälle, johdutaan ryhmien ns. kompositiosarjoihin ja niitä koskevaan JordaninHölderin lauseeseen. Näitä käsitellään Algebran kurssilla.
Luku 3
Vektoriavaruus 3.1 Johdanto Lineaarialgebran kurssilla perehdyttiin vektoriavaruuksiin Rn ja kehiteltiin niiden käsittelyssä tarvittavaa formalismia. Nyt tutkimme samoja ideoita abstraktimmalla tasolla. Määrittelemme yleisen vektoriavaruuden aksiomaattisesti ja kehitämme teorian kokonaan näiden aksioomien pohjalta. Tämän ansiosta tulokset ovat sitten suoraan sovellettavissa hyvinkin erilaisiin vektoriavaruuksiin. Niistä meillä tulee muutamia esimerkkejä. Kyseessä on niin suora yleistys avaruuksista Rn , että voimme käsitellä sen hyvin lyhyesti. Monen asian kohdalla tyydytäänkin todistamisen sijasta vetoamaan siihen, että perustelu tapahtuisi kuten Rn :n tapauksessa. Jos jotain todistusta ei käydä läpi monisteessa eikä luennolla, se on kuitenkin syytä miettiä itse. Olennaisesti uusina piirteinä avaruuksien Rn teoriaan verrattuna tulevat oikeastaan vain seuraavat seikat: (1) Käsittely tapahtuu aksioomien pohjalta. (2) Vektoriavaruuksilla ei ole ennalta annettua luonnollista kantaa eikä vektoreilla ole siis ennalta annettua esitystä koordinaattivektoreina. (3) Dimensiot saavat olla äärettömiä. Rajoitumme toistaiseksi edelleen reaalisiin vektoriavaruuksiin. Algebran peruskurssissa II teoria yleistetään vielä siten, että skalaarikuntana on R:n sijasta yleinen kunta tämä on se yleisyyden taso, joka vektoriavaruuksien teorialle lienee luonnollisin. Tämä luku käsittelee teorian sitä osaa, joka koskee yhteenlasku- ja skalaarillakertomisoperaatioita. Algebran peruskurssissa II esitellään lisäksi ns. sisätuloavaruudet, joissa yleistetään Rn :n sisätulon ja normin (vektorin pituuden) käsitteet.
3.2 Yleinen reaalinen vektoriavaruus Määritelmä 3.2.1 Reaalinen vektoriavaruus eli vektoriavaruus yli R:n on joukko V , jossa on annettu kaksi operaatiota, summa, joka on kuvaus V × V → V , merkitään (X, Y ) 7→ X + Y
37
LUKU 3. VEKTORIAVARUUS
38
(X, Y ∈ V ), sekä skalaarilla kertominen, joka on kuvaus R × V → V , merkitään (a, X) 7→ aX (a ∈ R, X ∈ V ), ja jossa seuraavat ehdot toteutuvat: V1. X + Y = Y + X
∀ X, Y ∈ V ;
V2. (X + Y ) + Z = X + (Y + Z) ∀ X, Y, Z ∈ V ; V3. on sellainen θ ∈ V (nolla-alkio ), että X + θ = X
∀X ∈V;
V4. jokaista alkiota X ∈ V kohti on sellainen alkio −X ∈ V (X :n vasta-alkio ), että X + (−X) = θ; V5. a(X + Y ) = aX + aY V6. (a + b)X = aX + bX
∀ a ∈ R, X, Y ∈ V ; ∀ a, b ∈ R, X ∈ V ;
V7. (ab)X = a(bX) ∀ a, b ∈ R, X ∈ V ; V8. 1X = X
∀X ∈V.
Vektoriavaruus V on algebrallinen systeemi; oikeastaan sitä pitäisikin täydellisemmin merkitä (V, +, · ), missä + ja · ovat ko. operaatiot. Joskus skalaarilla kertominen merkitään aX = a · X . Vektoriavaruuden alkioita kutsutaan vektoreiksi. Nolla-alkiota θ sanotaan myös nollavektoriksi ja vektorin X vasta-alkiota −X myös sen vastavektoriksi. Yhteenlasku eli summa + on V :n binäärioperaatio aiemmin esitetyssä mielessä, ja aksioomat V1V4 sanovat itse asiassa, että (V, +) on Abelin ryhmä. Aksioomat V5V8 koskevat V :n operaatioiden (+ ja · ) sekä reaalilukukunnan R operaatioiden (yhteen- ja kertolasku) yhteensopivuutta. Vektoriavaruutta kutsutaan myös lineaariavaruudeksi (engl. vector space, linear space).
Esimerkki 3.2.2 Tutut R2 = {(x, y) | x, y ∈ R}, R3 = {(x, y, z) | x, y, z ∈ R} ja yleisemmin Rn = {(x1 , x2 , . . . , xn ) | xi ∈ R} ovat tuttujen operaatioiden suhteen vektoriavaruuksia. Operaatiot Rn :ssä ovat
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ), a(x1 , . . . , xn ) = (ax1 , . . . , axn ).
(3.1)
Merkitsemme näiden vektoriavaruuksien alkioita lihavoiduin symbolein, x = (x1 , . . . , xn ), ja nollavektori on 0 = (0, . . . , 0). Usein käytämme vektoreita pystyvektoreina. ∞ Esimerkki 3.2.3 Kaikkien äärettömien reaalilukujonojen (xn )∞ n=0 = (x0 , x1 , . . . ) joukko R
on vektoriavaruus, operaatioina
(x0 , x1 , . . . ) + (y0 , y1 , . . . ) = (x0 + y0 , x1 + y1 , . . . ), a(x0 , x1 , . . . ) = (ax0 , ax1 , . . . ).
Esimerkki 3.2.4 Otetaan kaikkien reaalifunktioiden joukolle käyttöön merkintä F (R) = { f | f on funktio R → R}.
(3.2)
LUKU 3. VEKTORIAVARUUS
39
Tässä, kuten kaikissa funktiojoukoissa, alkioiden (siis funktioiden) yhtäsuuruus on ymmärrettävä seuraavasti: f =g ⇐⇒ f (x) = g(x) ∀ x (tässä siis: ∀ x ∈ R). (3.3) Jos funktiot f merkitään muodossa f (x) niin kuin usein käytännössä tehdään (esimerkiksi sin x tai x2 ) niin kirjoitelma f (x) = g(x), kahden funktion välinen yhtäsuuruus, tarkoittaa identtistä yhtäsuuruutta. Se voidaan myös merkitä f (x) ≡ g(x). Funktiojoukosta F (R) saadaan vektoriavaruus määrittelemällä operaatiot näin: Kun f, g ∈ F (R) ja a ∈ R, niin f + g ja af ovat funktioita R → R, jotka määritellään:
(f + g)(x) = f (x) + g(x) (af )(x) = a · f (x)
∀ x ∈ R, ∀ x ∈ R.
(3.4)
(Itse asiassa juuri näinhän funktioita on totuttu laskemaan yhteen ja kertomaan skalaarilla.) Jotta todettaisiin, että F (R) todella on vektoriavaruus, pitäisi kaikki aksioomat tarkistaa. Otetaan tässä esimerkkinä V1 eli yhteenlaskun kommutatiivisuus: Olkoon f, g ∈ F (R). Pitää osoittaa, että f + g = g + f , ja tämä tarkoittaa samaa kuin
(f + g)(x) = (g + f )(x)
∀ x ∈ R,
eli
f (x) + g(x) = g(x) + f (x)
∀ x ∈ R,
mikä taas on voimassa reaalilukujen yhteenlaskun kommutatiivisuuden perusteella. Samoin todetaan muutkin aksioomat. Nolla-alkiona on nollafunktio f0 : f0 (x) = 0 ∀ x ∈ R. Vakiofunktio merkitään usein vain ko. vakiolla. Niinpä identiteetti sin2 x+cos2 x = 1 voidaan tulkita funktioiden yhtäsuuruudeksi, kun 1 katsotaan vakiofunktioksi.
Esimerkki 3.2.5 Vastaavalla tavalla esimerkiksi suljetulla välillä [a, b] määriteltyjen reaalifunktioiden joukosta
F [a, b] = { f | f on funktio [a, b] → R}. saadaan vektoriavaruus. Tämä ja F (R) ovat esimerkkejä funktioavaruuksista. Samaa ideaa voi käyttää paljon yleisemminkin: Joukosta F (X ) = {f | f on funktio X → R} saadaan vektoriavaruus, oli X mikä joukko tahansa. Koska (V, +) on Abelin ryhmä, niin ryhmiä koskevasta lauseesta 2.1.5 seuraa: Vektoriavaruuden nollavektori θ on yksikäsitteinen, samoin jokaisen vektorin X vastavektori −X . Vektorien X ja Y erotus määritellään X − Y = X + (−Y ). Yhtälöstä X + Y = Z voidaan ratkaista X : lisäämällä −Y kummallekin puolelle saadaan X = Z −Y (vertaa lauseeseen 2.1.15).
Lause 3.2.6 Olkoon V vektoriavaruus. (i) Kun a ∈ R ja X ∈ V , niin aX = θ jos ja vain jos a = 0 tai X = θ. (ii) Kun X ∈ V , niin −X = (−1)X .
LUKU 3. VEKTORIAVARUUS
40
Todistus. (i) Osoitetaan ensin, että 0X = θ ja aθ = θ. Ensinnäkin 0X = (0 + 0)X = 0X + 0X (aksiooma V6), ja lisäämällä puolittain −(0X) saadaan θ = 0X (aksioomat V2, V3, V4). Toiseksi aθ = a(θ + θ) = aθ + aθ (aksioomat V3, V5), ja lisäämällä −(aθ) puolittain saadaan aθ = θ (aksioomat V2, V3, V4). Käänteisen puolen todistamiseksi oletetaan, että aX = θ. Jos a = 0, ei ole mitään todistamista. Jos a 6= 0, niin ¡1 ¢ 1 1 X = 1X = · a X = (aX) = θ = θ, a a a missä käytettiin (paitsi käänteisalkion olemassaoloa R:ssä) aksioomia V7 ja V8 ja todistuksen alkuosaa. (ii) Koska X + (−1)X = 1X + (−1)X = (1 + (−1))X = 0X = θ (aksioomat V8, V6 ja kohta (i)), niin (−1)X = −X . 2 Liitäntä- eli assosiatiivilain V2 nojalla vektorien summat saa kirjoittaa ilman sulkeita, esimerkiksi X + Y + Z . Yleisemmin vektoriavaruudessa voidaan muodostaa lausekkeita
a1 X1 + a2 X2 + · · · + ak Xk
(ai ∈ R, Xi ∈ V );
näitä sanotaan vektorien X1 , . . . , Xk lineaarikombinaatioiksi.
3.3 Aliavaruus Vektoriavaruuden V osajoukkoa, joka itsekin on vektoriavaruus V :n laskutoimitusten + ja · suhteen, sanotaan V :n aliavaruudeksi.
Lause 3.3.1 (Aliavaruuskriteeri) Vektoriavaruuden V osajoukko U on aliavaruus jos ja vain jos se on epätyhjä ja toteuttaa seuraavat kaksi ehtoa: A1.
X, Y ∈ U
A2.
a ∈ R, X ∈ U
=⇒
X + Y ∈ U; =⇒
aX ∈ U .
Todistus. On selvää, että ehdot A1 ja A2 ovat välttämättömät, jotta U :lle restriktioina saatavat operaatiot U × U → U ja R × U → U olisivat hyvinmääriteltyjä. Kääntäen, oletetaan, että A1 ja A2 ovat voimassa. Kun ehdossa A2 valitaan a = 0, saadaan θ ∈ U . Valitsemalla a = −1 saadaan −X ∈ U kun X ∈ U . Nyt aksioomat V1V8 U :lle seuraavat suoraan siitä, että ne ovat voimassa V :lle. 2 Todistuksesta nähdään, että aliavaruuden U nollavektori on sama kuin V :n nollavektori ja että kunkin alkion X ∈ U vastavektori U :ssa on sama kuin sen vastavektori V :ssä. Kun U on V :n aliavaruus, niin (U, +) on ryhmän (V, +) aliryhmä. Ehdot A1 ja A2 yhdessä ovat ekvivalentit seuraavan ehdon kanssa: A12.
a, b ∈ R, X, Y ∈ U
=⇒
aX + bY ∈ U .
LUKU 3. VEKTORIAVARUUS
41
Esimerkki 3.3.2 Vektoriavaruuden Rn tapauksessa aliavaruuden käsite on juuri sama joka määriteltiin lineaarialgebran kurssissa. Siis esimerkiksi R3 :n aliavaruuksia ovat {0}, R3 , origon kautta kulkevat suorat ja origon kautta kulkevat tasot.
Esimerkki 3.3.3 Jokaisella vektoriavaruudella V on triviaalit aliavaruudet {θ} ja V . Esimerkki 3.3.4 Funktioavaruudella F (R) (esimerkki 3.2.4) on esimerkiksi aliavaruus C(R) = { f | f on jatkuva funktio R → R}.
Esimerkki 3.3.5 Tarkastellaan funktioavaruudessa F (R) reaalikertoimisia polynomeja p(x) = a0 + a1 x + a2 x2 + · · · + am xm
(m ≥ 0, ai ∈ R ∀ i).
Niiden joukko
P = { p(x) | p(x) on reaalikertoiminen polynomi}
(3.5)
on funktioavaruuden F (R) aliavaruus, ja samoin ovat sen osajoukot
Pn = { p(x) ∈ P | p(x) on enintään astetta n − 1 } = { a0 + a1 x + a2 x2 + · · · + an−1 xn−1 | ai ∈ R ∀ i },
(3.6)
missä n ≥ 1 on kiinnitetty. Näitä sanotaan polynomiavaruuksiksi. Ne muodostavat F (R):ssä aliavaruusketjun P1 ⊂ P2 ⊂ · · · ⊂ Pn ⊂ · · · ⊂ P ⊂ F (R).
Esimerkki 3.3.6 Esimerkin 3.2.3 vektoriavaruudella R∞ on aliavaruus U = {(xn )∞ n=0 | xn+2 = xn+1 + xn ∀ n ≥ 0}. (Tarkista ehdot A1 ja A2.) Siis U koostuu niistä lukujonoista, jotka toteuttavat lineaarisen rekursiokaavan xn+2 = xn+1 + xn (n ≥ 0). Eräs tunnettu U :n alkio on Fibonaccin jono F = (1, 1, 2, 3, 5, 8, 13, . . .). Muita ovat X1 = (1, 0, 1, 1, 2, 3, 5, . . .) ja X2 = (0, 1, 1, 2, 3, 5, 8, . . .). Näille on voimassa F = X1 + X2 .
Lause 3.3.7 Jos U1 ja U2 ovat vektoriavaruuden V aliavaruuksia, niin samoin on niiden leikkaus U1 ∩ U2 . Sama pätee useamman (jopa äärettömän monen) aliavaruuden leikkaukseen. Tämä todistetaan aliavaruuskriteeristä; vertaa ryhmiä koskevaan seuraukseen 2.2.7.
3.3.1 Vektorijoukon virittämä aliavaruus Vektoriavaruudessa V alkioiden X1 , . . . , Xn virittämä aliavaruus (tai generoima aliavaruus ) on niiden lineaarikombinaatioiden joukko
L(X1 , . . . , Xn ) = {a1 X1 + · · · + an Xn | a1 , . . . , an ∈ R}.
(3.7)
LUKU 3. VEKTORIAVARUUS
42
Aliavaruuskriteerin nojalla kyseessä todella on aliavaruus. Määritelmä on suora yleistys lineaarialgebran kurssissa käsitellystä Rn :ien tapauksesta. Nyt laajennamme käsitettä vielä lisää sallimalla äärettömätkin virittävät vektorijoukot: Olkoon S jokin joukko V :n vektoreita. Määritellään joukon S virittämä (tai generoima ) aliavaruus
L(S) = {a1 Y1 + · · · + ar Yr | r ≥ 0, a1 , . . . , ar ∈ R, Y1 , . . . , Yr ∈ S}.
(3.8)
Heti todetaan, että L(S) on V :n aliavaruus, ja että se on itse asiassa yksikäsitteinen suppein S :n sisältävä aliavaruus. Se voitaisiinkin esittää leikkauksena kaikista S :n sisältävistä aliavaruuksista; vertaa ryhmäteorian vastaavaan kaavaan (2.10). Huomaa, että vaikka S olisikin ääretön, niin jokainen L(S):n alkio on lineaarikombinaatio äärellisen monesta S :n alkiosta. Huomaa myös, että (päinvastoin kuin Xi :t (3.7):ssä) Yi :t eivät (3.8):ssä ole ennalta määrättyjä vektoreita vaan ne ovat mielivaltaisia S :n alkioita. Jos S on äärellinen, S = {X1 , . . . , Xn }, niin (3.8) antaa saman joukon kuin (3.7), koska kertoimet ai saavat olla nollia. Vektoriavaruutta V sanotaan äärellisesti generoiduksi, jos se on äärellisen joukon generoima, V = L(X1 , . . . , Xn ).
Esimerkki 3.3.8 Vektorit (1, 1, 0) ja (1, 0, 1) virittävät R3 :ssa tason x − y − z = 0. Esimerkki 3.3.9 Avaruudessa R3 taso T : x − y − z = 0 ja yksi sen ulkopuolinen vektori, esimerkiksi v = (1, 0, 0), virittävät yhdessä koko R3 :n, toisin sanoen L(T ∪ {v}) = R3 .
Esimerkki 3.3.10 Polynomiavaruudessa P alkiot 1, x, x2 virittävät aliavaruuden P3 . Yleisemmin, alkiot 1, x, . . . , xn−1 virittävät aliavaruuden Pn .
Esimerkki 3.3.11 Funktioavaruudessa F (R) joukon S = {1, x, x2 , . . . } virittämä aliavaruus L(S) on polynomiavaruus P . Myös joukko {1, 1 + x, x + x2 , x2 + x3 , . . . } virittää saman aliavaruuden P .
Esimerkki 3.3.12 Vektoriavaruudessa R∞ jonot X = (1, 0, 0, 0, . . . ) ja Y = (0, 1, 0, 0, . . . ) virittävät aliavaruuden
L(X, Y ) = {(a, b, 0, 0, . . . ) | a, b ∈ R}. Jos merkitään Ei :llä jonoa (0, . . . , 0, 1, 0, . . . ) (i:s alkio on = 1, muut ovat = 0), niin Ei :den virittämä aliavaruus on
L(E0 , E1 , . . . ) = {(a0 , a1 , . . . , an , 0, 0, . . . ) | n ≥ 0, aj ∈ R ∀ j }.
3.4 Lineaarinen riippuvuus Aivan samoin kuin Rn :n tapauksessa sanomme, että vektoriavaruuden V vektorit X1 , . . . , Xm ovat lineaarisesti riippuvia, jos on sellaiset a1 , . . . , am ∈ R, että
a1 X1 + · · · + am Xm = θ,
jokin ai 6= 0.
LUKU 3. VEKTORIAVARUUS
43
Laajennamme tämän käsitteen nyt äärettömillekin vektorijoukoille seuraavasti: Sanomme, että vektorijoukko S ⊆ V on lineaarisesti riippuva, jos jotkin sen erisuuret alkiot Y1 , . . . , Yk ∈ S ovat lineaarisesti riippuvia. Lineaarisen riippuvuuden vastakohta on lineaarinen riippumattomuus.
Esimerkki 3.4.1 Vektorijoukko, joka sisältää θ:n, on lineaarisesti riippuva. Esimerkki 3.4.2 R3 :n vektorit (1, 2, −1), (−1, 0, 3) ja (0, 2, 5) ovat lineaarisesti riippumattomia; tämä nähdään vaikka siitä, että se 3-rivinen determinatti, jonka vaakariveinä ko. vektorit ovat, on 6= 0 (katso lineaarialgebran kurssi).
Esimerkki 3.4.3 R4 :n vektorit x = (1, 2, 0, 4), y = (−1, 0, 5, 1) ja z = (1, 6, 10, 14) ovat lineaarisesti riippuvia, sillä 3x + 2y − z = 0.
Esimerkki 3.4.4 Osoitetaan, että funktioavaruuden F (R) alkiot 1, x, x2 , . . . ovat lineaarisesti riippumattomia. Oletetaan, että jokin niiden (tietenkin äärellinen!) lineaarikombinaatio olisi 0, siis a0 + a1 x + a2 x2 + · · · + ar xr = 0, missä ai ∈ R, ja oikean puolen 0 tarkoittaa nollafunktiota ( = f0 esimerkissä 3.2.4). Toisin sanoen, jos vasemman puolen polynomia merkitään p(x):llä, niin p(x) = 0 identtisesti. Silloin myös derivaatta p0 (x) ja korkeammat derivaatat p(i) (x) ovat identtisesti nollia. Mutta ai = 1 (i) i! p (0), joten a0 = · · · = ar = 0.
Esimerkki 3.4.5 Avaruudessa F (R) funktiot cos2 x, sin2 x ja cos 2x ovat lineaarisesti riippuvia, koska cos2 x − sin2 x = cos 2x ∀ x ∈ R.
Esimerkki 3.4.6 Näytetään, että funktioavaruuden F (R) vektorit ex ja e2x ovat lineaarisesti riippumattomia.
Esimerkki 3.4.7 Osoitetaan, että jos avaruuden V vektorit X, Y, Z ovat lineaarisesti riippumattomia, niin samoin ovat X + Y, Y + Z, Z + X .
Esimerkki 3.4.8 Esimerkissä 3.3.6 vektorit X1 ja X2 ovat lineaarisesti riippumattomia. Seuraava lause todistetaan oleellisesti kuten Rn :n tapauksessa. Käy kuitenkin todistukset itse läpi jo senkin toteamiseksi, ettei joukon S mahdollisesta äärettömyydestä tule ongelmia.
Lause 3.4.9 Vektoriavaruuden V osajoukko on lineaarisesti riippuva jos ja vain jos jokin sen vektoreista on muiden lineaarikombinaatio. Tarkemmin: Joukko S on lineaarisesti riippuva jos ja vain jos on sellainen X ∈ S ja sellaiset Y1 , . . . , Yk ∈ S \ {X}, että X = a1 Y1 + · · · + ak Yk ,
missä a1 , . . . , ak ∈ R.
LUKU 3. VEKTORIAVARUUS
44
Seuraus 3.4.10 Kaksi vektoria X1 ja X2 ovat lineaarisesti riippuvat jos ja vain jos jompikumpi on toisen skalaarimonikerta. Huomaa se erikoistapaus, että toinen vektoreista saattaa olla θ.
3.5 Kanta ja dimensio Määritelmä 3.5.1 Olkoot vektorit Xi erisuuria vektoriavaruuden V alkioita, missä i käy jonkin indeksijoukon I . Sanotaan, että joukko B = {Xi | i ∈ I} on V :n kanta eli että vektorit Xi (i ∈ I) muodostavat V :n kannan, jos B1. L(B) = V , ja B2. B on lineaarisesti riippumaton. Nolla-avaruuden {θ} kannaksi sovitaan tyhjä joukko. Avaruuksille Rn ja niiden aliavaruuksille kannan käsite on sama kuin lineaarialgebran kurssissa; Rn :llä on luonnollinen kanta {e1 , . . . , en }, missä ei = (0, . . . , 1, . . . , 0) (i:s alkio = 1).
Esimerkki 3.5.2 Polynomiavaruudella Pn on kanta {1, x, x2 , . . . , xn−1 } ja polynomiavaruudella P on kanta {1, x, x2 , . . . }. Käsittelyn yksinkertaistamiseksi tehdään seuraava merkintäsopimus. Kun {Xi | i ∈ I} on joukko V :n vektoreita, mahdollisesti ääretön, niin kirjoitelma X ai Xi , i∈I
missä vain äärellisen moni ai on 6= 0, tarkoittaa samaa kuin summa ne indeksit i, joilla ai 6= 0.
P i
ai Xi , missä i käy vain
Esimerkki 3.5.3 Kun n on luonnollinen luku, niin F (R):ssä voidaan kirjoittaa n
(1 + x) =
n µ ¶ X n i=0
∞ µ ¶ X n i x = x, i i i=0 i
sillä binomikerroin on 0, kun i > n. Seuraava todistetaan oleellisesti kuten Rn :ssä.
Lause 3.5.4 Olkoot vektorit Bi ∈ V erisuuria (i ∈ I ). Seuraavat ehdot ovat ekvivalentit: (i) Joukko B = {Bi | i ∈ I} on V :n kanta. (ii) Jokainen V :n vektori X voidaan esittää yksikäsitteisellä tavalla muodossa X X= ai Bi (X :n kantaesitys), i∈I
missä ai ∈ R ja vain äärellisen moni ai 6= 0.
LUKU 3. VEKTORIAVARUUS
45
Äärellisen kannan B = {B1 , . . . , Bn } tapauksessa kantaesitys tulee muotoon
X = a1 B1 + · · · + an Bn
(a1 , . . . , an ∈ R).
Lause 3.5.5 Jokaisella äärellisesti generoidulla vektoriavaruudella on kanta. Todistus. Olkoon V = L(X1 , . . . , Xm ). Voidaan olettaa, että V 6= {θ} ja että Xi :t ovat parittain erisuuria ja 6= θ. Silloin {X1 } on lineaarisesti riippumaton; näin ollen joukolla S = {X1 , . . . , Xm } on lineaarisesti riippumattomia osajoukkoja. Koska S on äärellinen, niin voidaan valita sisältymisrelaation suhteen maksimaalinen lineaarisesti riippumaton S :n osajoukko B; tämä tarkoittaa, että B ⊆ S ja B on lineaarisesti riippumaton ja että on voimassa implikaatio B ⊂ S1 ⊆ S
=⇒
S1 on lineaarisesti riippuva.
Osoitetaan, että B on V :n kanta. Koska B on lineaarisesti riippumaton, on vain todistettava, että L(B) = V . Merkintöjen yksinkertaistamiseksi numeroidaan S :n alkiot Xi siten, että B = {X1 , . . . , Xn }, missä n = #B ≤ m. Kun k > n, niin joukko {X1 , . . . , Xn , Xk } on lineaarisesti riippuva B:n maksimaalisuuden johdosta, joten
a1 X1 + · · · + an Xn + ak Xk = θ
(ai ∈ R),
missä jokin ai 6= 0. Ei voi olla ak = 0, sillä X1 , . . . , Xn ovat lineaarisesti riippumattomia. Näin ollen Xk voidaan ratkaista yo. yhtälöstä, ja saadaan Xk ∈ L(X1 , . . . , Xn ). Siis L(X1 , . . . , Xn ) sisältää kaikki vektorit X1 , . . . , Xn , Xn+1 , . . . , Xm , joten se sisältää myös kaikki niiden lineaarikombinaatiot. Seuraa L(X1 , . . . , Xm ) = L(X1 , . . . , Xn ), eli V = L(B).
2
Lause 3.5.6 Jos vektoriavaruudella on kanta, jossa on n alkiota (n < ∞), niin jokaisessa sen kannassa on n alkiota. Todistus. Olkoon B = {B1 , . . . , Bn } V :n kanta, ja olkoon X jokin toinen kanta. On osoitettava, että X :ssä on tarkalleen n alkiota. Oletetaan ensin, että X :ssä on ainakin n alkiota; merkitään X = {X1 , . . . , Xn } ∪ {Yi | i ∈ I}, missä Xi :t ja Yi :t ovat kaikki eri vektoreita. Koska V = L(B), niin erityisesti X1 = a1 B1 + · · · + an Bn
(ai ∈ R).
Koska X1 6= θ (X on lineaarisesti riippumaton), niin jokin ai 6= 0. Numeroimalla tarvittaessa Bi :t uudelleen voidaan olettaa, että a1 6= 0. Silloin B1 voidaan ratkaista yhtälöstä, joten B1 ∈ L(X1 , B2 , . . . , Bn ). Näin ollen B1 , . . . , Bn ∈ L(X1 , B2 , . . . , Bn ), ja koska V = L(B), niin seuraa
V = L(X1 , B2 , . . . , Bn ).
LUKU 3. VEKTORIAVARUUS
46
Siis erityisesti X2 ∈ L(X1 , B2 , . . . , Bn ), eli
X2 = c1 X1 + c2 B2 + · · · + cn Bn
(ci ∈ R).
Koska {X1 , X2 } on lineaarisesti riippumaton (sillä X on), niin jokin kertoimista c2 , . . . , cn on 6= 0. Numeroimalla taas tarvittaessa B2 , . . . , Bn uudelleen voidaan olettaa, että c2 6= 0. (Huomaa, ettei tämä enää muuta B1 :n indeksiä.) Seuraa B2 ∈ L(X1 , X2 , B3 , . . . , Bn ), siis
V = L(X1 , X2 , B3 , . . . , Bn ). Näin jatkamalla vektorit Bi voidaan korvata vektoreilla Xi yksi kerrallaan, ja lopputuloksena saadaan V = L(X1 , X2 , . . . , Xn ). (Kirjoita itse tälle vaikka induktiotodistus.) Mutta silloinhan jokainen Yi (i ∈ I ) voidaan lausua vektorien X1 , . . . , Xn lineaarikombinaationa; seuraa, että I = ∅, koska muuten X olisikin lineaarisesti riippuva. Siis X = {X1 , . . . , Xn }, joten #X = n. Oletetaan toiseksi, että X :ssä on vähemmän kuin n alkiota, #X = m < n. Samalla päättelyllä kuin edellä, vaihtamalla vain B:n ja X :n roolit, saadaan, että #B = m, ristiriita. 2 Kun V :llä on kanta, jossa on n alkiota, sanotaan, että n on V :n dimensio, merkitään n = dim V . Sanotaan myös, että V on n-ulotteinen. Äärellisesti generoitua vektoriavaruutta voidaan nyt kutsua äärellisulotteiseksi. Jos V ei ole äärellisulotteinen, niin se on ääretönulotteinen, merkitään dim V = ∞. Lauseen 3.5.6 todistuksessa itse asiassa näytettiin, että jos X on lineaarisesti riippumaton, niin #X ≤ n. On siis voimassa:
Seuraus 3.5.7 Olkoon dim V = n < ∞. Jos vektorijoukossa X ⊆ V on enemmän kuin n alkiota, niin X on lineaarisesti riippuva. Algebran peruskurssissa II nähdään, miten voidaan todistaa, että jokaisella vektoriavaruudella on kanta. Jos dim V = ∞, niin lauseen 3.5.6 mukaan kaikki V :n kannat ovat äärettömiä.
Lause 3.5.8 Olkoon V äärellisulotteinen vektoriavaruus. (i) Jokainen V :n lineaarisesti riippumaton osajoukko voidaan täydentää V :n kannaksi. (ii) Jokainen V :n virittävä osajoukko voidaan redusoida V :n kannaksi (jättämällä pois osa sen vektoreista).
Todistus. Olkoon ensin X = {X1 , . . . , Xk } lineaarisesti riippumaton joukko V :n vektoreita, ja olkoon B jokin V :n kanta. Kun merkitään S = X ∪B , niin myös L(S) = V . Nyt S :n osajoukkojen parvesta voidaan valita jokin maksimaalinen X :n sisältävä lineaarisesti riippumaton osajoukko Y ; toisin sanoen X ⊆ Y ⊆ S ja Y on lineaarisesti riippumaton, ja on voimassa Y ⊂ S1 ⊆ S
=⇒
S1 on lineaarisesti riippuva.
LUKU 3. VEKTORIAVARUUS
47
Samoin kuin lauseen 3.5.5 todistuksessa osoitetaan, että Y on V :n kanta. Koska se sisältää X :n, niin väite (i) seuraa. Todistetaan nyt (ii). Olkoon X V :n virittävä joukko. Valitaan X :stä keskenään lineaarisesti riippumattomia alkioita X1 , X2 , . . . niin pitkälle kuin mahdollista. Seurauksen 3.5.7 nojalla tämä päättyy viimeistään, kun on löydetty n = dim V alkiota. Olkoot X1 , . . . , Xk ko. alkiot; siis k ≤ n. Helposti nähdään, että loput X :n alkiot ovat vektoreiden X1 , . . . , Xk lineaarikombinaatioita. Koska X virittää V :n, niin V = L(X1 , . . . , Xk ). Siis {X1 , . . . , Xk } on V :n kanta (ja k = n). 2 Näistä lauseista päätellään helposti seuraavat (mieti miten):
Seuraus 3.5.9 Olkoon dim V = n < ∞ ja olkoot X1 , . . . , Xm erisuuria V :n vektoreita. Jos seuraavista ehdoista kaksi on voimassa, niin kolmaskin on, ja silloin {X1 , . . . , Xm } on V :n kanta: (i)
V = L(X1 , . . . , Xm );
(ii)
X1 , . . . , Xm ovat lineaarisesti riippumattomia;
(iii)
m = n.
Seuraus 3.5.10
(i) Jos U on V :n aliavaruus, niin dim U ≤ dim V (ehkä äärettömiä).
(ii) Jos U on V :n aliavaruus ja dim U = dim V < ∞, niin U = V . (iii) Jos V :ssä on ääretön määrä lineaarisesti riippumattomia vektoreita, niin dim V = ∞.
Esimerkki 3.5.11 Jos dim V = ∞, niin aidon aliavaruuden U dimensio saattaa olla ∞; näin on esimerkiksi tapauksessa L({x, x2 , . . . }) ⊂ P = L({1, x, x2 , . . . }).
Esimerkki 3.5.12 Merkitään C ∞ (R):llä niiden funktioiden f : R → R joukkoa, joilla on kaikkien kertalukujen derivaatat f (n) olemassa koko R:ssä. Tarkastellaan dierentiaaliyhtälöä y 00 − 3y 0 + 2y = 0. Yhtälö on lineaarinen, homogeeninen ja kertalukua 2. Osoitetaan, että sen ratkaisujoukko U = {f ∈ C ∞ (R) | f 00 − 3f 0 + 2f = 0} on C ∞ (R):n aliavaruus; samalla huomataan, että tämä johtuu nimenomaan yhtälön lineaarisuudesta ja homogeenisuudesta. Oletetaan tunnetuksi dierentiaaliyhtälöiden teoriassa todistetava seikka, että dim U = 2 ( = yhtälön kertaluku). Koska ex ja e2x kuuluvat U :hun ja ovat lineaarisesti riippumattomia (esimerkki 3.4.6), ne muodostavat sen kannan. Näin ollen dierentiaaliyhtälön yleinen ratkaisu on y = C1 ex + C2 e2x (C1 , C2 ∈ R).
©
¯R 1
Esimerkki 3.5.13 Osoitetaan, että U = p ∈ P3 ¯
0
ª p(x) dx = 0 on P3 :n aliavaruus, etsitään
sille jokin kanta ja täydennetään se P3 :n kannaksi.
Esimerkki 3.5.14 Olkoon V :llä kanta B, mahdollisesti ääretön, ja olkoon Y jokin V :n vektori, Y 6= θ. Osoitetaan, että V :llä on kanta, joka on saatu korvaamalla jokin B:n vektoreista Y :llä.
LUKU 3. VEKTORIAVARUUS
48
3.6 Koordinaattivektorit ja kannan vaihto Tarkastelemme nyt vain äärellisulotteisia avaruuksia. Olkoon V vektoriavaruus ja B = {B1 , . . . , Bn } sen kanta. Jokaisella vektorilla X on yksikäsitteinen kantaesitys X = x1 B1 + · · · + xn Bn (xi ∈ R). Kertoimista muodostetaan X :n koordinaattivektori kannan B suhteen,
XB = (x1 , . . . , xn )T . Huomaa, että XB ∈ Rn . Kuvaus V → Rn , X 7→ XB , on bijektio, ja on helppo todeta, että
(X + Y )B = XB + YB ,
(3.9)
(aX)B = a · XB ,
kun X, Y ∈ V ja a ∈ R, missä oikeilla puolilla on Rn :n operaatiot. Tämä merkitsee, että kun dim V = n, niin kiinnittämällä jokin kanta B avaruutta V pystytään käsittelemään kuin se olisi Rn . Tilanteesta riippuu, kannattaako tämä. Olkoot X1 , . . . , Xm V :n vektoreita ja olkoot x1 , . . . , xm niiden koordinaattivektorit (siis xi = (Xi )B ). Silloin Xi :t ovat lineaarisesti riippuvia V :ssä jos ja vain jos xi :t ovat lineaarisesti riippuvia Rn :ssä; nimittäin
a1 X1 + · · · + am Xm = θ
⇐⇒
(a1 X1 + · · · + am Xm )B = θB
⇐⇒
a1 x1 + · · · + am xm = 0.
Vektorien x1 , . . . , xm lineaarinen riippuvuus taas on ekvivalentti sen kanssa, että sen matriisin aste, jonka pystyriveinä xi :t ovat, on < m. Kun tätä sovelletaan tapaukseen m = n, saadaan:
Lause 3.6.1 Olkoon B = {B1 , . . . , Bn } vektoriavaruuden V kanta, ja olkoon V :n vektoreilla C1 , . . . , Cn kantaesitykset Cj =
n X
pij Bi
(j = 1, . . . , n).
(3.10)
i=1
Vektorit C1 , . . . , Cn muodostavat V :n kannan jos ja vain jos matriisi (pij ) on säännöllinen. Jos B = {B1 , . . . , Bn } ja C = {C1 , . . . , Cn } ovat vektoriavaruuden V kaksi kantaa, niin kannanvaihdon B → C matriisiksi sanotaan matriisia
P = PB→C = (pij )n×n ,
(3.11)
missä kertoimet pij määräytyvät yhtälöistä (3.10). Aivan samalla tavoin kuin Rn :n tapauksessa (siis suoraan laskemalla) saadaan XB = PB→C XC , (3.12) sekä
PB→C PC→D = PB→D ,
PB→C = (PC→B )−1 .
(3.13)
Esimerkki 3.6.2 Polynomiavaruudessa P3 on kannat B = {1, x, x2 } ja C = {1, x, 21 x(x − 1)}. Muodostetaan kannanvaihtojen B → C ja C → B matriisit. Lasketaan niiden avulla polynomin 1 + 2x + 3x2 esitys kannassa C .
LUKU 3. VEKTORIAVARUUS
49
3.7 Aliavaruuksien suora summa Olkoon V vektoriavaruus. Sen aliavaruuksien U1 , . . . , Uh summa määritellään
U1 + · · · + Uh = {X1 + · · · + Xh | X1 ∈ U1 , . . . , Xh ∈ Uh }
(3.14)
(siis aivan samoin kuin tapauksessa V = Rn ). On helppo todeta, että U1 +· · ·+Uh on aliavaruus. Se sisältää kaikki Ui :t, ja koska se selvästikin on suppein tämän toteuttava aliavaruus, niin (3.15)
U1 + · · · + Uh = L(U1 ∪ · · · ∪ Uh ).
Summaa U1 + · · · + Uh sanotaan suoraksi, jos jokaisen alkion X ∈ U1 + · · · + Uh esitys muodossa
X = X1 + · · · + Xh
(X1 ∈ U1 , . . . , Xh ∈ Uh )
on yksikäsitteinen. Suora summa merkitään U1 ⊕ · · · ⊕ Uh tai on kuten Rn :ssä.) Seuraavat todistetaan juuri kuten tapauksessa V = Rn .
h L i=1
(3.16)
Ui . (Siis tämäkin määritelmä
Lause 3.7.1 Vektoriavaruuden V aliavaruuksien U1 , . . . , Uh summa on suora jos ja vain jos on voimassa: X1 + · · · + Xh = θ,
X1 ∈ U1 , . . . , Xh ∈ Uh
=⇒
X1 = · · · = Xh = θ.
(3.17)
Tärkeä erikoistapaus on kahden aliavaruuden suora summa:
Lause 3.7.2 Kun U1 ja U2 ovat V :n aliavaruuksia, niin seuraavat ehdot ovat ekvivalentit: (i)
Summa U1 + U2 on suora.
(ii)
U1 ∩ U2 = {θ}.
(iii)
Jos X1 + X2 = θ, missä X1 ∈ U1 ja X2 ∈ U2 , niin X1 = X2 = θ.
Esimerkki 3.7.3 Reaalilukujonojen avaruus R∞ on suora summa R∞ = U ⊕ W , missä ∞ U = {(xn )∞ | xn = 0 kun 2 - n}, n=0 ∈ R ∞ W = {(xn )∞ | xn = 0 kun 2 | n}. n=0 ∈ R
Esimerkki 3.7.4 Polynomia p(x) ∈ P sanotaan parilliseksi, jos p(−x) = p(x), ja parittomaksi, jos p(−x) = −p(x). Osoitetaan, että parilliset polynomit muodostavat P :n aliavaruuden, samoin parittomat polynomit, ja että P on näiden kahden suora summa.
Esimerkki 3.7.5 Näytetään, että myös funktioavaruus F (R) voidaan kirjoittaa parillisten ja parittomien funktioiden aliavaruuksien suorana summana.
LUKU 3. VEKTORIAVARUUS
50
Huomautus 3.7.6 Samoin kuin Rn :n tapauksessa on helppo osoittaa, että suoralle summalle U1 ⊕ · · · ⊕ Uh saadaan kanta yhdistämällä Ui :den kannat.
Huomautus 3.7.7 Summa ja suora summa määritellään myös äärettömän monelle aliavaruudelle Ui (i ∈ I ). Määritelmät ovat kuten edellä, paitsi että käytetään summia Xi ∈ Ui ja vain äärellisen moni Xi on 6= θ.
P
i∈I
Xi , missä
3.8 Lineaarikuvaus Määrittelemme lineaarikuvaukset kuten avaruuksien Rn teoriassa. Vertaa myös ryhmäteoriaan, jossa tärkeitä kuvauksia ovat ne, jotka kunnioittavat ryhmäoperaatoita, toisin sanoen ryhmähomomorsmit. Vastaavasti vektoriavaruuksien teoriassa tärkeitä ovat kuvaukset, jotka kunnioittavat näiden algebrallisten systeemien operaatioita:
Määritelmä 3.8.1 Vektoriavaruuksien U ja V välistä kuvausta f : U → V sanotaan lineaariseksi eli lineaarikuvaukseksi, jos se täyttää ehdot L1. f (X1 + X2 ) = f (X1 ) + f (X2 ) ∀ X1 , X2 ∈ U , L2. f (aX) = af (X) ∀ a ∈ R, X ∈ U . Ehdot L1 ja L2 yhdessä ovat ekvivalentit seuraavan ehdon kanssa: L12. f (a1 X1 + a2 X2 ) = a1 f (X1 ) + a2 f (X2 ) ∀ a1 , a2 ∈ R, X1 , X2 ∈ U . Induktiolla todetaan, että lineaarikuvaus f : U → V säilyttää lineaarikombinaatiot, eli
f (a1 X1 + · · · + ak Xk ) = a1 f (X1 ) + · · · + ak f (Xk ).
(3.18)
Valitsemalla L2:ssa a = 0 nähdään, että nollavektori kuvautuu nollavektoriksi,
f (θ) = θ.
(3.19)
Esimerkki 3.8.2 a) Identiteettikuvaus idV : V → V on lineaarikuvaus. b) Nollakuvaus f0 : U → V , f0 (X) = θ ∀ X ∈ U , on lineaarikuvaus. c) Jos U on V :n aliavaruus, niin sisältymiskuvaus eli inkluusio U → V on lineaarikuvaus.
Esimerkki 3.8.3 Funktioiden derivoinnista saadaan lineaarikuvauksia eräiden funktioavaruuksien välille, mm. kuvaus D : C ∞ (R) → C ∞ (R), D(f ) = f 0 . Derivointi antaa mm. myös lineaarikuvaukset P → P ja Pn → Pn−1 . Seuraavan lauseen mukaan lineaarikuvaus määräytyy yksikäsitteisesti kantavektoreiden kuvista. Tämä tuloshan nähtiin jo lineaarialgebran kurssissa, kun tarkasteltiin avaruuksia Rn , ja todistus sujuisi nytkin lähes samoin. Kannat saavat kuitenkin olla äärettömiä, joten jokaisen kannattaa käydä todistus uudestaan läpi tässä tilanteessa.
LUKU 3. VEKTORIAVARUUS
51
Lause 3.8.4 Olkoot U ja V vektoriavaruuksia ja olkoon {Xi | i ∈ I} jokin U :n kanta. Olkoot {Yi | i ∈ I} joitakin kiinnitettyjä V :n vektoreita (eivät ehkä erisuuria). Silloin on yksikäsitteinen sellainen lineaarikuvaus f : U → V , että f (Xi ) = Yi
∀ i ∈ I.
(3.20)
Esimerkki 3.8.5 Koska polynomiavaruudella P on kanta {1, x, x2 , . . . }, niin voidaan määritellä lineaarikuvaus f : P → R asettamalla esimerkiksi f (xn ) = 1 ∀ n ≥ 0. Silloin yleisen alkion p(x) = a0 + a1 x + · · · + ak xk kuvaksi tulee a0 + a1 + · · · + ak , sillä
f (a0 + a1 x + · · · + ak xk ) = a0 f (1) + a1 f (x) + · · · + ak f (xk ) = a0 + a1 + · · · + ak . Tässä käytetiin ominaisuutta L12.
Huomautus 3.8.6 Jos f ja g ovat lineaarikuvauksia U → V , niin myös niiden summa ja skaalarimonikerrat, toisin sanoen kuvaukset f + g : U → V, cf : U → V,
(f + g)(X) = f (X) + g(X), (cf )(X) = c · f (X)
(3.21)
(missä c ∈ R), ovat lineaarisia. Tämä on helppo tarkistaa vaikka ehdolla L12. Operaatiot (3.21) tekevät lineaarikuvausten U → V joukosta L(U, V ) vektoriavaruuden.
3.9 Lineaarikuvauksen ydin ja kuva Seuraava todistettiin lineaarialgebran kurssissa avaruuksien Rn tapauksessa, ja sama todistus (joitakin merkintöjä vain muuttamalla) käy nyt yleisessäkin tilanteessa:
Lause 3.9.1 Olkoon f : U → V lineaarikuvaus. (i) Kun U0 ⊆ U on aliavaruus, niin f (U0 ) on V :n aliavaruus. (ii) Kun V0 ⊆ V on aliavaruus, niin f −1 (V0 ) on U :n aliavaruus. Valitsemalla U0 = U ja V0 = {θ} saadaan kaksi tärkeää erikoistapausta. Käytetään seuraavia nimityksiä. Lineaarikuvauksen f : U → V kuva-avaruus on
Im(f ) = f (U ) = {f (X) | X ∈ U } ja f :n ydin on
Ker(f ) = f −1 ({θ}) = {X ∈ U | f (X) = θ}.
Seuraus 3.9.2 Kun f : U → V on lineaarikuvaus, niin Im(f ) ⊆ V ja Ker(f ) ⊆ U ovat aliavaruuksia. Lineaarialgebran kurssissa esitetty dimensioyhtälönkin todistus yleistyy suoraan, ja saadaan:
LUKU 3. VEKTORIAVARUUS
52
Lause 3.9.3 (Lineaarikuvauksen dimensioyhtälö) Kun f : U → V on lineaarikuvaus ja dim U < ∞, niin dim U = dim Ker(f ) + dim Im(f ).
(3.22)
Lineaarikuvauksen f kuva-avaruuden dimensiota dim Im(f ) sanotaan f :n asteeksi , merkitään r(f ) (engl. rank), ja ytimen dimensiota dim Ker(f ) sanotaan f :n nulliteetiksi . Edellistä lausetta kutsutaankin usein aste-nulliteetti-lauseeksi .
Esimerkki 3.9.4 Tarkastellaan derivointikuvausta D : Pn → F (R). Nyt Ker(D) = P1 (vakiopolynomit) ja Im(D) = Pn−1 . Dimensioyhtälöstä dim Pn = dim Ker(D) + dim Im(D) siis tulee n = 1 + (n − 1).
Esimerkki 3.9.5 Kuvaus f : Pn → Pn , f (p(x)) = p(x + 1) − p(x), on lineaarinen (tarkista!). Mikä on kuva-avaruuden dimensio? Kuva-avaruuden määrittäminen ei nyt ole helppoa. Sen sijaan helposti päätellään, että ydin on Ker(f ) = P1 (vakiopolynomit). Dimensioyhtälön nojalla dim Im(f ) = dim Pn − dim P1 = n − 1.
Esimerkki 3.9.6 Tarkastellaan taas dierentiaaliyhtälöä y 00 − 3y 0 + 2y = 0,
(3.23)
jolle haetaan ratkaisuja C∞ (R):stä. Merkitään ratkaisujoukkoa U :lla. Määritellään kuvaus D1 : C∞ (R) → C∞ (R), D1 (f ) = f 00 − 3f 0 + 2f . Silloin D1 on lineaarinen (tarkista!), mistä nähdään uudestaan, että U = Ker(D1 ) on C∞ (R):n aliavaruus. Tarkastellaan nyt epähomogeenista yhtälöä y 00 − 3y 0 + 2y = g(x), (3.24) missä g(x) ∈ C∞ (R) on jokin annettu funktio (esimerkiksi g(x) = sin x). Dierentiaaliyhtälöitä käsittelevissä kursseissa osoitetaan, että yhtälön (3.24) yleinen ratkaisu on muotoa
y = y0 + Y,
(3.25)
missä Y on homogeenisen yhtälön (3.23) yleinen ratkaisu ja y0 on epähomogeenisen yhtälön (3.24) jokin yksittäisratkaisu. (Jos esimerkiksi g(x) = sin x, niin (3.24):n yleiseksi ratkaisuksi 3 1 sin x + 10 cos x + C1 ex + C2 e2x (C1 , C2 ∈ R).) saadaan y = 10 Suorita itse (3.25):n todistus, ja pane merkille, ettei siinä tarvita muuta kuin D1 :n lineaarisuus! Tarvitessasi voit ottaa mallia siitä lineaarialgebran kurssin lauseesta, joka koski yhtälöä
Ax = c
(3.26)
(missä A ∈ Mm×n (R) ja c ∈ Rm ovat annettuja ja etsitään ratkaisuja x ∈ Rn ) ja jossa osoitettiin, että yleinen ratkaisu on muotoa x = x0 + y, (3.27)
LUKU 3. VEKTORIAVARUUS
53
missä y on homogeenisen yhtälön Ax = 0 yleinen ratkaisu ja x0 on epähomogeenisen yhtälön Ax = c yksittäisratkaisu. Tämän jälkeen onkin varmaan jo helppo kirjoittaa ja todistaa yleinen lineaarikuvauksia koskeva lause, joka käsittää erikoistapauksinaan mm. nämä yhtälöiden (3.24) ja (3.26) ratkaisuavaruuksien rakennetta koskevat tulokset (3.25) ja (3.27); huomaa että näissä yhtälöissähän on kyse lineaarikuvauksista f 7→ D1 (f ) ja x 7→ Ax.
3.10 Säännöllinen lineaarikuvaus Lineaarikuvausta sanotaan säännölliseksi, jos se on injektio. Seuraavat seikat todistetaan kuten avaruuksien Rn tapauksessa.
Lause 3.10.1 Olkoon f : U → V lineaarinen. (i) Kuvaus f on injektio jos ja vain jos Ker(f ) = {θ}. (ii) Kun dim U < ∞, niin f on injektio jos ja vain jos dim Im(f ) = dim U . (iii) Kun vektorit X1 , . . . , Xn muodostavat U :n kannan, niin f on injektio jos ja vain jos vektorit f (X1 ), . . . , f (Xn ) muodostavat Im(f ):n kannan. (iv) Kun dim U = dim V < ∞, niin f on injektio jos ja vain jos se on surjektio (jolloin se siis on bijektio).
Lause 3.10.2 Olkoot f : U → V ja g : V → W lineaarisia. (i) Yhdistetty kuvaus g ◦ f : U → W on lineaarinen. (ii) Jos f on bijektiivinen, niin myös käänteiskuvaus f −1 : V → U on lineaarinen.
Esimerkki 3.10.3 Tarkastellaan kuvausta f : P → P , f (p(x)) = xp(x), joka selvästi on lineaarinen. Koska Ker(f ) = {0}, niin f on injektio. Se ei kuitenkaan ole surjektio. Koska Im(f ) = W = { p(x) ∈ P | p(0) = 0 }, niin f :n indusoima kuvaus f1 : P → W on bijektiivinen lineaarikuvaus. Sen käänteiskuvaus f1−1 : W → P on siis myös lineaarinen. Eksplisiittisesti tämä kuvaus on f1−1 (p(x)) = x1 p(x) ∀ p(x) ∈ W .
3.10.1 Vektoriavaruuksien isomorsmi Vektoriavaruuksia U ja V sanotaan isomorsiksi, jos on olemassa bijektiivinen lineaarikuvaus U → V ; tällöin merkitään U ' V .
Lause 3.10.4 Kun dim V = n < ∞, niin V ' Rn .
LUKU 3. VEKTORIAVARUUS
54
Todistus. Valitaan V :lle kanta B = {B1 , . . . , Bn }, ja olkoon {e1 , . . . , en } Rn :n luonnollinen kanta. Lauseen 3.8.4 mukaan on sellainen lineaarikuvaus f : V → Rn , että f (Bi ) = ei (i = 1, . . . , n), ja lauseen 3.10.1 nojalla se on bijektio. 2 Tämä lause tekee tarkaksi sen aiemmin esitetyn huomion, että n-ulotteista vektoriavaruutta voidaan käsitellä kuten Rn :ää, kun kanta on kiinnitetty. Huomaa kuitenkin, että todistuksen isomorsmi f riippuu kannan B valinnasta; sehän on kuvaus X 7→ XB (vertaa (3.9)).
Esimerkki 3.10.5 Polynomiavaruudelle Pn saadaan Pn ' Rn . Kun käytetään P :n kantaa {1, x, . . . , xn−1 }, niin lauseen todistuksen antama isomorsmi kuvaa yleisen alkion näin: a0 + a1 x + a2 x2 + · · · + an−1 xn−1 7→ (a0 , a1 , a2 , . . . , an−1 )T .
Esimerkki 3.10.6 Esimerkin 3.3.12 merkinnöin P ' L(E0 , E1 , . . . ) ⊂ R∞ .
3.11 Lineaarikuvauksen matriisi Olkoon f : U → V lineaarikuvaus. Oletetaan, että dim U = n ja dim V = m ovat äärellisiä. Valitaan U :lle kanta B = {B1 , . . . , Bn } ja V :lle kanta C = {C1 , . . . , Cm }. Silloin U :n vektoreille X saadaan koordinaattivektorit XB ja V :n vektoreille Y koordinaattivektorit YB . On selvää, että kuvausta f : U → V tulee vastaamaan koordinaattivektoreita koskeva kuvaus Rn → Rm , joka määräytyy ehdosta: XB 7→ YC , kun f (X) = Y . Tälf ..... . U V le kuvaukselle on tietenkin selvitettävissä lauseke suoraan ........ ........ ... ... laskemalla. Koska se on jo tehty lineaarialgebran kurssis... ' ... ' ... .. ....... ........ n m sa (tapauksessa U = R ja V = R ), ja samat laskelmat ..... n . Rm R käyvät tässä yleisessäkin tilanteessa, niin esitämme nyt vain kaavat ilman todistuksia. Lineaarikuvauksen f : U → V matriisi kantojen B ja C suhteen on M (f ) = MB,C (f ) = (aij )m×n , jonka alkiot aij määräytyvät yhtälöistä f (B1 ) = a11 C1 + · · · + am1 Cm , (3.28) ............................... f (Bn ) = a1n C1 + · · · + amn Cm (huomaa transponointi). Toisin sanoen M (f ) on matriisi, jonka pystyriveinä ovat koordinaattivektorit f (B1 )C , . . . , f (Bn )C .
Lause 3.11.1 Eo. oletuksin ja merkinnöin on voimassa: Kun X ∈ U ja Y ∈ V , niin Y = f (X)
⇐⇒
YC = MB,C (f ) · XB .
(3.29)
Esimerkki 3.11.2 Derivaattakuvauksen D : P3 → P2 matriisi kantojen {1, x, x2 } ja {1, x} suhteen on
à M (D) =
0 1 0 0 0 2
! .
LUKU 3. VEKTORIAVARUUS
55
Lasketaan tämän avulla D(2x + 3x2 ). Koska à ! à ! 0 0 1 0 2 2 = , 0 0 2 6 3 niin D(2x + 3x2 ) = 2 + 6x. Vastaavuudessa f 7→ M (f ) kuvausten yhdistäminen vastaa matriisituloa : Olkoot f : U → V ja g : V → W lineaarikuvauksia. Silloin g ◦ f on lineaarikuvaus. Kun dimensiot ovat äärellisiä ja avaruuksilla U, V, W on vastaavasti kannat B , C ja D, niin
MB,D (g ◦ f ) = MC,D (g)MB,C (f ).
(3.30)
Tämä osoitetaan samoin kuin avaruuksien Rn tapauksessa. Lineaarialgebran kurssissa selvitettiin myös f :n matriisin muuntuminen kantojen vaihdossa. Aivan samat tulokset ovat voimassa tässä yleisessäkin tilanteessa, ja todistuksetkin olisivat yhtä suoraviivaisia. Tässä ovat tulokset: Olkoon f : U → V lineaarikuvaus. Jos U :lla on kannat B ja B 0 ja V :llä kannat C ja C 0 , niin
MB0 ,C 0 (f ) = PC 0 →C MB,C (f )PB→B0 .
(3.31)
Kun f on lineaarikuvaus U → U , niin on tapana käyttää U :lle samaa kantaa, katsottiinpa U :ta f :n määrittely- tai maaliavaruutena. Tällöin puhutaan f :n matriisista ko. kannan B suhteen ja merkitään M (f ) = MB (f ) = MB,B (f ). Tämän matriisin muuntuminen kannan vaihdossa tapahtuu säännöllä MB0 (f ) = P −1 MB (f )P, (3.32) missä P = PB→B0 . Kyseessä on siis similaarimuunnos.
Huomautus 3.11.3 Kun f, g : U → V ovat lineaarikuvauksia, niin helposti todetaan, että M (f + g) = M (f ) + M (g),
M (cf ) = cM (f ),
(3.33)
missä c ∈ R ja kaikki matriisit on muodostettu samojen kantojen suhteen. Kaavat (3.33) ovat kuten L1 ja L2. Todellakin, kun L(U, V ) katsotaan vektoriavaruudeksi kuten huomautuksessa 3.8.6 ja matriisien joukko Mm×n (R) on vektoriavaruus tavallisten operaatioiden suhteen, niin (3.33) sanoo, että kuvaus f 7→ M (f ) on lineaarikuvaus L(U, V ) → Mm×n (R). Lisäksi se on helppo todeta bijektioksi. (Miten?) Siis kyseessä on vektoriavaruusisomorsmi L(U, V ) ' Mm×n (R).
Huomautus 3.11.4 Bijektiivisten lineaarikuvausten V → V joukko GL(V ) = {f ∈ L(V, V ) | f on bijektio} on kuvaustulon suhteen ryhmä; katso lausetta 3.10.2. Olkoon dim V = n. Kiinnitetään V :lle kanta B. Huomautuksen 3.11.3 bijektion L(V, V ) → Mn (R), f 7→ MB (f ), restriktiona saadaan bijektio GL(V ) → GLn (R); tätä varten riittää näyttää, että f ∈ L(V, V ) on bijektio jos ja vain jos M (f ) on säännöllinen. Yhtälön (3.30) mukaan kyseessä on ryhmäisomorsmi. Nähdään siis, että (GL(V ), ◦ ) ' (GLn (R), · ) ryhminä.
LUKU 3. VEKTORIAVARUUS
56
Esimerkki 3.11.5 Tarkastellaan kuvausta f : P3 → P3 , f (p(x)) = p(x + 1). Esimerkiksi f (x2 ) = (x + 1)2 = 1 + 2x + x2 . Osoitetaan, että f on lineaarinen. Muodostetaan f :n matriisi kannan {1, x, x2 } suhteen. Todetaan, että M (f ) on säännöllinen; siis seuraa, että f on bijektio. Jälkimmäinen seikka on tosin selvä muutenkin, sillä f :llähän on käänteiskuvaus f −1 (p(x)) = p(x − 1).
3.12 Lineaarikuvauksen ominaisarvot ja -vektorit Määritelmä 3.12.1 Olkoon f lineaarikuvaus V → V . Sanotaan, että λ ∈ R on f :n ominaisarvo ja että X ∈ V on siihen kuuluva ominaisvektori , jos X 6= θ ja
f (X) = λX.
(3.34)
Olkoon dim V < ∞. Kun A = MB (f ) on f :n matriisi V :n kannan B suhteen, niin yhtälö f (X) = λX on ekvivalentti yhtälön Ax = λx kanssa, missä x = XB . Näin ollen f :n ominaisarvot ovat samat kuin A:n reaaliset ominaisarvot, ja niihin kuuluvat f :n ja A:n ominaisvektorit vastaavat toisiaan. (Huomaa, että lineaarialgebran kurssin käytännön mukaan A:lla saattaa olla lisäksi ominaisarvoja λ ∈ C \ R. Näitä ei siis katsota f :n ominaisarvoiksi.) On varmaan selvää, että kaikki, mitä lineaarialgebran kurssissa puhuttiin lineaarikuvausten n R → Rn ominaisarvoista, on helposti siirrettävissä tähän yleiseen tilanteeseen (ainakin kun dimensio on äärellinen), esimerkiksi diagonalisoituvuutta, ominaisavaruuksia ja niiden kantoja koskevat asiat. Otetaan tässä pari esimerkkiä ääretönulotteisesta tapauksesta.
Esimerkki 3.12.2 Tarkastellaan samaa vektoriavaruutta C ∞ (R) kuin esimerkissä 3.5.12. Derivointikuvauksella D : C ∞ (R) → C ∞ (R) on ainakin ominaisvektorit eλx , sillä D(eλx ) = λeλx . Siis sillä on ominaisarvoinaan kaikki reaaliluvut λ. Onko sillä muita ominaisvektoreita? Jos f (x) on ominaisarvoon µ kuuluva ominaisvektori, niin D(f ) = µf , toisin sanoen f (x) on dierentiaaliyhtälön y 0 = µy ratkaisu. Tästä seuraa, että f (x) = Ceµx (C ∈ R). (Voi esimerkiksi laskea funktion f (x)/eµx derivaatan ja käyttää integraalilaskennan peruslausetta.) Siis muita ominaisarvoon µ kuuluvia ominaisvektoreita ei ole kuin f (x) = Ceµx (C ∈ R, C 6= 0).
Esimerkki 3.12.3 Mitkä ovat kuvauksen C ∞ (R) → C ∞ (R), f (x) 7→ xf 0 (x), ominaisarvot ja -vektorit?