136 16 14MB
Finnish Pages 240 Year 2010
Pekka Tuominen Todennäköisyyslaskenta I
Limes ry Helsinki 2010 ISBN 978.951-745-156-7
Tämä kirja on ladottu Don E . Knuthin toteuttamalla TEX-ladontaohjelmistolla. Apuna on käytetty Leslie Lamportin suunnittelemaa I5fEX-makrokirjastoa.
Limes ry ISBN 978-951-745-156-7 10. muuttumaton painos 2010 Painopaikka Cosmoprint Oy
Todennäköisyyslaskenta I Pekka Tuominen
To Her Hand in hand we corne Christopher Robin and I To !ay this book in your lap. Say you're surprised? Say you like it? Say it's just what you wanted? Because it's yours Because we love you. (A.A.Milne: Winnie-the-Pooh)
dellä (*) merkittyihin) tekstin osiin. Laskuhalukkuuden kannustamiseksi tehtävien vastaukset on liitetty kirjan loppuun (tosin useimmiten vain likiarvoina). Haluan kiittää kaikkia, jotka ovat lukeneet tämän tekstin ennen julkaisemista ja tehneet siitä arvokkaita huomautuksia. Seuraavat henkilöt osallistuivat kirjan val misteluun tarkistamalla kukin kymmenesosan harjoitustehtävistä: FK Samuli Aalto, FT Pentti Haara, dosentti Tapani Lehtonen, FL Pekka Norlamo, FT Ilkka Norros, apulaisprofessori Esa Nummelin, FT Petri Ola, FL Hannu Rita, FL Eero Saksman ja dosentti Paavo Salminen. Lisäksi tekstiin tutustuivat ja sitä kommentoivat: professori Eija Arjas, FL Erik Elfving, dosentti Gustaf Gripenberg, dosentti Heikki Haario, professori Olli Martio, professori Timo Mäkeläinen, professori Ilkka Niiniluoto, dosentti Martti Nikunen, dosentti Lassi Päivärinta, dosentti Erkki Somersalo, professor Terry P. Speed, apu laisprofessori Klaus Vala, dosentti Esko Valkeila ja apulaisprofessori Kari Y linen. Tekstin latoi IbT#-järjestelmällä Päivi Tapper; Martti Nikunen toteutti tietoko negrafiikan kappaleissa 2.1 ja 5.5; Heikki Haario käänsi laatimani BASIC-ohjelmat MATLAB-kielelle. Kaikille edellä mainituille haluan antaa suurimmat kiitokseni kollegiaalisesta avusta, ystävyydestä ja kannustuksesta! Kirjoittajan toivomus on, että todennäköisyyslaskennan perusteet vähitellen sel kenevät ainakin sellaiselle opiskelijalle,joka riittävän ahkerasti yrittää ratkaista kirjan lukuisia harjoitustehtäviä. Kohtuullista olisi toivoa, ettei sattuisi aivan niin kuin me kaaniselle pianolle seuraavassa sitaatissa Gabriel Garcfa Marquezin teoksesta Sadan vuoden yksinäisyys (WSOY, 1973, suom. Matti Rossi): Jose Arcadio Buendfa ... kävi pianon kimppuun ja hajotti sen pääs täkseen selville siihen kätketystä taiasta. Kaksi päivää ennen juhlia kaikki oli vielä hajallaan. Jose Arcadio Buendfa mellasti koskettimien ja ylimääräisten vasaroiden keskellä kuin suossa,ahtoi paikoilleen seka sortoista kielivyyhteä joka purkautui toisesta päästä ja meni uudestaan kerälle toisesta,ja sai kuin saikin soittopelin korjatuksi siten ettei mikään osa ollut paikoillaan.
Helsingissä lokakuussa 1990 Pekka Tuominen
Esipuhe Tämä kirja on omistettu professori Gustav Elfvingille ( l 908-84). Hän loi normin suomenkielisen todennäköisyyslaskennan kirjallisuudelle (Elfving, G.: Todennä köisyyslaskenta, Otava, 1. painos, 1956) ja vaikutti ratkaisevasti stokastiikan (, kreikk. O'roxa(w-f}m (tähdätä, arvata)) linjan syntyyn Helsingin yliopistossa. Li säksi hän tuotti suuren osan tämän linjan oppimateriaalista. Tämä kirja perustuu Helsingin kesäyliopistossa vuosina 1986-90 pitämiini To dennäköisyyslaskenta I:n luentoihin. Samalla se on kokonaan uudistettu, tiivistetty ja tarkistettu laitos oppikirjasta Tuominen, P Norlamo, P: Tode1111äköisyyslaske11ta (osat I ja 2, Limes ry, 1. painos, 1974). Osa mainitun kirjan struktuurista on säilynyt, kuin uponnut katedraali (la cathedrale engloutie), samoin osa sen esimerkeistä ja haijoitustehtävistä. Todennäköisyyslaskenta on satunnaisilmiöiden tai sarunnaiskokeiden matemaat tista teoriaa. Käsite satunnaiskoe liittyy tiettyihin oletuksiin todellisuuden luonteesta. Satunnaiskokeessa ajatellaan, että kokeen alkutila ei määrää tulosta deterministisesti, vaan väliin tuleva tekijä, sattuma, vaikuttaa oleellisesti kokeen tulokseen. Tässä kirjassa edetään klassisen, symmetriaan perustuvan, lähestymistavan esit telyn (kappale 1.1) jälkeen aksiomaattisesti. Todennäköisyyttä ei varsinaisesti mää ritellä muuten, kuin tietyt hyvin yleiset ehdot täyttävänä joukkofunktiona. Tämän jälkeen esitellään tyypillisiä todennäköisyysmallejaja todennäköisyyslaskennan kes keistä välineistöä: riippumattomuus, satunnaismuuttujat, jakaumat, odotusarvot jne. Todennäköisyyslaskennan aukoton matemaattinen rakentaminen edellyttää mittateo reettista koneistoa, jota tällaisessa esityksessä ei ole mahdollista systemaattisesti käsitellä. Siksi kirjassa onkin useita tuloksia, joiden todistukset on jouduttu sivuut tamaan. Kaikki puuttuvat todistukset löytyvät esimerkiksi kirjasta Elfving, G. Tuominen, P.: Todennäköisyyslaskenta ll (Limes ry, I. painos, 1977). Itse todennäköisyyskäsitteen tulkintaan ei varsinaisesti, filosofisena ongelmana, kajota. Frekvenssiru!kinta (ns. objektiivinen todennäköisyyskäsite) mainitaan täs mällisen matemaattisen tuloksen, ns. Bernoullin lauseen yhteydessä (kappale 3.5). Todennäköisyyslaskennan mallien sopivuus tiettyjen empiiristen ilmiöiden kuvailuun edellyttää näiden mallien hyvyyden koettelemista. Tämä aspekti vaatii matemaattisen tilastotieteen menetelmiä, joihin emme myöskään suoranaisesti ehdi tässä puuttua. Myös todennäköisyyslaskennan historia on miltei kokonaan sivuutettu; yleisesityk siä siitä on löydettävissä hakuteoksista. Todennäköisyyslaskentaan perustuvia mal leja sovelletaan menestyksellisesti uhkapeleissä, vakuutustoiminnassa, tekniikassa ja kaikilla tieteenaloilla: mm. fysiikassa, biotieteissä, genetiikassa, ekonometriassa, käyttäytymi stietei ssä ja yhteiskuntatieteissä. Harjoitustehtävät ovat tekstiosan jälkeen. Niitä on edelleenkin runsaampi vali koima, kuin yhdellä kurssilla on mahdollista käsitellä. Lisäksi on ns. tähtitehUiviä, jotka ovat hieman vaikeampia, teoreettisempia tai liittyvät optionaalisiin (so. täh-
Kirjassa käytetyt merkinnät tn lkm ptnf kf tf sm tngf
todennäköisyys lukumäärä pistetodennäköisyysfunktio kertymäfunktio tiheysfunktio satunnaismuuttuja todennäköisyysgeneroiva funktio
=>
implikaatio ekvivalenssi 0 (kaikilla A c n), P(Q) 1,
ja (4)
AnB= 0
* P(A u B)
P(A) + P(B).
Ominaisuus (4), jota kutsutaan tn:n additiivisuudeksi, seuraa välittömästi lukumäärä funktion vastaavasta ominaisuudesta
A nB
0
* n(A u B) = n(A) + (B).
Ehdoista (2), (3), (4) voidaan helposti johtaa todennäköisyyden muut perusominai suudet. Koska tämä tehdään systemaattisesti kappaleessa l tyydyrnme tässä vain luettelemaan ne P(0) 0 O :s; P(A) :s; 1
P(Ac) = 1 P(A) A C B P(A) $ P(B) P(A \ B) =-c P(A) - P(A n B) P(A u B) = P(A) + P(B) P(A n B).
*
Esimerkki 1.1.5 (Syntymäpäiväprobleema) Millä tn:llä n:n umpimähkään valitun henkilön joukossa ainakin kahdella on sama syntymäpäivä? Ratkaisu. Karkauspäivät unohtaen voimme olettaa, että symmetrisinä alkeistapauk sina ovat kaikki 365 :n alkion n-jonot, joiden lkm on
Luku 1. Todennäköisyys
12 Jos A = "ainakin kahdella on sama syntymäpäivä", on Ac päivä" ja
= "kaikilla eri syntymä
n(Ac ) = 365-364· ··(365-n+ 1) ja siten
P(A) = 1
P(Ac) = l -
365,364 .. ·(365-n+ 1)
365n
_
Laskettaessa P(A) numeerisesti havaitaan esimerkiksi
n 2". 23 => P(A) > O. 5 n> 41 => P(A) > 0.9 n 2". 57 => P(A) > 0.99, yhteensattuman tn on siis varsin korkea jo kohtuullisen pienillä n:n arvoilla.
Esimerkki 1.1.6 (de Meren probleema) Ranskalainen aatelismies de Mere oli in nokas uhkapeluri. Hän havaitsi kokeellisesti seuraavaa: a) Kannattaa lyödä vetoa siitä, että heitettäessä 4 kertaa noppaa saadaan ainakin yksi kuutonen. b) Ei kannata lyödä vetoa siitä, että heitettäessä kahta noppaa 24 kertaa saadaan ainakin yksi kuutospari. De Mere ei kuitenkaan kyennyt teoreettisesti selittämään havaintoaan, joten hän kääntyi Pascalin puoleen (n. 1650). Tämä tapahtuma toimi virikkeenä todennäköi syyslaskennan syntyyn.
13
1.1. Symmetriaan perustuva todennäköisyys
Ratkaisu. a) Käytämme kokeen kuvailuun symmetristä todennäköisyysavaruutta, jonka alkeistapauksina ovat 4-jonot
(xi ilmoittaa siis i:nnen heiton pisteluvun). Tällöin
Jos A on tapahtuma "saadaan ainakin yksi kuutonen", niin
n(A) = 64
54 ,
sillä A: lie epäsuotuisia tapauksia on 54. Siten
P(A) = b) n( Q)
64 - 54
4
'i = 1 - ( �) � 0.518.
3624, alkeistapauksia, joissa ei yhtään kuutosparia, on 3524 . Siten
P(A) =
36 24 3524 35 24 ( ) � 0.491. = 1 36 36 24
Milloin alkeistapaukset ovat symmetrisiä? Alkeistapausten symmetrisyyttä ei voi perustella pelkästään matemaattisesti, vaan sen tueksi tarvitaan havainnollinen käsite "umpimähkäinen valinta". Todennä köisyyden määritelmää kaavalla (1) voidaan pitää jopa kehämääritelmänä: P( A) :n tueksi tarvitaan oletus, että alkeistapaukset ovat "yhtä todennäköisiä". Tilanne ei ole kuitenkaan aivan näin huolestuttava, sillä tn:tä koskevia oletuksia, hypoteeseja, voidaan käytännössä koetella. Tämä edellyttää kuitenkin, että on mah dollista toistaa samaa koetta samoissa olosuhteissa useita (periaatteessa rajattoman monia) kertoja ja että toistot ovat riippumattomia. Esimerkki 1.1.7 Kahta lanttia heitetään. Olkoot w 1 = "ainakin yksi kruunu", w2 = "molemmat klaavoja". Oletus, että w 1 ja w2 olisivat symmetrisiä, on ilmeisellä tavalla väärä. Käytännössä tätä voidaan testata heittämällä kahta lanttia useita kertoja. (Tehkää tämä opintoryh mässä. Jokainen heittää kahta lanttia 10 kertaa, tulokset kootaan.) Jos tarkastellaan w, :n suhteellistafrekvenssiä "w 1 :n esiintymiskertojen lkm" "kaikkien toistojen lkm"
Luku 1. Todenniiköisyys
14
havaitaan, että ko. suhdeluku on lähellä arvoa 0.75. Tämän satunnaiskokeen oikeat symmetriset alkeistapaukset ovat
(0,0), (O,l), (1,0), (1,1) (missä O edustaa kruunua ja 1 klaavaa). Tästä saatava tulosP("ainakin yksi kruunu") = 0.75 pitää yhtä kokeellisten havaintojen kanssa. Kuvassa on tietokonesimuloitu realisaatio, jossa toistojen lkm on 640.
l
1 1
..
500
Esimerkki Ll.8 Tarkastellaan syntyvän lapsen sukupuolta. Oletus, että alkeista paukset w1
"poika", w2
= "tyttö"
olisivat symmetrisiä, ei ole aivan mahdoton. Kuitenkin suurissa havaintoaineistoissa on nähtävissä, että w 1 :n suhteellinen frekvenssi on n. 0.512. Tulosta ei kuitenkaan voida johtaa minkään symmetrian avulla. Tämä havainto myös osoittaa, että yleisen tn-mallin on oltava joustavampi. Kappaleen 1.4 mukaan periaatteessa, mikä tahansa valintaP{wi} = p, P{w2} 1 - p, 0 :S: p S 1, on mahdollinen.
1.2. Todennäköisyyden aksioomat
15
Huomautus 1.1.9 Tulos, että tapahtuman tn on suhteellisen frekvenssin raja-arvo,
kun kokeiden lkm kasvaa rajatta, on ns. Bernoullin lause L.3.5.4 ). Tähän perustuu tn: n frekvenssitulkinta. Kaikissa satunnaisilmiöissä ei ole mahdollista edes periaatteessa toistaa samaa koetta rajatta samanlaisissa olosuhteissa. Tällöin tn:n käsitteelle on annettava erilai nen, ns. subjektiivinen tulkinta: Tn:t kuvastavat "rationaalisen" henkilön uskomuksen asteita väitteen totuuteen käytettävissä olevan aineiston pohjalta.
1.2 Todennäköisyyden aksioomat Tarkoituksena on nyt esittää matemaattinen malli, todennäköisyysavaruus, joka on riittävän yleinen soveltuakseen erilaisten satunnaisilmiöiden matemaattisen käsitte lyn perustaksi. Satunnaiskokeen kuvailussa on periaatteessa aina ensin päätettävä, mitkä ovat kokeen tulosmahdollisuudet, alkeistapaukset. Nämä muodostavat perw,joukon Q. Toiseksi kiinnitämme kokoelman :F O:n osajoukkoja, joita kutsumme iapah twniksi. Tapahtuman A E :F sattuminen tarkoittaa sitä, että kokeen tulos w on joukossa A, ts. w E A. Edellisen kappaleen esimerkeissä oli luonnollista valita .r:ksi n:n kaikkien osajoukkojen kokoelma P( Q). Tämä ei ole yleensä mahdollista; siksi on erikseen asetettava seuraavat ehdot, jotka takaavat kaikkien numeroituvien joukko-operaatioiden luvallisuuden tapahtumien kesken.
.Määritelmä 1.2.1 Kokoelma .r perusjoukon Q osajoukkoja on O"-algebra, jos ((]"A i ) ( uA2) (aA3)
00
A i E :F ( i
1 ) 2, ...)
LJ Ai E :F
i::::: 1
Tapahtuman A todennäköisyys, P(A), on reaaliluku, jonka on oltava yksikäsit teisesti määrätty, kun tapahtuma A E .r on annettu. Toisin sanottuna P on kuvaus ( eli funktio) :F -+ R
.Määritelmä 1.2.2 Kuvaus P : (TN1) (TN2) (TN3)
.r -; lR. on todennäköisyys, jos P(A) 2 0 kaikilla A E :F,
P(n)
l,
(täysadditiivisuus) Jos A; E :F ( i
1, 2, ...) ja
16
A.N.Kolmogorov ( 1903-87)
Luku 1.
1.2.
17
aksioomat
AinAj =0(ifj),niin 00
00
i::::I
i=:I
P(LJ Ai) = LP(Ai). Kolmikko ( n, :F, P) on todennäköisyysavaruus, jos u-algebra ja P : :F --+ IB. on todennäköisyys.
n on ei-tyhjä joukko,
:F on
Todennäköisyyden aksioomat esitti venäläinen matemaatikko A. N. Kolmogorov (1903-87), v. 1929. Teoksessaan Grundbegriffe der Wahrscheinlichkeitsrechnung (1933) [The Foundations ofthe Theory ofProbability (1956)] Kolmogorov osoitti, että nämä aksioomat soveltuvat myös ajassa kehittyvien satunnaisilmiöiden (stokastisten prosessien) teorian perustaksi. Tn-avaruuden käyttö satunnaisilmiön kuvailussa edellyttää, että kokeeseen liittyvät havainnolliset käsitteet "käännetään" joukko-opin kielelle. Seuraavasta taulukosta voi olla apua tärkeimpien vastaavuuksien ymmärtämiseksi. Symboli Kokeessa Satunnaiskokeen tulosmahdollisuuksien eli alkeis tapausten joukko w,wi,wz, .. . Alkeistapaukset Tapahtumat A,B,C, .. . Kaikkien tapahtumien joukko :F n Varma tapahtuma Mahdoton tapahtuma 0 Atai B (tai molemmat) sattuu AUB AnB Aja B sattuvat Aja B ovat toisensa poissulkevia AnB = 0 tapahtumia Ac Aei satu A\B Asattuu, mutta B ei satu AcB Aina kun A sattuu, sattuu myös B Ainakin yksi A1,A2, .. , sattuu
tapahtumista
Kaikki tapahtumat A 1, A2, ... sattuvat
00
i 1 =:
Mallissa Perusjoukko Perusjoukon alkiot Q:n osajoukot u-algebra Q:lla Perusjoukko Tyhjä joukko Yhdiste Leikkaus Aja B ovat erilliset Komplementti Joukkoerotus A on B:n osajoukko Numeroituva yhdiste
CXl
Numeroituva leikkaus
Luku 1. Todennäköisyys
18
1.3 Todennäköisyyden perusominaisuuksia Lause 1.3.1 Olkoon :F o--algebra. Tällöin (i) ( ii)
0EF A, B E :F =} A U B E
A n B E :F, A \ B E :F
n 00
(iii)
Ai E :F ( i
1, 2, ...)
i=I
Ai E
1odistus. (i) Seuraa siitä, että 0 = ne ja Q E :F (aksioomat a- A 1, rr A 2 ). (ii) Valitsemalla A 1 = A, = B ja Ai = 0, kun i � 3, saadaan jono :F:n joukkoja, jolle 00
LJ Ai = Au B.
i=l
Leikkaukselle A kaavasta
n
B väite seuraa aksioomasta
(J'
A2 , edellisestä ja de Morganin
Joukkoerotusta koskeva tulos saadaan edellisestä ja ö'" A2:sta, sillä
A\B
A n Bc .
( iii) V äite seuraa aksioomista ö'" A2 ,
ff
A3 ja de Morganin kaavasta. D
Edellisen perusteella on selvää, että tapahtumien kokoelma on suljettu kaikkien äärellisten ja numeroitu vien joukko-operaatioiden suhteen.
P) todennäköisyysavaruus. Tällöin
Lause 1.3.2 Olkoon (n, (i)
(ii)
(iii)
(iv) (v)
(vi)
P(0)
0,
P(Ac ) l - P(A) kaikilla A E :F, A,B E :F, A n B = 0:::} P(A u B) = P(A) + P(B), 0 � P(A) S: I kaikilla A E :F, A, B E :F, A C B =} P(A) � P(B), A, B E :F =} P(A \ B) P(A)- P(A n B).
(i) Valitsemalla Ai
0 (i
l, 2, ...) saadaan aksioomasta TN3
P(0) = P(0) + P(0) + · · ·
19
1.3. Todennäköisyyden perusominaisuuksia
Ainoa yhtälön toteuttava reaaliluku P(0)on= 0. (iii) Valitsemalla A 1 A, A2 = B ja Ai = 0 (i 2': 3) saadaan aksioornasta TN3
P(A u B)
= P(A) + P(B) + P(0) + P(0) + · · ·
mistä väite seuraa, koska P(0) = 0. (ii)Valitsemalla B = A c saadaan kohdasta (iii)ja aksioomasta TN2
( iv) Aksiooman TN I nojalla P(A) 2:: 0 ja P(Ac )
= 1 - P(A) 2': 0,
mikä sisältää väitteen. (�) Koska A = (A n B)U(A \ B), missä A n B, A \ B E :F (L.1.3.1.(ii)) ja ( A n B)n (A \ B) = 0, saadaan kohdasta (iii)
P(A)
= P(A n B) + P(A \ B).
(v6)Jos A C B, on A n B
A. Kohdasta ('IÅ) seuraa
P(B \ A) = P(B) - P(A). V äite seuraa huomioimalla, että P(B \ A) 2': 0. D Edellisen lauseen kohdalle (iii)saadaan seuraava välitön yleistys. F
Lausel.3.3 JosAi E : (i= 1, ... ,n)ja AinAj ::'.: 0(ifj),niin
Mikäli yhdisteen jäsenet eivät ole erillisiä, kahden tapahtuman yhdisteen tn saa daan seuraavasta Lause 1.3.4 (Yhteenlaskukaava)
P(A U B) = P(A) + P(B) -- P(A n B). Todistus. KoskaAUB = AU(B\A), missäAn(B\A) = 0, seuraaL.1.3.2.(iii):sta
P(A u B)
=
P(A ) + P(B \
A).
Luku 1. Todennäköisyys
20
Kun tähän sijoitetaan L.1.3.2.(vi):n tulos P(B \ A):lle, saadaan väite. D Yhteenlaskukaava voidaan yleistää mielivaltaisen monen tapahtuman yhdisteelle. Ennen kuin esitämme tätä tulosta, johdamrne kaavan kolmelle tapahtumalle:
P(A u B U C)
P((AUB)UC)
P(A U B) + P(C)
P((A U B) n C).
Joukko-opillisen osittelulain mukaan
(A u B) n C
= (A n C) u (B n C).
Soveltaen L.1.3.4:ä kahdesti saadaan
P(A u B u C)
=
P(A) + P(B) - P(A n B) + P(C) - P(A n C) -P(B n C) + P((A n C) n (B n C)) P(A) + P(B) + P(C) - P(A n B) P(A n C) P(B n C) + P(A n B n C).
Lause 1.3.5 (Yleinen yhteenlaskukaava) n
P(A1 UA2 U · · ·UAn) - LP(Ai)- L P(Ai n Aj) + i2. 91
=1
P(Ac ) -- P(A n B)
Esimerkki 1.5.15 (Rencontre- eli yhteensattumisprobJeema) n henkilöä jättää ha tun vaatesäilytykseen. Hatut menevät sekaisin; poistuessaan henkilöt joutuvat ot tamaan umpimähkään valitun hatun. Millä tn:llä ainakin yksi henkilö saa oman hattunsa?
29
1.5. Kombinatoriikkaa
Ratkaisu. Ajattelemme hattujen omistajat numcroiduiksi l :stä n:ään. Kuvailemme koetta symmetrisellä todennäköisyysavaruuclella, jonka alkeistapauksina ovat hattu jen permutaatiot, siis n(i:2) == n!. Olkoon Ak
l, 2, ... , n.
"henkilö k saa oman hattunsa", k
Tällöin A
A i U A 2 U ... U An = ''ainakin yksi saa oman hattunsa".
Sovellamme P(A):n laskemiseen yleistä yhteenlaskukaavaa (L.1.3.5). Alkeista pauksia, joissa henkilö k saa oman hattunsa, on ( n - 1) 1, muiden kuin henkilö k:n hatut saavat jakautua miten tahansa. Siis
(n_�L = n!
n
Alkeistapauksia,joissa henkilöt i ja j saavat omat hattunsa, on (n 2)!, sillä tällöin on jäljellä n - 2 sellaista hattua, jotka saavat jakautua miten hyvänsä. Siis
Vastaavasti alkeistapauksia, joissa henkilöt i 1, i2, ••. , i k saavat oman hattunsa, on (n k)!. Siten
Lopulta alkeistapauksia, joissa kaikki henkilöt saavat oman hattunsa, on J, joten P(A I
l
n ... n An ) = - . n!
Soveltaessamme yleista yhteenlaskukaavaa on huomattava, että summassa, jossa esiintyvät kahden tapahtuman leikkaukset, on(;) termiä, yleisesti sumrnassa,jossa esiintyvät k tapahtuman leikkaukset, on(;) termiä. Saamme siten
P(Ai ) i=I
P(Ai n Aj ) 1 S,i..), jos X :n arvojoukko on {O, 1, 2, ... } ja
P{X
k}
_xk
= e->.. k!
(k = o, 1,2, ...).
Luku 2. Satunnaismuuttujat
54
Huomautus 2.1.17 Poisson(Å)-jakaumaan päädytään binomijakauman rajajakauma na, kun n - oo ja p --. 0 s.e. np -. >.. Tämän nojalla Poisson-jakauman voidaan ajatella sopivan harvinaisen tapahtuman esiintymiskertojen lukumäärän jakaumaksi suuressa populaatiossa, ks. HT 2.12.
Huomautus 2.1.18 Poisson(>.)-pistetn:ksille pätee Pk
,\ k+l
(k=0,1,2 ... ),
jota voidaan käyttääpk:iden numeeriseen laskemiseen (alkuarvonapo e-.x). Siitä näkyy, että k:n kasvaessa Pk kasvaa (vähenee) aidosti, kun k < ). - 1 ( k > ). - 1 ). Suurimman arvon Pk saa, kun
k
[>.].
2.2 Diskreetin satunnaismuuttujan odotusarvo Määritelmä 2.2.1 Jos X on diskreetti satunnaismuuttuja, arvojoukkona {x 1, x2, ••.} ja vastaavina pistetodennäköisyyksinäpk = P{X = Xk}, X:n odotusarvo on luku
edellyttäen, että ko. sarja suppenee itseisesti, so. I:k !xk!Pk < oo. (Mikäli sarja ei suppene itseisesti, sanotaan, että X:llä ei ole odotusarvoa.)
Esimerkki 2.2.2 Jos sm:n X arvojoukko on { x 1, x2, ... , x n } ja jakauma on "tasai nen" so. n
(k=1, ... ,n),
niin
E(X)
l n I:xk;
n k=l
tässä tapauksessa odotusarvo on lukujen x 1, x2, ... , Xn keskiarvo. Esitämme seuraavaksi edellisen kappaleen esirnerkkijakaumien odotusarvot
55
odotusarvo
2.2. Diskreetin
Lause 2.2.3
(i)
X"' Bin(n,p) => E(X) = np,
(ii)
X"' Hyperg(N, K, n)=> E(X)
(iii)
X rv Geom(p) => E(X) =
(iv)
X rv Poisson(..\)=> E(X)
(q =
0.
Lause 2.3.9 Positiivisella sm:lla X on kaavan (1) ilmaisema "muistinmenetysomi naisuus", jos ja vain jos
X jollakin ,\ > 0.
rv
Exp(.\),
60
Luku 2. Salunnaismuuttujat
Todistus. (] 0) Jos X "' Ex p( >.), on P{X > x} = 1 - F(x) =
kaikilla x 2: 0,
e-,\x
ja siten kaavan (1) vasen puoli
P{x > 't
+ h} =
P{X > t}
e -,\(t+h)
e-,\t
= e -,\h
=
P{X
>
h}.
*(2 ° ) Merkitään G(t) = P{X > t}. Määrittelyn nojalla G on v/ihenevä ja tn:n monotonisen jatkuvuuden nojalla (L.1.3.6, vrt. myös L.2.5.4) oikealta jatkuva. Oletuksen (i) nojalla G(O) = 1. On siis olemassa t0 > 0 s.e. G(to) > 0. Ehdosta (ii) seuraa (valitaan t - h = t0 )) G(2t0 )
>
0 ja iteroimalla, ettii
G(nt0) > 0 kaikilla n EN+· G:n monotonisuuden nojalla
G(t) > 0 kaikilla t 2'. 0. Ehto (ii) voidaan siten kirjoittaa
G(t + h) = G(t)G(h) kaikilla t
2: 0,
h > 0.
Tästä seuraa iteroimalla, että
(2)
G(nt) = (G(t))" kaikilla t 2'. 0, n EN+.
Toteamme, että G(1) < 1. Oletuksesta G(1) - l seuraisi G(n) = 1 kaikilla n EN+ ja edelleen että P{X < oo} = l - limn _, G(n) = 0. Merkitsemme 00
missä edellisen nojalla,\ > 0. Yhtälöstä (2) seuraa, että G(r)
= e-.Xr kaikilla r E Q+.
G:n oikealta jatkuvuuden nojalla
G(t) =
e-.Xt
kaikilla t E lR.+·
Siten
F(x) = P{X :":'. x} = l - G(x) kaikilla x E lR.+. D
= 1 - e-.Xx
61
2.3. Jatkuvatjakaumat C. Standardinormaalijakauma Emme voi tässä perustella sitä, miksi tiheysfunktio cp, 1
0), merkitään
jos X- µ
-- rv (T
Lause 2.3.14 X
rv
N(O, 1).
N(µ, cr 2), jos ja vain jos X:llä on jatkuva jakauma, tf:na f,
f(x)
=
1
y"j;ir/
l
- 2
(�)2 (T
X
'
E JR'..
Tällöin X :n kf on F
F(x)
= (X--cr-µ) ,
X E lR'..
Todistus. Toteamme väitteen kf:lle (tf saadaan tästä derivoimalla):
F(x)
X-µ = P{X:::; x} = P{--::;
jos ja vain jos (X - µ)/cr
(T
rv
µ
X
- }(T
- µ) , =
.,
µ.
2.5.
65
teoriaa
Todistus. ( i) E (X)
rb
Ja
b x2 1 1 x = · dx b-a b - a a/ 2
1
=b a -
b2 - a2 2
a+b 2
(ii) Osittaisintegroinnilla
tästä nähdään integraalin suppeneminen ja että
E( X ) = (iii) Jos X
rv
r oo '
Jo
N(O, I), niin E(X)
=
AU
1-:
-Ari!
dx
=
1
>."·
vp(x) dx.
Funktion
z}
{X1 > z} n {X2 > z},
josta
Fz(z) eli yhtäpitävästi
(1
F1(z))(l
F2(z))
Esimerkki 2.6.12 Jatkoa edelliseen esimerkkiin: Tarkastelemme erikoistapausta, jossa Tällöin voidaan ajatella Y:n kuvaavan rinnan ja Z:n sarjaan kytkettyjen komponent tien muodostaman systeemin kestoaikaa
Riippumattomuusoletus saattaa käytännössä olla virheellinen (rinnan kytkennäs sä toisen komponentin vioittuminen voi lisätäjäljelläolevan komponentin kuormitus ta ja siten vaikuttaa sen kestoajan jakaumaan). Esimerkin 2.6.11 tuloksista saadaan: Jos X1 Jl X2, niin Fy (y)
( { _ e··A1Y)(l
e··A2Y)
e->-1v - e->.2Y
+ e-(>.1+>.2)v,
y>O
2.6.
71
ja z
> 0.
Tästä nähdään, että vastaavat tf:t ovat y > 0,
ja z
erityisesti Z ,....., Exp() q
> O;
+ >.. 2). Näistä näemme esim. Y:n ja Z:n odotusarvot
E(Y)
E(Z)
Riippumattomien sm:ien summan tiheysfunktio ' Jos X ja Y ovat riippumattomia, diskreettejä sm:ia, niiden summan Z saadaan kaavasta (vrt. (1) esimerkissä 2.6.10)
(2)
P{Z=z}
LP{X=x}P{Y=z
X+ Y ptnf
x},
missä kullakin z oikean puolen summa kohdistuu vain arvoihin :i:, joille x E
X(.Q), z - x E Y(.Q) Uoita on enintään numeroituva määrä). Käyttäen ptnf merkintöjä P{X = x} = /1(:i:), P{Y = y} = h(y)jaP{Z z} /(z)kaava
(2) voidaan kirjoittaa
f(z) =
L J,(x)h(z
x).
Toimikoon tämä analogiana seuraavaan tulokseen, jonka todistuksen joudumme sivuuttamaan . Lause 2.6.13 Jos X:llä ja Y:lä on jatkuva jakauma tf:ina /1 ja h vastaavasti, niin niiden summan Z = X + Y tf f saadaan kaavasta (3)
f(z)
=
1:
f1(x)h(z
x)dx, . z E Dl.
Kaavan (3) määrittelemää funktiota f kutsutaan /1 :n ja h:n konvoluutioksi, merkitään f
= !1 * h,
Luku 2.
72
Todistus. Sivuutetaan. D Esimerkki 2.6.14 Olkoot X Jl Y, X, Y L.2.6.13:n avulla Z:n tf:n. Nyt f 1 (x)h(z
rv
Tas(O, I)ja Z
= X+ Y. Johdamme
) l {:}0 Esim. 3.9.5). L .2.3.18:n nojalla väite voidaan muokata ekvivalenttiin muotoon
mistä näemme, että riittää osoittaa seuraava väite Y1 "' N(O, r2 ), Y2 "' N(O, 1 ), Y1 Jl Y2 => Y1 + Y2,. ., N(O,r2 + !). Näillä asetuksilla L.2.6.13 antaa (kun merkitään Z = Y1 f
( )
I
joo e _ '
z z = 21rr _
1
t(z-x) 2
+ Y2)
dz.
00
Integraalin sisällä eksponentit yhdistetään ja täydennetään neliöksi; saadaan J z2 l -exp ( ---) ·l' 21rr 2 r2 + 1
missä I
joo exp (- ! (x - :no) 2) dx 2
-oo
To
ja x0 = r2 z/(r2 + !), r0= r/P+f. Luku J on vakiota vaille N(x 0, rJ) jakauman tf:n integraali; huomioimalla tämä vakio saadaan väite. D Lauseesta 2.3.18 ja edellisen lauseen induktiivisesta yleistyksestä saamme
Lause2.6.17 Jos {X1, ••• ,Xn } on riippumaton, (i=l, ... ,n) ja n
X= LciXi i=I
+b
( Ci E lR'., b E JR'.)
74
Luku 2.
niin
missä µ
=
L n
Ciµi
i::::: l
+ b,
.)=} D2 (X)
>.,
(vi) X"' Tas(a,b) =} D2 (X)
(b
(vii) X"' Exp(,\)=} D 2 (X)
2,
a )2 12
= ,\ (viii) X"' N(µ,rr 2 ) =} D2 (X) u2 .
K N-K N n N· N ·N _ I,
Luku 3. Odotusarvo ja muita jakauman tunnuksia
86
Todistus. Väite seuraa Markovin epäyhtälöstä (L.3.1.6) valinnoilla X jaa 1-t k 2 u2 . D
1-t
(X - µ) 2
Määritelmä 3.2.9 Jos X ja Y ovat sm:ia,joilla on odotusarvot E(X) = µ 1, E(Y) µ2, niin X:n ja Y:n kovarianssi on Cov(X, Y)
E((X - µi)(Y - µ2)) E(XY) - E(X)E(Y), kappale 5.4)
edellyttäen, että XY: llä on odotusarvo.
Lause 3.2.10 Olkoot X 1 , ... , Xn sm:ia, joilla on varianssit. Tällöin
L et D (Xi) + 2 L n
2
i=I
Todistus. Merkitään E(Xi)
1$ilPk k
käsittelyä. Koska tähän liittyvät tekniset vaikeudet voidaan välttää, tyydymme vain viittaamaan tuleviin kappaleisiin 3.3 ja 3.6. (vi) Jos X"' Tas(O, 1), niin E(X) f ja
Siten
Yleinen Tas(a, b)-jakauma saadaan tästä muunnoksen
1 12
(b-a)X+a välityksellä (Huomautus 2.3.7 ja L.3.2.5.(ii)). (vii)ja (viii) Jos X rv Exp(.\) tai X,..., N(O, 1)niin E(X2 ) saadaan integraa lina
Kummastakin integraalista selvitään osittaisintegroinnilla; jätämme yksityiskohdat lukijalle. Yleiseen N(µ, !72)-jakaumaan päästään N ( 0, 1)-jakaumasta lineaarimuunnoksen välityksellä (L.3:2.5.(ii)). D
t7X + µ
Lause 3.2.8 (Tsebysevin epäyhtälö) Olkoon X sm, jolla on odotusarvo E(X) ja varianssi D 2 (X) u 2 . Jos O' > 0, niin
P{IX kaikilla k > 0.
µ/
� ku} �
1 k2
µ
varianssin laskeminen indikaattorien avulla
3.3.
87
Tällöin
X =
"tapahtuman A esiintymiskertojen lukumäärä n-ke1taisessa toistokokeessa"
ja siten (Huom .2.1.9) X
rv
Bin(n,p).
Toisaalta, odotusarvon lineaarisuuden nojalla !1.
!1.
E(X)
LE(lA;) == LP(Ai) i=l
i=l
= np.
Varianssin laskemiseksi toteamme, että sm:t 1 A i , ... , 1A n ovat riippumattomia (HT 2.70) ja siten (HT 3.16) 0
(i =f j).
Koska (L.3.2.7( i))
saadaan Lauseen 3.2.10 nojalla
D 2 (X)
= L D 2 (1AJ = npq. n
i=l
Koska odotusarvo (ja näin myös varianssi) riippuu vain sm:n jakaumasta, olemme näin johtaneet yleisen tuloksen
X rv Bin(n,p) =} E(X)
np, D 2(X)
npq,
p. (L.2.2.3(i) ja L.3.2.7( ii) ).
missä q
Esimerkki 3.3.2 Johdamme hypergeometrisen jakauman odotusarvon ja varianssin sopivan indikaattoriesityksen avulla. Tarkastelemme kappaleessa 1.6 esiteltyä otantaa ilman takaisinpanoa. Ajatte lemme valkoiset pallot numeroiduiksi luvuin 1, 2, ... , K ja merkitsemme Ai
X
=
"valkoinen pallo no. i on otoksessa" K
L1A,· i= l
( i= 1, ... ,K),
88
Luku 3.
tunnuksia
Tällöin X
=
"valkoisten pallojen lukumäärä otoksessa"
ja siten (Huom.2.1.13)
X
rv
Hyperg(N, K, n).
Nyt n N'
E( 1 A;)
joten
E(X) Varianssin laskemista varten toteamme, että n(N-n) N2
ja
(N-2) n-2
(:)
(i:/:j),
josta Cov(IA,, 1A;)
n(N-n) l).
= - N2(N
Lauseen 3.2.10 nojalla n(N-n) - K( K N2 K N K . N-n n· . N N N-1 K.
) l·
n(N -n) N 2(N-l)
Saadut tulokset vahvistavat Lauseiden 2.2.3(ii) ja 3.2. 7(iii) väitteet tosiksi.
89
3.4. Muita
3.4 Muita tunnuslukuja Määritelmä 3.4.1 Sm:n X n. 1nomentti pisteen x 0 suhteen määritellään kaavalla E((X
:vot)
edellyttäen, että ko. odotusarvo on olemassa.
Huomautus 3.4.2 Erikoistapauksia momenteista ovat ns. origomomentit (xo E(Xn)
O'.n
µ = E(X))
ja ns. keskusmomentit(x0
E((X - µt).
µn E(X)ja µ2
Näistä erityisesti a 1
= 0)
= D 2(X).
Esimerkki 3.4.3 Laskemme N (0, l )-jakauman origomomentit n O'.
1:
xnip(z)dx.
Integraali on suppeneva kaikilla n EN+. Edelleen, cp:n parillisuuden nojalla an
= 0, kun n
2k
1, k EN+.
Osittaisintegroinnilla saadaan palautuskaava a2k = (2k josta (alkuarvona ao
= l) saadaan induktiivisesti
a2k=1·3·5···(2k erikoisesti a:2
1 )a2k-2
1, a4
1),
kEN+;
= 3, a6 = 15 jne.
Fraktiilit Määritelmä 3.4.4 Olkoon O
J.
funktio
3.6.
95
Exp-jakauma
Kruunujen lkm
x = -log( 1-rand( 10000, 10); sumx = surn(x); cumsum(surnx) ./ ( 10000*[ l: l OJ)
x rand( 10000, 10); sumx sum(x G(t) = (pt + qt,
rv
Geom(p) =} G(t)
=
Poisson(,\)=} G(t)
Todistus. (i) Kun P k
1 , ltl < , qt q
= e >. (t-l),t E JR.
(;)p kqn-k , k
G(t) = (ii) Valinnalla Pk
l
p
t
kc:=O
t E R
(;) p
= 0, 1,... ,n on (L.1.5.18)
k n k k q - t
= (pt + qr.
= pq\ k E N, saadaan geometrisen sarjan summana G(t)
kun lqtj < 1 eli ltl < ql. ( iii) Kun Pk = e->. ). k / k !, k E N, saadaan eksponentti funktion sarjakehitelmän avulla
G(t) kaikilla t E JR. D Tngf:t osoittautuvat hyödylliseksi apuvälineeksi tn-laskennassa, mm. siksi, että niitä voidaan käyttää • momenttien laskemiseen, • riippumattomien sm:ien summan jakauman määrittämiseen, • rajajakaumien määrittämiseen.
Momenttien laskeminen Lause 3.6.4 Oletetaan, että N-arvoisen sm:n X tngf G on olemassa välillä ( -1 5, 1 + 5), 5 > 0 . Tällöin
(i) G'(I) = E(X) (ii) G"(l) E(X(X
l)),josta
D 2 (X) = G"( 1) + E(X)- (E(X))2 .
3.6.
97
funktio
Todistus. ( i) Suppenevana potenssisarjana G voidaan derivoida termeittäin ja
Lk 00
G'(t) Sijoittamalla tähän t
pk t
k =I
k
t E ( 1 - 8, 1 + 8).
-l,
l saadaan
G'(l)
Lk 00
=
pk
k=l
= E(X).
( ii) G:n 2. derivaatalle pätee
= L k(k 00
G"(t)
l)pk t k - 2 ,
k =2
tE (1
8,1+8),
mistä väite seuraa samoin kuin kohdassa ( i). Varianssin johtamiseksi käytetään lopulta tuttua yhteyttä (L.3.2.3)
D 2 (X) = E(X ) - (E(X)) . 2
2
o
Esimerkki 3.6.5 Jos X "' Geom(p), niin (L.3.6.3( ii))
G(t)
=
p ' 1qt
ltl
l
< q-.
Tästä
G'(t) G"(t) Sijoittamalla t
pq
(1 - qt) 2 ' (1
2pq2
qt) 3.
1 saadaan
E(X)
G'(1)
q p
ja
D 2 (X)
2
2
q
q +2 p
p
q2 2 -p
q (q
+ p)
2 p
q p
2.
Näin tuli Lauseen 2.2.3 väite ( iii) uudelleen verifioiduksi ja Lauseen 3.2.7 väite ( iv) tarkistetuksi.
98
Luku 3. Odotusarvo ja muita jakauman tunnuksia
Jakaumien yhteenlaskuominaisuuksia Lause 3.6.6 Jos X ja Y ovat N-arvoisia sm:ia tngf:ina G x ja G y vastaavasti, niin X Jl Y => G x+Y = G x · G y . Todistus. Tämä tulos on jo ennakoitu Esimerkin 2.6.10 kaavassa (1). Toisaalta sille saadaan välitön todistus lähtien tngf:n esityksestä (2): Gx +y(t)
1
E(tx+Y ) = E(txtY ) 1 E(tx )E(ty ) = G x (t)G y (t).
D
Esimerkki 3.6.7 Toteamme seuraavan binomijakauman yhteenlaskuominaisuuden X rv Bin(n,,p) Y rv Bin(n2,P) } =>X+ Y "'Bin(n, X Jl y Tämä seuraa välittömästi siitä, että G x (t)
+ n2,p).
= (pt + qr, Gy (t) = (pt + qt2 ja
Esimerkki 3.6.8 Johdamme uudestaan Esimerkin 2.6.10 tuloksen: Poisson(.X 1) Y Poisson(.X2) X Jl y
X
rv
rv
}
=>X+ Y
rv
Poisson(.X,
+ .X2 ).
Tngf:ien avulla tulos on välitön seuraus siitä, että
Esimerkki 3.6.9 (de Moivren probleema) Noppaa heitetään n kertaa. Millä tn:llä pistelukujen summa on s (n � s � 6n)? Ratkaisu. Jos I. on kaikkien sellaisten luonnollisten lukujen 6 -jonojen (n,, ... , n6) joukko, että
niin kysytty tn on (ks. Esim.1.6.5)
3.6.
99
·vn funktio
Osoitamme nyt tngf:ien avulla, miten kyseinen summalauseke saadaan laskukelpoi seen muotoon. Yhden nopanheiton pisteluvun tngf on 1
G(t)
1
-t +
6
6
t I 6 1
t6
+ ... + -l t6 6
t
n:n pisteluvun summan S tngf on siten (L.3.6.6:n yleistys n:lle riippumattomalle yhteenlaskettavai le)
Kun Gs kehitetään polynomiksi Gs(t)
=P
n
+ · · · + P t" + · · · + P6nt
n
t
s
6n
,
kysytty tn on l8 :n kerroin Ps · Gs:n osoittajan kehitelmä on (Newtonin binomikaava)
Nimittäjästä saadaan (Newtonin binomisarja)
(1
t)-n
= � (n+ k 1 1) tk . n-
L., k=O
Saijojen kertosäännön nojalla
p.
=
1 6n
1 ) i (n)
� ( L.,
n+6i+k=s
= __!_ � ( 6n L., i=O
l)
k
(n + k
n- 1
1)
i (�) (s -n 6i- -1 l) . i
Esimerkki 3.6.10 (Lastenlasten lkm:n jakauma) Oletamme, että suvun kantaisän lasten lukumäärä on N-arvoinen sm Y, jonka tngf on G, ts.
G(t)
00
Pk
P{Y
k}.
Oletamme, että jokainen kantaisän lapsista saa lapsia satunnaisen määrän Y;;, jotka kaikki jakautuvat kuten Y, ts.
,..., y
100
Luku 3.
tunnuksia
ja että {Y, Y1, Y2, ... } on riippumaton. Tällöin kantaisän lastenlasten lkm Z voidaan ki1joittaa sumrnana y
Z=Ll'i· i=l
Tilannetta voidaan havainnollistaa sukupuun avulla
4
Z-7
Lähdemme esityksestä
t
z
oo
k} t I: ] {Y =
Yi +· .. +Y;;
'
k=O
josta saadaan (huomaa riippumattomuuden käyttö ja oletus Yi "' Y odotusarvoa otettaessa)
G z (t)
=
E(tz )
L P{Y = k}(E(t 00
Y
)t
b::O
00
LPk (G(t))k
k=O
G(G(t)).
(Yllä odotusarvon ja sarjan summan järjestyksen vaihtaminen vaatisi perustelun. Perustelu voidaan nojata siihen, että termien itseisarvojen osasummat on rajoitettu vakiolla 1, kun itl � 1 ).)
funktio
3.6.
101
Saatu tulos, ts. G o G,
Gz
sisältää lastenlasten lukumäärän Z jakauman (tosin implisiittisessä muodossa). Z:n odotusarvo ja varianssi voidaan johtaa suoraankin (Harjoitustehtävä 3.29): laskemme ne tässä tngf:ta käyttäen. Nyt G'.z(t) = G'(G(t))G'(t) joten (huomaa, että G( l)
E(Z)
1) 2 2 (G'(1)) = (E(Y))
2
µ .
Toisen kerran derivoimalia ja sijoittamalla t = I saadaan sievennyksen jälkeen
D 2 (Z) missäµ
E(Y),
(J'
2
ff
2
µ(l
= D 2 (Y).
+ µ),
Esimerkki 3.6.11 (* Bienayme-Galton-Watson-prosessi) Ajatellaan edellisen esimerkin sukupuuta jatketuksi samojen periaatteiden vallitessa. Merkitään
ja yleisesti Zn
"n:nnen polven jälkeläisten lkm".
Saatua sm-jonoa (Zi , Z2 , ••• ) kutsutaan haarauturnisprosessiksi tai Bienayme Galton-Watson-prosessiksi. Yleistämällä edellinen päättely induktiivisesti todetaan, että GoGo .. ,oG. � n kpl Erityisen mielenkiintoinen on kysymys sukupuuttoon kuolemisen tn:stä 11'
P{Zn
= 0 jollakin n}
Jim P{Zn
n-+oo
= O}.
Zn :n tngf:n avulla voidaan osoittaa, että 1r on yhtälön
G(t)
=t
pienin juuri välillä [O, 1 J. Tästä voidaan päätellä edelleen, että µl->1r1
µ 5, I Tarkastellaan erikoistapausta, jossa 1
.
Y "'Bm(3, ). 2 Tällöinµ= 1.5, G(t) = (it
+ !)3 ja yhtälön G(t) = t
juuret ovat t = 1, t = - 2 ±
v'S. Tässä tapauksessa sukupuuttoon kuolemisen tn on = v'5 2 � 0.236.
1r
Jos Bin(3, !)-jakauman sijasta jälkeläisjakauma on Poisson(1.5)-jakauma, 1r on yh tälön el.5(t-1)
=t
pienimpänä juurena välillä [O, 1] 1r �
0.417.
Jos jälkeläisjakauma on Geom(j) (jolloin myösµ= 1.5), yhtälöstä 2 5
=t 1 - �51 t saadaan 1r
2 = 3
;:::; 0.667.
Bienayme-Galton-Watson -prosessin rajoitus stokastisena kasvumallina on sen ole tusten jäykkyys (iälkeläisjakauma pysyy koko ajan samana, riippumattomuus ja väes tön koon aiheuttaman säätelyn puute.)
103
3.6. Todennäköisyysgeneroiva funktio
Esimerkki 3.6.12 (Poisson-prosessi) Osoitamme seuraavaksi, että tietyin varsin yleisin oletuksin Poisson-jakauma soveltuu aika-akselille satunnaisesti sijoitettujen pisteiden jakaumaksi. Pisteiksi voi havainnollisuuden vuoksi ajatella esimerkiksi asiakkaiden saapumishetkiä palvelupisteeseen (tietystä ajanlaskun alkuhetkestä t = 0 lukien). Merkitsemme X (Li):lla aikavälilleLi C IB.+ sattuvien pisteiden lukumäärää. Ole tamme pisteiden satunnaisesta sijoittelusta seuraavaa:
(i) X(Li):n jakauma riippuu vain aikavälinLi pituudestal!il ("stationaarisuus") (ii) josLi 1 , L'i2 , . .. ovat erillisiä aikavälejä, sm:t X(Li 1), X(Li 2), ...ovat riippumat tomia ("riippumattomat lisäykset"),
(iii) on olemassa vakio>, > 0 s.e., kunl!il
= h,
P{X(Li) 2: 1} = >.h + hc(h) ja P{ X (Li) > 1} = he: ( h), missä c:(h) tarkoittaa jäännöstermiä, jolle c:(h)-0, kunh---,0. Olkoon l!il = t > 0. Jaamme välin Lin:ään yhtäpitkään, erilliseen osaväliin L'i 1 , L'i 2 , ..., fin . Tällöin X(Li) =
L X(Li )• n
k
k=I
Oletuksen (i) nojalla kaikilla X(Li k) on sama jakauma ja näin myös sama tngf; merkitään sitä Gn :llä. Oletuksesta (iii) seuraa, että
t
ja
t
Siten (merkitsemme nyt Gn :n vapaata muuttujaaz:lla) Gn (z)
t
P{X(Li k) = O} = 1- >.- + -c(-), n n n t t t P{X(Li k) = 1} = >.- + -c(-), n n n t t P{X(Li k) > 1} = -c(-). n n
t
t
t
t
= 1- >.- + >.-z + -c:(-) + r(z), n
n
n
n
missä kaikillalzl S: 1 lr(z)I � P{X(Li k) > 1}
t n
t n
= -c:(-).
tunnuksia Luku 3. Odotusarvoja nwitajakaunwn -----
104
Koska X (i:\):n summaesityksessä yhteenlaskettavat ovat riippumattomia (oletus (ii)), saamme (L.3.6.2:n induktiivisen yleistyksen nojalla) X(i:\):n tngf:lle esityksen >.t
t
t
G(z) = (Gn(z)t = ( 1 + (z - 1) + n-€( )) n n
n
Tämä on voimassa kaikilla n E N+. Antamalla n -+ oo (yhtälön vasen puoli ei riippu n:stä) näemme, että G(z) =
/·t(z-1)
(lzl �
I).
Tästä seuraa, että li:\I
t =;, X(L\)
rv
Poisson(>.t).
Vakiota ). kutsutaan Poisson-prosessin intensiteetiksi. Intensiteetillä on lokaalisen tulkinnan
P{X(L\) � 1};:;;; >.li:\I, kun l!il on pieni lisäksi globaalinen tulkinta E(X(i:\))
>.li:\I,
ts. intensiteetti on pisteiden keskimääräinen lkm aikayksikössä.
Huomautus 3.6.13 Edellä osoitettiin, että ehdoista ( i), (ii) ja (iii) seuraa, että pis teiden lkm:n jakauma t:n pituisellä välillä on välttämättä Poisson(>.t). Sen totea minen, että (i), (ii), (iii) täyttävä stokastinen prosessi todella on olemassa vaatii voimakkaampia apuneuvoja. Voidaan osoittaa, että Poisson-prosessin pisteiden väliajat ovat riippumattomia, Exp(,\)-jakautuneita sm:ia. Poisson-prosessi voidaan yhtä hyvin määritellä R+:n asemesta myös esimerkiksi tasossa JR:.2 (-+ HT 5.35).
Tngf ja rajajakaumat Lause 3.6.14 Olkoot X, Xi , X2, ... N-arvoisia sm:ia,joiden tngf:t ovat G, G i, G2, ... vastaavasti. Tällöin Gn(t) -+ G(t) jos ja vain jos
kaikilla t E (-1, 1),
105
3.6. Todennäköisyysgeneroiva funktio so. P{Xn = k}-, P{X = k}
kaikilla k E N,
kun n-, oo. Todistus. Todistus on puhtaasti analyyttinen (eikä kovin vaikea); sivuutamme sen. D Esimerkki 3.6.15 Osoitamme tngf:ien avulla ennestään tutun tuloksen (HT 2.12): Jos Xn "' Bin(n, Pn ) ja n· Pn -, >. > 0, kun n -, oo, 111111
Xn Todistus. Merkitsemme A n
-,
d
Poisson(>.).
= npn . Xn :11 tngf:lle Gn pätee (L.3.6.3(i))
Tämän raja-arvo (kun n -, oo) on
G(t)
= /·(t-i)
(kaikilla t E
JR).
V äite seuraa siten Lauseesta 3.6.14. D Käytännössä tämä merkitsee sitä, että, jos n on suurijap on pieni, Bin(n, p)-jakauman pistetn:ksiä voidaan approksimoida Poisson-jakaumalla, jonka parametriksi valitaan >.
= np.
Vertaamme seuraavassa taulukossa tuloksia tapauksessa n = 10, p = 0.1. k 0 1 2 3 4 5 6
X
Bin(I0,0.1) P{X = k} 0.349 0.387 0.193 0.057 0.011 0.0015 0.0001
rv
X
rv Poisson(1) P{X = k} 0.368 0.368 0.184 0.061 0.015 0.0031 0.0005
106
Luku 3. Odotusarvo ja muita jakauman tunnuksia
3. 7
Gammajakaumat
Tässä kappaleessa esittelemme jakaumaperheen, jonka tiheysfunktiot ovat muotoa X> 0, missä r > 0, >. > 0 ovat vakioita. Vakion c saattamiseksi käyttökelpoiseen muotoon tarkastamme aluksi Eulerin gammafunktiota. Määritelmä 3.7.1 Gammafunktio määritellään kaavalla (r > 0). Määritelmä tietenkin edellyttää, että yo. integraali todetaan suppenevaksi kaikilla r > 0. Tämä sujuu vaivattomasti erottamalla tapaukset O < r < 1 ja r � 1. Integraali ei suppene, kun r = 0. Lause 3.7.2 (Gammafunktion ominaisuuksia) ( i) f'( 1) - 1, (ii) f'(n) = (n - 1)! (iii) f'(r + 1) (iv )
!
00
Jo
(n EN+),
= rf'(r)
x r -l e -,\"'dx
=
(r > 0), f'(r) >.r
(r > o,>. > 0).
Todistus. (i) Selvä. (iii) Osittaisintegroinnilla
Antamalla tässä a - 0 + ja b - oo saadaan väite. (ii) Seuraa induktiolla kohdista (i) ja (iii). (iv ) Saadaan tekemällä sijoitus y = >.x integraalissa. D
107
3. 7. Gammajakaumat
Gammajakauma Määritelmä 3.7.3 Sm X on gammajakautunut parametrein r > 0, ). > 0, merki tään
X rv Gamma(r, >.), jos X:llä on jatkuva jakauma tf:na ).r
- ->."' f(x) = r t r le , (r
X
> 0,
(ja f( x) = 0, kun x s; 0). Lauseen 3.7.2 kohdan (iv) nojalla f tosiaan kelpaa tf:ksi. Kuva Gamma(r, 1 )-jakauman tf r:n arvoilla 1, 2, ..., 6. f(x)
r=l
12
X
Lause 3.7.4 Oletetaan, että X "" Gamma(r, >.). Tällöin r
:X'
(i)
E(X) =
(ii)
k E(X ) =
r D 2 (X)= >.2,
r(r+l)··-(r+k-1) >. k ).
(iii)
cX"" Gamma(r, -) C
(k EN+),
(c>O).
Todistus. (ii) L.3.7.2(iv):n nojalla k)
E(X
).r ( o = r(r) J
00
1 ->.a:
x kxr - e
;. r r(r+k) x d = r(r) ).r+k .
108
Luku 3. Odotusarvo ja muita jakauman tunnuksia
Soveltaen toistuvasti L.3.7.2:n kohtaa (iii) saadaan r(r + k)
(r
+k-
1)(r + k - 2) · .. rr(r),
mistä väite seuraa. ( i) Sijoittamalla kohtaan ( ii) k= 1, k= 2 saadaan r
E(X)
�,
Tästä
r (E(X))2 = Å2.
(iii) Harjoitustehtävä. D Lause 3.7.5 Jos X
rv
Garnma(r1, Å) ja Y X+ Y
rv
rv
Gamma(r1
Todistus. Lauseen 2.6.13 nojalla summan Z f(z)= Sijoituksella t
,,\ r 1+r2
r(r1)r(r2)
Gamrna(r2, ,,\) ja X Jl Y, niin
e->.z
1z :1:" o
+ r2, ,,\). X 1-
+ Y tf on (kun z > 0)
1( z
x)"2-1dx.
= x/z tämä muuttuu muotoon f(z)
missä
Vakion c määrittäminen ei tässä ole olennaista (esim. pintaintegraalien avulla voidaan osoittaa, että se on -r(r1J+._ ' HT 3.57) sillä jo J:n muodosta voimme päätellä, että r2 ) Z
rv
Gamma(r1 + r2,A).
D
Eksponenttijakautuneiden sm:ien summat Sijoittamalla r= l gammajakauman tf:n lausekkeeseen saadaan tuttu Exp ( ,,\ )-jakau man tf X> 0.
Siis Exp(.;\) = Gamma( 1, ,,\). Lauseesta 3.7.5 saadaan induktiivisesti
3. 7. Gammajakaumat
109
Lause 3.7.6 Jos {X 1, ••• , Xn } on riippumaton ja jokaisen X;:n jakauma on Exp(>.), niin n
= Lxi
Sn
rv
Gamma(n,>.),
i=I
ts. summan Sn tfon fn(x )
n
A. -, X n-1 e ->.x ' = (n - !)!
x>O
n EN+.
x 2 -jakaumat Lause 3.7.7 Jos {X 1 , •.• , Xn } on riippumatonja jokaisen X;:njakauma on N (0, 1 ), niin neliösummalle x2
n
= Lxl i=I
pätee
�
x-
rv
Gamma
(n 1) 2, 2
ts. x2 :n tfon
f(x)
1
-x2 = 2Tr-(?)
!!._J
e
-f
,
X> 0.
Todistus. Xf:n tfon johdettu esimerkissä 2.7.2, siitä nähdään, että
�
X1
rv
Gamma
( 1 1) 2, 2
Tämän jälkeen väite seuraa induktiolla Lauseesta 3.7.5. D Huomautus 3.7.8 Lauseessa 3.7.7 esiintyvääjakaumaa kutsutaan tilastotieteessä x2jakaumaksi vapausasteluvulla n, merkitään x;; siis 2
Xn
(n 1)
= Gamma 2, 2
110
Luku 3. Odotusarvo ja muita jakauman tunnuksia
Esimerkki 3.7.9 Olkoon {X 1 , • • • , Xn} otos N(µ, 0' )-jakaumasta (ts. sm:t ovat riippumattomia ja Xi "" N(µ, 0' ) kaikilla i = 1, ..., n; v1t. Esirn.3.4.7). Tällöin otoskeskiarvolle 2
2
pätee -
2
X"" N(µ,:). Merkitään otosvarianssia symbolilla V, so.
V=
1� -2 - L..,(Xi - X) n i=I
Tällöin X lL V ja nV 0'2
- rv
ry
X-n -1 ·
Perustelu vaatii kuitenkin tämän kurssin ulkopuolelle jääviä menetelmiä.
3.8 Järjestetty otos (*) Olkoon X1, ... , Xn riippumattomia ja samoin jakautuneita. Oletamme yksinkertai suuden vuoksi, että Xi ,.._, Tas(O, 1)
(i=1, ... ,n).
Voidaan osoittaa, että P{Xi = Xj jollakin i /:: j} = 0. Olkoot X( i), ..., X(n) sm:t Xi suuruusjärjestyksessä, ts.
Kutsumme jonoa (X( 1 ), ••• , X(n)) järjestetyksi otokseksi (Tas(O, 1 )-jakaumasta). Erityisesti
111
3.8. Järjestetty otos(*)
Sm:n X(k) , k = 1,..., n, jakauman johtamiseksi merkitsemme annetulle x E (0, 1) Na, = "niiden Xi lkm,joille pätee Xi � x". Koska P{Xi � x} = x ja X;:t ovat riippumattomia,on Na,
rv
Bin(n,x).
Edelleen,koska {X(k) ::S:
:z:} ={N,,, � k},
saamme X (kf n kf:lle F(k) esityksen F(k) (x) = P{Na, � k} =
t
i x t- .
(7)xi (l
,=k
Derivoitaessa tämä havaitaan melkein kaikkien termien kumoutuminen (tarkista!); X (kf n tf:ksi f(k) saadaan - I') X k-1(] f,(k) ( X ) = n (nk _
n-k
- X)
(0 . -+ oo. X:n karakteristinen funktio on (ks. Huom. 3.9.3 ja L.3.6.3) .(eit- 1))
ja siten (L.3.9.4( iv)) .(/fi - 1)).
116
Luku 3. Odotusarvo ja muita jakauman tunnuksia -----
missä e(h)
---t
0, kun h
---t
0, nähdään, että
(
. -, oo, t2 e xp(--) 2
kaikilla t E K
Lauseen 3.9.9 nojalla saamme seuraavan tuloksen: Jos X"' Poisson(,;\), niin
X - >.
kun>.
---t
oo.
-;J N(O, 1),
Luku4
Keskeinen raja-arvolause 4.1
Keskeinen raja-arvolause, normaaliapproksimaatio
Esitämme erikoistapauksen keskeisestä lauseesta, jonka mukaan hyvin yleisillä ole tuksilla riippumattomien sm:ien summan jakauma lähestyy normaalijakaumaa, kun yhteenlaskettavien lukumäärä kasvaa. Lause 4.1.1 Olkoon X 1 , X2, ... jono riippumattomia ja samoin jakautuneita sm:ia, joilla on varianssi. Merkitsemme E(Xi)
= µ,
Jos cr > 0, niin standardoidulle summalle
Zn _ Sn - E(Sn) _ Sn - nµ - o-fo D(Sn) pätee
Zn--, N(O, !), d
so. kaikilla x E ]ff,., kun n - oo.
Luku 4. Keskeinen raja-arvolause
118
Todistus.(*) Käytämme todistukseen karakteristisia funktioita. Kirjoitamme
l
�X* k> L.,
k::::I
missä xz (Xk - µ)Ja. Koska E(X,:) ristiselle funktiolle0
:
n
LE ((xk - µk)21{1 Xk -µk l�e:an }) -+ 0,
k=l
kun n-+ oo,
on riittävä sille, että Sn -E(Sn) -+ N(O ' 1) ' d D(Sn ) kun n -+ oo. Tuloksen todisti ensimmäisenä (käyttämättä karakteristisia funktioita) suomalainen J .W.Lindeberg 1922.
121
4.2.
Esimerkki 4.1.6 On helppo nähdä, että keskeinen raja-arvolause ei päde kaikille .... Jos esimerkiksi riippumattomille jonoille X1, Xk
"'
(�k ) ,
Poisson
niin (Esimerkin 2.6.10 induktiivinen yleistys) Sn · .. , "-'n 1 m1ssa "n = Lrk= 1 2 k
rv
Poisson(>.n),
2�. Tästä seuraa, että Sn-+ X, d
missä X "' Poisson( l ), ja edelleen, että
Sn - E(Sn ) D(Sn )
---t
d
X
1.
4.2 Diskreettien jakaumien approksimointi Lause 4.2.1 (de Moivre-Laplace) Jos Xn
rv
Bin(n,p), niin
Xn - np - N(0, 1 ) , ,/nprj d kun n - oo (q
=
1
p).
Todistus. Väite riippuu vain sm:ien Xn jakaumasta; voimme siten olettaa, että Xn on peräisin toistokokeesta ja (vrt Esim.3.3.1) Xn =
n
L lA ,
k=I
k
missä yhteenlaskettavat ovat riippumattomia ja samoin jakautuneita. Koska E(Xn} ..jniiq, väite palautuu Lauseeseen 4.1.1. D np ja D(Xn )
Huomautus 4.2.2 Kun approksimoitava sm X on Z-arvoinen (kuten binomijakau man tapauksessa), saadaan yleensä parempi tulos, kun tapahtuma
{X:::; k}, kirjoitetaan
k E Z,
122
Luku 4. Keskeinen raja-arvolause
vastaavasti tapahtuma
kirjoitetaan
{k 1
-
1
2
:S X S k2
1
+ 2}.
Tätä operaatiota sanotaan jatkuvuuskorjaukseksi. Esimerkki 4.2.3 Lanttia heitetään 10 kertaa. Olkoon X kruunujen lukumäärä. Mää ritä
P{X S k},
k = 0, 1, ..., 10
a) tarkasti,b) normaaliapproksimaatiolla. Ratkaisu. a) X
rv
Bin( 10, 1 ), joten
P{X:Sk}
=
k
�
(10) 1
i=O
b) Nyt E(X)
P{X S k}
i
210
·
= 5 ja D(X) = y1,joten =
P{X S k +
= p {-X_-_5
t}
< _k _+_,1"=-�5 }
A - A
"' "'
(k
+ 1- 5)
A 5 2
Vertaamme tuloksia seuraavassa taulukossa
(iatkuvuuskorjaus) (standardointi)
(normaaliapproksimaatio)
123
4.2.
P{X s; k}
k
3 4 5 6 7 8 9
tarkka 0.0010 0.0107 0.0547 0.1719 0.3770 0.6211 0.8281 0.9453 0.9893 0.9990
10
l
0 1
2
normaaliapproksimaatio 0.002 0.013 0.057 0.172 0.377 0.623 0 .828 0.943 0.987 0.998 J.000
Huomautus 4.2.4 Esimerkin 4.2.3 approksimaatiot ovat hyviä. Tähän osaltaan vai kuttaa Bin( 10, )-jakauma symmetria. Sen sijaan, jos p on pieni (tai lähellä ykköstä) normaaliapproksimaatio voi antaa karkean tuloksen. Esimerkiksi, jos
1
X
rv
Bin{lO,
Jti),
niin
P{X � J} = 0.736. Normaaliapproksimaation antama tulos on
6 � (vffo)
0.702.
Parempi tulos tässä tapauksessa saadaankin Poisson( l )-jakaumalla. (ks. Esim. 2.6. I 5).
Esimerkki 4.2.S Noppaa heitetään 20 kertaa. Millä tn:llä pistelukujen summa S on välillä 60 ... 80? Ratkaisu. Tälle tn: lie saataisiin tarkka arvo summalausekkeena (ks. Esimerkki 3.6.9). Sen sijaan tyydymme likiarvoon, joka saadaan normaaliapproksimaatiolla. Kirjoite taan
(Xi on i:nnen heiton pisteluku), missä X;:t ovat riippumattomia ja samoin jakautuneita. Koska (ks. Esim.2.2.4)
E(Xi )
7
2'
35
D 2( Xi ) = 12,
124
Luku 4. Keskeinen raja-arvo1a11se
on
2 D (S)
E(S)=70, Siten
= 20_ 3125 =
5 17
3
P{ 60 � S � 80} = P{59.5 � S � 80.5}
P{
Uatkuvuusko1jaus)
10.5 S-70 10.5 } --< -
0, q > 0, p + q < 1. Olkoon edelleen
X= "A:n esiintymiskertojen lkm", Y = "E:n esiintyrniskertojen lkm".
Tällöin .. Pik = P { X = iJa Y = k}
n! . pi qk(1 -p - q )n-i-k i!k!(n -z -k)!
= .
kaikilla i E N , k E N, joilla i+ k ::::; n. Asetelman nojalla on selvä, että reunajakau mat ovat binomijakaumia, täsmällisemmin X"" Bin(n,p), Y ""Bin(n, q).
130
Luku 5. }(aksiulotteiset jakaumat
Tämän jälkeen voidaan todeta (tarkista laskemalla!), että myös ehdolliset jakaumat ovat binomijakaumia. Esimerkiksi (YIX
i)"-'Bin(n-i,
1
q
). p
Siten
E(YIX= i)
(n i)
1-p
5.3 Jatkuvat kaksiulotteiset jakaumat Määritelmä 5.3.1 Sm-parilla (X, Y) on jatkuva jakauma, tiheysfunktiona (tf) f, jos
P{(X, Y) E B} = // f(z, y) dz dy B
kaikilla (Borel-joukoilla) B C R 2 . Huomautus 5.3.2 Funktio f : R 2 --; R on tiheysfunktio, jos ja vain
(i)
f(z, y) 2:: 0, f on integroituva yli R 2:n ja
(ii)
jj f(x, y) dz dy = 1.
R2
Jatkuvanjakauman kf F saadaan tf:sta kaavalla a2 F J(:c, y) = åzåy
'y),
melkein kaikilla ( z, y) E Jl�. 2 . 1 Jos (X, Y):njakauma onjatkuva, X :nja Y:njakaumat ovat jatkuvia; niiden tf:t, joita tässä tapauksessa kutsutaan reunatiheysfunktioiksi, saadaan kaavoista fx('�) = fy(y)
1_: 1_:
E R,
f(z,y)dy,
X
f(x,y)dx,
y E R.
1Tämä tarkoittaa, että ko. derivaatta on olemassa ja yhtyy tf:on mahdollista nollamittaista poikkeus
joukkoa N E B2 lukuunottamatta. Se, että N on no!lamittaincn tarkoittaa sitä, että jokaisella e > 0 on olemassa N:n peite avoimien välien numeroituvalla yhdisteellä B, s.e. B, :n välien yhteenlaskettu pinta-ala on � e
5.3. Jatkuvat kaksiulotteiset jakawm1t ------
131
Lause 5.3.3 Jos (X, Y): llä on jatkuva jakauma tf:na f, niin X ja Y ovat riippumat tomia, jos ja vain jos
f(rc, y) = fx(rc)fy(y). Todistus. Perustuu Lauseeseen 2.6.5. D Esimerkki 5.3.4 Jos X Ji Y ja X "' Tas(O, 1 ), Y "' Tas(O, 1 ), niin L.5.3.3:n nojalla sm-parin (X, Y) tf f on
f(:c, y)
1, { 0,
kun (:c, y) E A , muulloin,
missä
A = (0, I) X (0, 1) = {(:c, y) E R2 JO< :c < 1 ja O < y < 1 }. T ämä jakauma on tasainen yksikköneliössä A (ks. Esim.5.3.5 alla).
Esimerkki 5.3.5 (Tasainen jakauma aluessa A) Olkoon A E B2 joukko, jonka pinta-ala m(A) on positiivinen. Funktio f, 1
kun (:c, y) E A, f(rc, y) = m(A), ja f(rc, y) = 0 muulloin, täyttää ilmeisellä tavalla tf:n muodolliset vaatimukset. Vastaavaa jakaumaa voidaan hyvällä syyllä kutsua tasaiseksi alueessa A. Tf:n mää ritelmästä seuraa välittömästi, että
P{(X ' Y) E B}
= m(A n B) m(A)
kaikilla B E B2 .
Esimerkki 5.3.6 Kolikko, jonka säde on r heitetään neliöruutuiselle (sivu= a � 2r) pöytäliinalle. Millä tn:llä kolikko peittää neliön kärjen? Ratkaisu. Tarkastamme kolikon keskipisteen paikkaa neliössä. Voimme olettaa, että tämä jakautuu tasaisesti ko. neliössä A. Tapahtuma B = "kolikko peittää kärjen"
2 13
Luku 5. Kaksiulotteiset jakaumat
sattuu, jos ja vain jos keskipisteen etäisyys neliön kärjestä on < r (varjostettu ku viossa).
r
a Siten
P(B)
m(A n B) 1rr 2 2 · m(A) - a-
Esimerkki 5.3.7 Jana katkaistaan kahdesta umpimähkään ja toisistaan riippumat ta valitusta kohdasta. Millä tn:llä saaduista kolmesta janasta voidaan muodostaa kolmio? Ratkaisu. Voidaan olettaa, että janan pituus on 1. Merkitään katkaisukohtia (janan vasemmasta päätepisteestä mitattuna)X:llä ja Y: llä. Oletusten nojalla X ll Y, X"" Tas(O, l ), Y
rv
Tas(O, 1 ).
Parin (X, Y) jakauma on siten tasainen yksikköneliössä A={(:c,y)EIB:2 10 0, D(Y) > 0)
X ja Y ovat korreloimattomia, Cov(X, Y) = 0,
0, a < 0.
Esimerkki 5.4.6 Olkoot X ja Y riippumattomia sm:ia,
E(Y) = µ, D(X) = D(Y) = u.
E(X) Merkitään
U V Tällöin E(U)
2µ, E(V)
X+Y, X-Y.
Oja D2 (U) = D2(V) = 2u2 . Koska
E(XU) = E(X2 + XY) = u2 + 2µ2 E(YV) E(XY - Y 2 ) -u2 ja
E(UV) = E(X2
Y 2) = 0,
saadaan
Corr(X, U)
l
-Ii'
Corr(Y, V)= - � ja Corr(U, V)= 0.
Esimerkki 5.4.7 Korrelaatiokerroin voi olla =0, vaikka X :n ja Y:n välillä vallitsee funktionaalinen riippuvuus. Esimerkiksi, jos X"' N(O, 1) ja Y on Cov(X, Y)
E(X 3 )
x2 '
0 ja siten myös Corr(X, Y) = 0.
Esimerkki 5.4.8 Jatkoa esimerkkiin 5.3.10. Edellä todettiin jo, että Cov(X' Y) Laskemalla vielä varianssit D 2 (X)
4 225
=
= fs ja D 2(Y) =
Corr(X, Y)
1 2 2\,
saadaan
4
= /27 � 0.492. v66
{*) Paras lineaarinen ennuste. Oletetaan, että sm-parista (X, Y) toisen arvo, esim. X:n, on tunnettu. On luonnollista kysyä,miten saataisiin mahdollisimman hyvä X :n arvoon perustuva ennuste sm:lle Y. Etsitään siis sellaista funktiota g, että y
= g(X)
antaisi jossain mielessä optimaalisen arvion sm:Jle Y. Yleisesti käytetty kriteeri on ns. keskineliöpoikkeaman E((Y Y)2) pienuus. Voidaan osoittaa, että tämän nojalla paras ennuste on ehdollinen odotusarvo, ts. että min E((Y - g(X))2 ) g
saavutetaan, kun valitaan
g(x)
= E(Y IX= x).
Tarkastelemme edellisen ongelman seuraavaa varianttia: Mikä on Y:n paras lineaarinen ennuste, kun X tunnetaan? Ts. miten luvut a, b on valittava, jotta sm:lle
Y
= aX +b
pätisi
E((Y - Y)2 )
min E((Y - aX - b)2). a,b
Lause 5.4.9 Jos X ja Y ovat sm:ia, joilla on varianssit ja D 2 (X) > 0, Y:n paras lineaarinen ennuste saadaan yhtälöstä
Y
E(Y) + a(X
E(X)),
missä a
=
Cov(X, Y) D2(X) .
Tällöin
E((Y
Y)2)
= (l
p2)D2 (Y),
140
Luku 5. Kaksiulotteiset jakaumat --missä p
Corr(X,Y).
Edelleen, Y määräytyy yksikäsitteisesti ehdoista {
E(Y) = E(Y), Cov(Y Y,X)·=
o.
Todistus. Kirjoittamalla
E((Y -- Y) 2)
(E(Y) -- E(Y)) 2 + D2 (Y (E(Y) - E(Y)) 2 + D 2(Y)
Y)
2aCov(X, Y) + a2D 2(X)
nähdään, että minimi saavutetaan, kun
E(Y)
= E(Y)
ja a
Cov(X, Y) D2 (X)
Helposti havaitaan,että tämä a:n valinta on yhtäpitävää ehdon Cov(Y -- Y,X) = 0 kanssa. Sijoittamalla saatu a:n arvo minimoitavaan lausekkeeseen saadaan ( l - p2 )D2 (Y).
D
Suoraay E(Y)+ C����·r)(:c E(X)),joka antaaY:n parhaan lineaarisen ennusteen, kun X = :IJ, kutsutaan myös pienimmän neliösumman suoraksi tai Y:n regressiosuoraksi X:n suhteen. Esimerkki 5.4.10 Karl Pearson havaitsi mitattuaan 1078 isän ja pojan pituudet
seuraavaa (yksikkönä cm)
1[ isät
1 pojat
keskipituus hajonta 175.3 5 177.8 5 korrelaatio 0.5
Määritä paras lineaarinen ennuste pojan pituudelle,jos isän pituus on 188 cm. Ratkaisu. Jos merkitään ko. sm:iaX:llä (=isän pituus) ja Y :llä (=pojan pituus), niin annetun aineiston perusteella
E(X) E(Y)
= 175.3, =
177.8,
D(X) = 5, D(Y) = 5
141
5.5. Kaksiulotteinen ja Cov(X, Y) = D(X)D(Y)Corr(X, Y) = 12.5. Lauseesta 5.4.9 nähdään, että Y:n paras lineaarinen ennuste (kun X tunnetaan), on 1
y
2
x + 90.15.
Sijoittamalla X 188 saadaan Y 184.15. Tulos saattaa tuntua yllättävältä, koska keskimäärin pojat ovat pidempiä kuin isät. Käsityksen ennusteen tarkkuudesta antaa ennustusvirheen hajonta
/1 - p2 D(Y) � 4.3.
D(Y - Y)
5.5 Kaksiulotteinen normaalijakauma A. Standardinormaalijakauma Olkoot U ja V riippumattomia ja U, V"' N(O, 1).
Tällöin sm-parin (U, V) tf on (L.5.3.3)
1 ( u, v) E J]�.2 _ exp( 2; Päästäksemme sm-pariin, jolla on annettu korrelaatio p, IPI < 1, tarkastamme yhtä löiden
fu,v(u,v) = rp(u)rp(v)
(l)
{i
u
pU + /1 - p2 V
määrittelemää paria (X, Y). Tällöin X:n ja Y:n reunajakaumat ovat normaalisia (L.2.6.17)
E(X) 0, E(Y) = 0,
D 2 (X) = 1, D 2 (Y) = 1
ja
E(XY)
p.
Corr (X, Y)
= p.
Siten myös
Johtaaksemme parin (X, Y) tf:n tarvitsemme seuraavan aputuloksen
142
Luku 5. Kaksiulotteisetjakaumat
Lemma 5.5.1 Oletetaan, että sm-parilla ( U, V) on jatkuva jakauma ja
(X,Y) = h(U, V), missä h on epäsingulaarinen lineaarikuvaus x h: { y
= au + bv = cu + dv
(eli siis det(h) = ad - bc ::f: 0). Tällöin (X, Y):llä on jatkuva jakauma, jonka tf saadaan kaavasta 1 1 (x,y)E�2 . f(x,y) = ldet(h !u, v (h- (x,y)), )I Todistus. Tulos on puhtaasti analyyttinen (seuraa pintaintegraalien muunnoskaavas ta). Sivuutamme yksityiskohdat. D
{
Tarkastelemme nyt kaavassa (1) esiintyvää lineaarikuvausta h: h· ·
X= U
y=pu+�v.
Tällöin det(h)
=�
(> 0)
ja u=x
(2)
V
= Vr!--:,(y -px), l-p 2
erityisesti u2
+
1 (x2 -2pxy + y2 ). v 2 =- 1 p�')
Lemman 5.5.1 nojalla (X, Y):n tf on ( 3)
2 2 f(x,y)= 7r�exp(-2(l �p 2 /x -2pxy+y )), 2 (x,y) E �2 .
Määritelmä 5.5.2 Olkoon IPI < 1. Sm-parin (X,Y) jakauma on 2-ulotteinen stan dardinormaalijakauma korrelaatiokertoimena p, merkitään
(X,Y)"' N(0,0; 1, l;p), jos (X, Y):llä on jatkuva jakauma tf:na (3).
143
5.5. Kaksiulotteinen normaa!Uakauma
Kuva Standardinormaalijakauman pisteitä (n = 1000) korrelaatiokertoimcn arvoilla
p=O
p
= 0.5
p = 0.9
(!
p
Lause 5.5.3 Oletetaan (X, Y)
rv
p = -0.75.
=0
= 0.9
f!
p
= O.G
= -0.75.
N(O, 0; 1, 1; p). Tällöin
(i) on olemassa riippumattomat N ( 0, 1)-jakautuneet sm:t U ja V s.e. (1) pätee. (ii) reunajakaumat ovat standardinormaaleja, so.
X rv N(O, l)ja Y "'N(O, 1), ja Corr(X, Y) = p, (iii) X Jl Y p = 0,
144
Luku 5. KaksiuJ otteiset jakaumat
( iv) Ehdolliset jakaumat ovat nonnaalisia, täsmällisemmin (YIX (XI Y
2
x)"'-'N(px,1-p ), 2 y)"" N(py, 1 - p ) .
Todistus. ( i) Voidaan valita
missä h-1 on määritelty kaavalla (2). Suoritettaessa tf:n muunnos (Lemman 5.5.1 mukaisesti) käänteiseen suuntaan saadaan
(u, v) E
fu,v(u, v)
2
lR; .
Tästä seuraa väite L.5.3.3:n nojalla. ( ii) ja ( iii) seuraavat esityksestä (1 ). ( iv) Ehdollisen tf:n määritelmän nojalla
f(x, y) 0,
joiden pääakselisuunnat ovat 45° ja 135 ° ja pääakselien pituuksien suhde on J(I + p)/(J - p). Tn, että sm-parin (X, Y) arvo osuu ellipsin Ec sisäpuolelle, on 1 - exp( -c/2), ks. ha�joitustehtävä 5.46.
145
5.5. Kaksiulotteinen
B. Yleinen 2-ulotteinen normaalijakauma Määritelmä 5.5.5 Sm-pari (X, Y) noudattaa 2-ulotteista nonnaalijakaumaa parametrein µ1,µ2, a}, p (ui > 0,u2 > 0, IP!< 1 ). Merkitään (X,Y)"' N(µ1,µ2;uf,u};p), jos standardoidulle sm-parille pätee µ1 Y - µ2 ) ...., N(0,0; 1, l;p). --, ff2 a-1
(X
Lause 5.5.6 (X, Y) "' N(µ 1, µ2; ur,u};p), jos ja vain jos (X, Y):llä on jatkuva jakauma tiheysfunktiona f,
(4) missä
Todistus. Suora seuraus Lemmasta 5.5.1. D Huomautus 5.5.7 (X, Y) "" N(µi,µ2; u2, u2; p), jos ja vain jos on olemassa riip pumattomat N(O, 1 )-jakautuneet sm:t U ja V s.e.
V)+ µ2. Tästä esityksestä käsin todetaan välittömästi, että ( i) reunajakaumat ovat normaalisia: X"' N(µi, ur), Y
rv
N(µ2, a-i),
ja
Corr(X, Y)
p.
Tämän jälkeen ehdollisen tf:n määritelmän nojalla nähdään, että ( ii) ehdolliset jakaumat ovat normaalisia, esimerkiksi
L�u�
1%
(iii) X 11 Y
{?
p
0.
Esimerkki 5.5.8 Tämän esimerkin tarkoitus on vahvistaa käsitys, että kaikki 2ulotteisen normaalijakauman ominaisuudet voidaan johtaa siirtymällä riippumatto miin N(O, 1 )-muuttujiin U, V (ilman, että edellä esitettyjä kaavoja tarvitsisi muistaa). Olennaista on vain löytää lineaarikuvaus (u, v) = g( ;c, y) s.e. tf:n eksponentissa oleva neliömuoto voidaan kirjoittaa Q(;c, y)
= u2 + v2 .
Olkoon sm-parin (X, Y) tf
1,
f(;c, y) = .!_ exp {-!(2:z: 2 + 4xy + 4y2) 7r 2 J
{z,y) E
Kuva Esimerkin 5.5.8 tiheysfunktio ja sen leike tasolla x nähtynä.
=
2
JR;. .
l eri suunnista
(1 °) Siirtyminen riippumattomiin standardinormaalimuutlujiin U, V
Ehto Q(x, y)
2;c 2 + 4:cy + 4y2 = u2
voidaan tyydyttää useammalla valinnalla u, v. Koska Q(:z:,y)
:c 2
+ (x + 2y) 2 ,
+ v2
147
5.5. Kaksiulotteinen
tuntuu luontevalta valita g:
{
u
= :c
V
:C
+ 2y.
Tällöin det(g) = 2. Lemman 5.5.1 mukaisesti ( U, V):n tiheysfunktio on
J(u,v) = =
1 exp (-.!_(u2 2 271"
cp(u)cp(v).
+ v 2))
Tästä näkyy, että ( U, V) on haettu pari riippumattomia N(O, 1)-muuttujia. Ratkaise malla (X, Y) yhtälöstä (U, V)= g(X, Y) saadaan esitys
(5)
{
X U Y = t(V- U).
(U lL V; U, V"' N(O, I ))
(2° ) Reunajakaumat Esityksen (5) nojalla l 2
X"' N(O, 1) ja Y "'N(O, ). (3° ) Korrelaatiokerroin
Cov(X, Y)
*
Corr(X, Y)
(4° ) Ehdolliset jakaumat Sijoittamalla fx ( :c)
jy(ylX=:c)
= cp( :c) saadaan
=
� exp
= E(XY) - E(X)E(Y)
=
l
E(UV
.,
u-)
-
l
2 2 Cov(X, Y) ___ l D(X)D(Y) - y2·
Luku 5. Kaksiu/otteiset jakaumat
148 josta näkyy, että
(Y IX Vastaavasti
(XI Y
y)"' N(--y,
1 ). 2
Esimerkki 5.5.9 (*) Jatkoa edelliseen esimerkkiin. Määritä a) sm:n Z 2X 2 + 4XY + 4Y 2 jakauma, b) P{Z > z}, z > 0, c) P{XY > O}. Ratkaisu. a) Esityksen (5) valinnan nojalla
z u2 + v2 • Tästä seuraa (L.3.7.7), että Z"' Gamma(!, D = Exp(4). b) Kohdan a) mukaan P{Z > z} = e-fz c) Kuvauksessa g:
{ u-= V
X
X+
(z
> 0).
2y
alue {(x, y) E R2 1 xy > O} kuvautuu kulma-alueeksi B
{(u, v) E R 2 1 (u > 0, v > u) tai (u < 0, v
y
< u)}.
g
X
Tällöin p
P{XY > O} = P{(U, V) E B}
= _!_ 27f
rr }}
exp(-�(u2 + v 2 )) dudv. 2
u
5.5. Kaksiulotteinen normaalijakauma ----------
Kyseinen integraali lasketaan kätevästi siirtyen (u, v )-tasoon napakoordinaat teihin ( r, (})
Tällöin (u, v) E B r
{ �
r cos 0, r sin 0.
Siis
> 0 ja(} E IB = (f, i) U (
1 1 1
2111' IB 1 d(} 21r In
=
p
d(}
0
00
dr
re
2· 21r
4
Johdetusta esityksestä seuraa, että ( U, V )-tason napakoordinaateille ( R, e) pä tee aina: R lL e, e"" Tas(O, 21r) ja R2 '"" Exp( HT 5.31.
D,
Huomautus 5.5.10 (*) Tarkastellaan muotoa
f(x, y)
(6)
missä
Q(x,y)=a(x
2
xo) +2b(x
xo)(y
Yo)+c(y
2 Yo) ,
(k, a, b, c, xo, Yo vakioita) olevaa 2-ulotteista tf:ta. Voidaan osoittaa, että f on tf (so. sen integraali yli llf:n suppenee),josja vain jos kerroinmatriisi
on positiividefiniitti, so. Tällöin
a
>0
A
(: ; )
ja det(A) = ac
k
b2 > 0.
= �-'--'-211'
Edelleen havaitaan, että tf (6) voidaan saattaa muotoon (4) valitsemalla para metrit s.e.
µ2 = Yo Ja
149
Harjoitustehtäviä lukuun 1 Harjoitustehtävissä esiintyvillä fiktiivisillä hahmoilla herra A, hetrn K, herra N, etc. ei ole mitään tekemistä samannimistenjoukkojen tai luonnollisten lukujen, etc. kanssa, puhumattakaan, että heillä olisi mitään esikuvia todellisuudessa. l. Luvuista { l, 2, ... , l00} valitaan umpimähkään yksi. Millä tn:llä valittu luku on a) kaksinumeroinen, b) kaksinumeroinen, joka ei ole jaollinen luvulla 11, c) 7:llä jaollinen? 2. Luvuista { l, 2, ... , 1000} valitaan umpimähkään yksi. Millä tn:llä valittu luku on a) 7:llä jaollinen, b)jaollinen 7:llä, mutta ei 17:lla, c) kokonaisluvun neliö, d) kokonaisluvun kuutio? 3. Kahta noppaa heitetään. Laske tn:t tapahtumille a) pistelukujen summa on 7, b) kumpikin pisteluvuista on :::; 4, c) ainakin toinen pisteluvuista on korkeintaan 3. 4. Puinen kuutio, jonka sivutahkot on maalattu, sahataan 1000 yhtäsuureksi pik kukuutioksi. Pikkukuutiot sekoitetaan, ja niistä valitaan umpimähkään yksi. Mikä on tn, että siinä on täsmälleen k maalattua tahkoa (k 0, 1, 2, 3)? 5. Noppaa heitetään 6 kertaa. Millä tn:llä pisteluvut 5 ja 6 esiintyvät ainakin kerran? 6. Osoita, että tn-avaruuden (.0., :F, P) tapahtumilla Aja B pätee P(A)
s
l
P(Ac n Bc ) ::; P(A)
+ P(B)
152
lukuun 1
ja 7. Oletetaan, että P(A) P(A n B)?
0.45 ja P(B)
0.4 ja P(A n B) == 0.2. Määritä seuraavien
0.6, P(B) 8. Olkoon P(A) tapahtumien tn:t: a) A U
Mitä voit sanoa luvusta
0.75.
B, b) AC , c) A n Bc , d) A U Bc , e) Ac \ Bc .
9. Olkoot Aja B tapahtumia. ( i) Lausu joukko-operaatioiden avulla tapahtumat: Tapahtumista Aja B a) sattuu molemmat, b) ei satu kumpikaan, c) sattuu ainakin yksi, d) sattuu täsmälleen yksi. ( ii) Lausu näiden komplementtitapahtumat sanallisesti. ( iii) Lausu tapahtumien a)...d) tn:t lukujen P(A), P(B) ja P(A n B) avulla. 10. Todista ns. Boolen epäyhtälöt
(i) (ii)
P P
(Q
Ai) � LP(Ai), n
i=I
A �1 C6 )
LP(AD, n
i=!
11. Eräässä kaupungissa ilmestyy kolme sanomalehteä (A, B ja C) säännöllisesti 7 päivänä viikossa. Aikuisväestön lukutottumuksia tutkittaessa havaittiin, että näitä lehtiä luettiin seuraavasti: B: 16% A : 20% Aja C: 5% Aja B: 8% Aja B jaC: 2%
C: 14% B ja C: 4%
Aikuisväestöstä valitaan umpimähkään yksi henkilö. Millä tn:llä hän a) ei lue säännöllisesti mitään näistä lehdistä, b) lukee säännöllisesti A:ta, mutta ei B:tä eikä G:tä, c) lukee säännöllisesti täsmälleen yhtä näistä lehdistä?
lukuun l
153
12. Satunnaiskokeessa heitetään painotettua tetraedria ja tarkkaillaan, mikä sivu tahkoista l ,2,3,4 esiintyy (eli on lattiaa vasten heiton jälkeen). On havaittu, että eri sivutahkojen esiintymiskertojen lukumäärien suhde (pitkissä koesarjoissa) on 2: 3: 4: 5.
Määritä koetta kuvailevan tn-mallin perusjoukko ja pistetn:t. 13. Määritä pistetn:t Pk = P{ k} perusjoukolla n = { 1, 2, ... , l O} s.e. Pk on a) suoraan verrannollinen lukuun k, b) suoraan verrannollinen lukuun ln k ( k
1, 2, ... , 10).
Laske kummassakin tapauksessa todennäköisyydet tapahtumille A on suurempi kuin 6" ja B "tulos on kokonaisluvun neliö".
"tulos
J 4. Todista lause 1.4.1. 15. Positiivisen kokonaisluvun viimeinen numero valitaan umpimähkään luvuista 0, 1, 2, ..., 9. Millä tn:llä luvun 4. potenssin viimeinen numero on 1? 16. Kuinka monella tavalla 11 henkilöä voivat asettua pyöreän pöydän ympärille (kahta sijoittelua pidetään samana, jos ne saadaan toisistaan pöydän kie1T01la)? Oletetaan, että henkilöt edustivat l l maan YK-valtuuskuntia turvallisuusneu vostossa. Millä tn: llä Englannin ja Ranskan edustajat istuvat vierekkäin, mutta Yhdysvaltojen ja Neuvostoliiton eivät? 17. Ravintolan ruokalistalla on 3 keittoa, 5 alkuruokaa, 8 pääruokaa ja 4 jälkiruo kaa. Kuinka monta erilaista (täydellistä) ateriaa on mahdollista valita? 18. Sosiologisessa tutkimuksessa väestö jaetaan luokkiin seuraavin perustein: su kupuoli (kaksi vaihtoehtoa), ikä (40 mahdollisuutta), puoluekanta (12 mahdol lisuutta) ja tulot (15 mahdollisuutta). Kuinka moneen luokkaan väestö tulee jaetuksi'7 19. Eräässä aakkostossa on 7 kirjainta. Kuinka monta a) tasan JO-kirjaimista, b) enintään l O-ki1jaimista sanaa voidaan muodostaa? Kuinka kauan näiden läpikäyminen vie lukijalta, joka lukee yhden sanan millisekunnissa? 20. Shakkilaudalle asetetaan umpimähkään 8 tornia (eri ruutuihin). Mikä on to dennäköisyys, että mikään torni ei voi uhata toista (so. millään vaaka- tai pystyrivillä ei ole kahta tornia)'? 21. Henkilöt Aja B asettuvat 8:n muun henkilön kanssa jonoon täysin umpimäh kään. Millä tn:llä A:n ja B:n välissä on enintään 2 henkilföi?
Harjoitustehtäviä lukuun 1
154
22. Rekisterilaattaan sijoitetaan kolme kirjainta (käytettävissä on 26 kirjainta) ja numero väliltä 1 ...999. a) Kuinka monta erilaista laattaa on olemassa? b) Kuinka monessa kaikki kirjaimet ovat samoja? c) Kuinka monessa numero on viidellä jaollinen ? 23. 10 arvasta 2 on voittoarpoja. Millä tn: llä umpimähkään valitun 5 arvan joukossa on a) vähintää yksi voittoarpa, b) molemmat voittoarvat, c) täsmälleen yksi voittoarpa? 24. n:n henkilön joukosta valitaan k-henkinen komitea, jossa yksi henkilöistä on puheenjohtajana. Montako eri komiteaa voidaan muodostaa, kun tulkitaan eri komiteoiksi myös ne, joissa on samat jäsenet, mutta eri puheenjohtaja? Laske lukumäärä valitsemalla a) ensin komitea ja siitä puheenjohtaja, b) ensin puheenjohtaja ja sitten muut jäsenet ja totea, että tulokset ovat samat. 25. Opettaja luennoi saman kurssin kolmesti vuodessa 40 vuoden aikana. Jokaisel la kurssilla hän kertoo 3 vitsiä. Kuinka suuri hänen vitsivarastonsa tulee olla, jotta hänen ei tarvitsisi kertoa millekään kahdelle kurssille täsmälleen samoja vitsejä? Entä, jos hän ke1too 4 vitsiä joka kurssilla? 26. Kolme stokastikkoa on sopinut tiettynä aikana tapaamisesta Grand Hotel'issa. Kaupungissa sattuu olemaan neljä tämän nimistä hotellia (mistä kukaan hen kilöistä ei ole tietoinen). Millä tn:llä henkilöt ovat a) kaikki eri hotelleissa, b) kaikki samassa hotellissa? 27. Juoksulajissa on 48 kilpailijaa, jotka jaetaan arpomalla 6 alkuerään, kuhunkin erään 8 kilpailijaa. Millä tn:llä Suomen Aja Kenian B joutuvat samaan alkuerään? 28. Korttipakasta vedetään neljä korttia. Millä tn:llä a) kortit ovat eri maita, b) eri arvoja, c) sekä eri maita että arvoja? 29. Herra K kirjoittaa kirjeet ja kirjekuoret 5 henkilölle A,1 •••,As. Tässä vai heessa työ kuitenkin keskeytyy (puhelun tms.takia) ja herra K:n lukutaidoton pikkupoika isäänsä auttaakseen sijoittaa yhden kirjeen kuhunkin kuoreen ja vie ne postilaatikkoon. Laske tn:t tapahtumille a) A1 saa oman kirjeensä, b) AI jaA2 saavat oman kirjeensä, c) A1 saa oman kirjeensä, mutta A2 ei saa, d) ainakin yksi henkilöistä A1 , A,2 A:, saa oman kirjeensä, e) kukaan henkilöistä A1 ,...,As ei saa omaa kirjettään.
15 5
lukuun I
30. Todista Newtonin binomikaava (L. l .5.18). 31. Laatikossa on 15 palloa, joista 5 on valkoista. Palloista valitaan umpimähkään (ilman takaisinpanoa) 10 palloa. Millä tn:llä otoksessa on a) ainakin yksi valkoinen pallo, b) kaikki valkoiset pallot? 32. Joukosta E, jossa on N alkiota, otetaan n:n alkion satunnaisotos. Laske tn, että tietty alkio a E E on mukana otoksessa, kun otanta tapahtuu a) ilman takaisinpanoa, b) takaisinpanolla. 33. Laatikossa on 6 punaista ja 9 valkoista palloa . Kokeessa laatikosta nostetaan 3 palloa ilman takaisinpanoa. Laske tn:t tapahtumille
A B C D
"ainakin yksi on punainen", "kaikki ovat punaisia", "pallot ovat keskenään samanvärisiä", "nostossa on sekä valkoisia että punaisia palloja"
34. Neljän henkilön otos valitaan umpimähkään suuresta väestöstä, jossa veriryh mät esiintyvät seuraavasti
A
44%
B
17%
AB 8%
0
31 %.
Millä tn: llä otoksessa esiintyvät kaikki neljä veriryhmää? 35. Työryhmästä, jossa on 8 naista ja 8 miestä, valitaan umpimähkään 8 henkilöä risteilylle. Laske tn:t, että risteilylle pääsevien joukossa a) on ainakin yksi nainen, b) on yhtä monta naista ja miestä, c) naisten ja miesten lukumäärien ero on enintään 2. 36. Laatikossa on 25 palloa, jotka on varustettu numeroin 1, 2, 3, ... , 25 . Laa tikosta nostetaan 5 palloa umpimähkään, ilman takaisinpanoa. Laske tn:t tapahtumille, että saatujen lukujen a) joukossa on (tasan) 3paritonta, b) tulo on parillinen, c) summa on pariton. 37. Herra K väittää erottavansa kaksi kahvilaatua Aja B toisistaan. Tämän takia järjestetään koe, jossa K:n annetaan maistaa kahvia kymmenestä kahvikupista. Näistä viidessa on laatua Aja viidessä laatua B. K:ta pyydetään ilmoittamaan, mitkä viisi ovat laatua A. Laske tn, että K ilmoittaa ainakin kolme oikein pelkästään sattumalta, so. olettaen, että hän valitsee A-kupit umpimähkään.
156
lukuun J
38. Ryhmä, johon kuuluu 2n poikaa ja 2n tyttöä, jaetaan umpimähkään kahteen yhtä suureen osaan. Millä tn:llä kummassakin osassa on yhtä paljon tyttöjä ja poikia? Arvioi tätä tn:tä käyttäen Stirlingin kaavaa (kun n on suuri). 39. Ko1ttipakasta vedetään 5 korttia ilman takaisinpanoa. Millä tn:llä joukossa on ainakin yksi ässä ja ainakin yksi kuningas? 40. Laatikossa on N palloa, jotka on numeroitu luvuin 1,2, ... , N. Kokeessa nos tetaan n palloa a) takaisinpanolla, b) ilman takaisinpanoa. Laske kummassakin tapauksessa todennäköisyys, että suurin esiintyneistä luvuista = k. (Opastus: Käytä hyväksi tapahtumia Bk = "suurin luku � k"). 41. Kuinka monta erilaista ! !-kirjaimista merkkijonoa voidaan muodostaa ki1jai mista M, I, S, S, I, S, S, I, P, P, I? 42. Seurne, jossa on 3 miestä ja 6 naista, jaetaan umpimähkään kolmeen kolmen hengen ryhmään. Mikä on tn, että a) kaikki miehet tulevat samaan ryhmään, b) jokaiseen ryhmään tulee yksi mies? 43. n palloa sijoitetaan umpimähkään k lokeroon. Millä tn:llä lokerossa 1 on tasan ipalloa(i 0,1, ... ,n)? 44. Noppaa heitetään 12 kertaa. Millä tn:llä saadaan koko sarja (so. kaikki piste luvut esiintyvät ainakin kerran). Ohje: Olkoon "pisteluku iei esiinny"
(i= 1, ... ,6).
Tarkastele ensin tapahtumia (1 5 i1
< · · · < ir 5 6, 1 � r � 6).
45. Korttipakasta vedetään 5 korttia (ilman takaisinpanoa). Laske tn, että mukana on ainakin yksi ässä ehdolla, että kaikkien arvo on vähintään 10 (ässä= 14). 46. Oletamme poika- ja tyttösyntymät symmetrisiksi. Laske tn, että kaksilapsisessa perheessä molemmat lapset ovat tyttöjä a) ehdolla, että vanhin on tyttö, b) ehdolla, että ainakin toinen on tyttö. 47. Populaatiossa on 818 henkeä, joista 276 on rokotettu erästä epidemiaa vastaan. Epidemiaan sairastui 69 henkeä, josta 3 oli rokotettuja. a) Mikä on tn, että henkilö sairastui ehdolla, että hänet oli rokotettu? b) Mikä on tn, että henkilö oli rokotettu ehdolla, että hän ei sairas tunut?
157
lukuun I
48. Laatikossa on 6 punaista ja 9 valkoista palloa. Kokeessa laatikosta nostetaan 3 palloa ilman takaisinpanoa, laske tn:t a) kaikki ovat punaisia ehdolla, että ainakin yksi on punainen, b) kaikki ovat punaisia ehdolla, että pallot ovat samanvärisiä, c) saadaan 1 punainen ja 2 valkoista ehdolla, että kaikki pallot eivät ole samanvärisiä.
!
49. Kadonnut kirje on tn:llä jossakin kirjoituspöydän 6 laatikosta. Millä tn:llä se on viimeisessä laatikossa ehdolla, että 5 laatikkoa on jo turhaan tutkittu? 50. Osoita: Jos P(A)
i, niin P(A I B) � !-
P(B)
51. Laske tn, että vedettäessä kortti pakasta 5 korttia (ilman takaisinpanoa) saadaan ainakin yksi ässä ja kuningas ehdolla, että kortit ovat eri arvoja. 52. Todista lause 1.7.3. 53. Korttipakka jaetaan tasan 4 pelaajan kesken. Laske tn, että jokainen saa vain yhden maan kortteja. 54. a) Osoita: Jos P(A) = 0 (tai = l) A on riippumaton kaikista (saman tn avaruuden) tapahtumista B. b) Oletetaan P( A)P( B) > 0. Osoita: Jos Aja B ovat toisensa poissulkevia, ne eivät ole riippumattomia. 55. Todennäköisyysavaruuden (Q, :F, P) tapahtumat Aja B ovat riippumattomia. Tn, että molemmat sattuvat on ja tn, että ainakin toinen sattuu on ��. Määritä P(A) ja P(B). 56. Noppaa heitetään n ke1iaa. Olkoon A "saadaan ainakin yksi kuutonen" ja B = "ykkönen ei esiinny kertaakaan". Laske P(A I B). Ovatko Aja B riippumattomia? 57. Kahta noppaa heitetään. Olkoon A B
"pistelukujen summa on 6"
= "1. nopan pisteluku on 4".
Onko A Jl B? Entä, jos A korvataan tapahtumalla "pistelukujen summa on 7"? 58. Olkoot Aja B tapahtumia ja O A"), niin A Jl B.
< P(A) < l. Osoita: Jos P(B I A) = P(B
1
158
Hm:joitus te/itäviä lukuun 1
59. Osoita: Jos {A, B,C} on riippumaton,niin Au B ll C. 60. Tarkastamme 3-lapsisia perheitä. Oletamme lasten sukupuolet riippumatto miksi. Osoita: Jos poikatn = p (0 < p < 1), tapahtumat
A = "perheessä on sekä tyttöjä että poikia", B "perheessä on enintään yksi tyttö" ovat riippumattomia, jos ja vain jos p =
!.
61. Tehdas valmistaa tuotetta, jossa esiintyy kolmea virhettä: A, B ja C. Virheet 0.05 ja P(C) = esiintyvät toisistaan riippumatta tn:in P(A) = 0.1, P( B) 0.01. Mikä on tn, että tuotteessa esiintyy a) kaikki kolme virhettä, b) ei yhtään virhettä, c) (B taiC) mutta ei A, d) korkeintaan yksi virhe? 62. Anna esimerkki tapahtumista A, B, C, jotka eivät ole riippumattomia, vaikka
P(A n B n C) = P(A)P(B)P(C). 63. Olkoot A, B jaC tapahtumia,joille P(A) P(A U B UC), kun tiedämme lisäksi, että
= P(B) = P(C) = 0.25. Laske
a) A, B ja C ovat riippumattomia, b) A lL B ja A Jl C sekä B ja C ovat toisensa poissulkevia. 64. Tapahtumat A 1, A 2 , ..., A n ovat vaihdettavia, jos kaikille k (1 S k S n) tn
ei riipu indeksikombinaation { i 1 , ••• , ik } C { 1, ... , n} valinnasta. a) Totea, että riippumattomat tapahtumat, joilla on sama tn, ovat vaihdettavia. b) Osoita, että vaihdettavien tapahtumien ei tarvitse olla riippumat tomia. (Vastaesimerkki löytyy kokeesta, jossa luvuista { 1, ... , n} valitaan umpimähkään yksi.)
lukuun 1
159
65. Allaolevissa virtapiireissä kytkin on suljettu (ja siis virta kulkee sen läpi) tn: llä p (muista riippumatta). Millä tn:llä virta kulkee koko piirin läpi? a)
b)
66. Herra K on töissä erään olutpanimon varastolla. Työpäivän päätyttyä kaikki työntekijät joutuvat satunnaistarkastukseen, jossa tn joutua tarkastukseen = 0.03. Laske tn, eWi K joutuu viikon 5 työpäivän) aikana tarkastukseen a) yhden kerran, b) ainakin kerran, c) useammin kuin kerran. 67. N lasta on päättänyt valita sen, joka jää laskemaan sataan (muiden mennessä piiloon) s.e. kaikki heittävät lanttia. Millä tn:llä laskemaan jäävä ratkeaa n. heittokierroksella, kun vaatimuksena on se, että yksi saa eri tuloksen kuin muut? 68. Henkilö on päättänyt heittää lanttia, kunnes sekä klaava että kruunu on esiin tynyt kolme kertaa. Millä tn:llä hän jatkaa lantin heittelyä vielä 10 heiton jälkeen? 69. Herra K:lla on taikavarpu, jonka avulla hän väittää kykenevänsä löytämään vettä. K:n väittämän todellisuutta päätettiin testata seuraavasti. K:lle anne taan 10 kertaa verrattavaksi kaksi tynnyriä (jotka tietenkin muuten ovat aivan samanlaiset), joista toisessa on vettä, toisessa ei. Laske tn, että K valitsee vähintään 8 kertaa oikean tynnyrin a) olettaen, että hän valitsee tynnyrin sat tumanvaraisesti, b) olettaen, että hän tunnistaa veden taikavarvullaan tn:llä 0.8.
160
lukuun l
70. (Banachin tulitikkuprobleema) Henkilöllä on aina mukanaan kaksi tulitikku laatikkoa. Tarvitessaan tulitikkua hän ottaa sen umpimähkään valitsemastaan laatikosta. Eräänä aamuna kummassakin laatikossa on n tulitikkua. Laske tn, että henkilön ensi kertaa yrittäessä ottaa tikkua tyhjästä laatikosta toisessa on r tikkua jäljellä. Numeroesimerkki: n = 50 ja r 0. 71. Laske n-kertaisessa toistokokeessa tn, että A sattuu i. kerralla ehdolla, että A sattuu k kertaa. 72. Tarkastelemme n-kertaista toistokoetta, jossa yksittäisessä toistossa P(A) = p. Laske tn, että A:n esiintymiskertojen lkm on parillinen. (Opastus: Kehitä (-p + qt Newtonin binomikaavalla.) 73. Populaatiossa on tyyppiä I ja 2 olevia jäseniä tuntemattomassa suhteessa p : (l p). Populaatiosta suoritetaan otanta takaisinpanolla n kertaa, jolloin saadaan k tyyppiä l olevaa jäsentä. Milläp:n arvolla tämän tapahtuman tn
on suurin? T ätä p:n arvoa käytetään tilastotieteessä estirnaattina tuntematto malle p:lle (suurimman uskottavuuden menetelmä). 74. Kolmessa lippaassa on seuraavat kolikot l :
kaksi kultarahaa,
2:
yksi kulta- ja yksi hopearaha,
3:
kaksi hopearahaa.
Lippaista valitaan ensin umpimähkään yksi ja siitä nostetaan kolikko umpi mähkään ilman takaisinpanoa. Kolikko osoittautuu kultarahaksi. Mikä on tällä ehdolla tn, että samasta lippaasta nostettu toinenkin kolikko on kultaraha'1 75. Laatikosta, jossa on 5 valkoista ja 6 mustaa palloa poimitaan otos ilman takai sinpanoa siten, että otoskoko vai itaan umpimähkään joukosta { 2, 3, 4}. Laske tn, että kaikki otoksen pallot ovat valkoisia. 76. Saijatuotannossa käytetään kolmea automaattista konetta, jotka tuottavat samanlaisia tuotteita. 1. kone tuottaa 60 2. kone 25 % ja 3. kone l 5 % päivätuotannosta. l. koneen tuotteista 1 2. koneen 2 % ja 3. koneen 3 % on viallisia. Millä tn:llä (umpimähkään valittu) tuote on a) viallinen, b) koneen l valmistama ehdolla, eWi se on viallinen '>
161
Hai:joitustehtiiviä lukuun I
77. Sanoista SCHMERZ, KULUMISURIA ja RIIUUYÖAIE valitaan ensin umpi mähkään yksi. Sen jälkeen valitusta sanasta poimitaan yksi kirjain umpimäh kään. Kirjain osoittautuu vokaaliksi. Mikä on tällä ehdollä tn, että valittu sana oli suomenkielinen? 78. Likinäköinen herra N ampuu jousella ja hänen pikkupoikansa ilmoittaa, onko laukaus osunut vai ei. Tn, että N osuu 0.3 ja tn, että pojan ilmoitus on virheetön 0.8. Mikä on tn, että N on osunut pojan näin ilmoittaessa? 79. Laatikossa 011 n kappaletta markan maksavia arpoja, joista m on tyhjiä ja loput n - m voittoja. Herra K heittää n markkaa pöydälle ja ostaa jokaisella kruunua osoittavalla markalla arvan. Millä tn:llä hän ei saa yhtään voittoarpaa? 80. Laatikossa 011 15 tennispalloa, joista 9 on käyttämätöntä. Ensimmäiseen otte luun valitaan umpimähkään 3 palloa, jotka palautetaan ottelun jälkeen. Laske tn, että valittaessa toiseen otteluun 3 palloa, ne kaikki ovat käyttämättömiä. 81. Laatikkoon sijoitetaan 5 palloa siten, että niiden väri (valkoinen tai punainen) ratkaistaan lanttia heittämällä. Tämän jälkeen laatikosta nostetaan pallo 5 kertaa (takaisinpanolla). Pallo osoittautuu joka kerralla valkoiseksi. Mikä on tällä ehdolla tn, että kaikki 5 palloa ovat valkoisia? 82. Monivalintakokeen kysymykseen on m vaihtoehtoista vastausta. Tn, että vastaaja tietää oikean vastauksen on p. Kun vastaaja ei tiedä oikeaa vastausta, hän arvaa oikein tn:llä l /m. Laske tn, että vastaaja tietää vastauksen ehdolla, että hän vastaa oikein. 83. Poika ostaa kaksi pussillista luumuja, kummassakin pussissa on 10 luumua. Pussissa I on 7 kypsää ja 3 raakaa, pussissa 2 on 3 kypsää ja 7 raakaa. Poika antaa tyttöystävänsä valita ensin toisen pusseista. Mikä on tn, että tyttö valitsi pussin 2, kun syötyään puolet luumuista valitsemastaan pussista, hän havaitsi 2 olleen raakoja?
f.
84. Hajamielinen herra unohtaa sateenvmjonsa kaupassa käydessä�in tn: lla Erää nä päivänä hän on käynyt neljässä kaupassa, ja huomannut kotiin palattuaann sateenvarjon unohtuneen. Laske tn, että unohtunut sateenvarjo on i. kaupassa, i == 1, 2, 3, 4. 85. Herra Z:n tulee selvittää, montako viallista tuotetta on 5 samanlaisen tuotteen joukossa tutkimalla pelkästään yksi, umpimähkään valittu tuote. Hän päät Ui veikata sitä lukumäärää, jonka tn on suurin. Koska hänellä ei ole mitään ennakkokäsitystä viallisten tuotteiden lukumäärästä, hän olettaa kaikki mah dollisuudet, 0, 1, 2, 3, 4, 5, yhtä todennäköisiksi. Mikä on Z:n veikkaus, jos tutkittu tuote on a) viallinen, b) kunnollinen?
162
lukuun l
86. N :ssä laatikossa on kussakin N palloa siten, että laatikossa k on k valkoista (k 1, 2, ... , N). Kokeessa valitaan ensin umpimähkään yksi laatikoista ja sen jälkeen valitusta laatikosta nostetaan pallo n kertaa takaisinpanolla. Kaikki nostetut pallot osoittautuvat valkoisiksi. Mikä on (tällä ehdolla) tn, että myös seuraavalla nostolla samasta laatikosta saadaan valkoinen pallo? 87. Perheen äidin tiedetään olevan tyyppiä aa ja isä on joko tyyppiä AA tai Aa todennäköisyyksin p ja 1 p. Jos isä on AA, lapsi on välttämättä Aa, jos taas isä on Aa, lapsi on Aa tai aa todennäköisyyksin ja Kolmesta lapsesta kaikki ovat tyyppiä Aa. Mikä on tn, että isä on AA?
! f.
88. Mikä on tn päästä alla olevassa reittikaaviossa pisteestä A pisteeseen B, jos kulkija valitsee samasta pisteestä lähtevän tien aina umpimähkään eikä tee yli 90° käännöksiä.
B
A
89. Luvuista l, ... , 7 valitaan ensin umpimähkään yksi. Jos valittu luku on i, luvuista 1, ... , i valitaan umpimähkään yksi. Olkoon A·• B-1c
=
"l . luku on i", "2. luku on k".
lukuun 1
163
Ilmoita taulukkona yhdistetyn kokeen pistetn:t Pik
P(Ai n Bk).
Määritä a) P(B1), b) P(A 3 j B 1 ), c) P("luvut ovat samat").
(*) Tähtitehtäviä lukuun 1 Nämä tehtävät ovat hieman vaikeampia, teoreettisempia tai ne edellyttävät tähdellä merkityissä kappaleissa esitettyjä tietoja. 90. Todista todennäköisyyden monotoninen jatkuvuus (L.1.3.6). 9 J. Olkoon A 1, A2, ... päättymätön jono u-algebran :F joukkoja. Ilmaise joukkooperaatioiden avulla: Tapahtumista A 1 , A2 , ... a) sattuu ainakin yksi, b) ei satu yksikään, c) sattuvat kaikki jostakin indeksin arvosta lähtien, d) sattuu äärettömän monta. Ovatko nämä aina tapahtumia (so. u-algebrassa :F)? 92. Olkoon P(Ai ) � 1
{i = 1,2, ...).
Johda alaraja tapahtumien Ai yhtaikaisen sattumisen tn:lle. 93. Yleistä otanta seuraavaan tilanteeseen: Laatikossa on N palloa, joista N 1 on varustettu numerolla 1, ... , Nk numerolla k (k E N+, N 1 + · .. + Nk N). Laatikosta otetaan n:n alkion satunnaisotos a) ilman takaisinpanoa, b) takaisinpanolla. Olkoot n 1, ... , nk E N s.e. n1
+ · · · + nk = n.
Määritä kummassakin tapauksessa tn sille, että otoksessa on n 1 numerolla 1 varustettua, ... , nk numerolla k varustettua palloa. 94. Kuinka monella tavalla positiiviset kokonaisluvut n1, .. . , nk voidaan valita s.e. n1 (n, k E N+ annettuja, n � k).
+ · · · + nk = n
164
lukuun l
95. Kuinka monella tavalla n lippua voidaan sijoittaa k tankoon. Lippujen järjestys kussakin tangossa on oleellinen. (Kaikki liput mahtuvat tarvittaessa samaan tankoon.) 96. Jatkoa rencontre-probleemaan (Esim. 1.5.15): Osoita, että tn sille, että tasan k henkilöä saa oman hattunsa, on
97. n palloa sijoitetaan umpimähkään k lokeroon (n ;:=: k). Millä tn:llä mikään lokero ei ole tyhjä? (Tämä ns. lipukkeenkeräilijän ongelma on HT:n 1.44 yleistys.) 98. Jatkoa edelliseen tehtävään: Millä tn:llä tasan r lokeroa on tyhjiä (0 ::; r ,::; k - l ). 99. Pokerikäsi on 52 kortin pakasta umpimähkään valittu 5-alkioinen osajoukko. Laske tn, että pokerikädessä on a) pari (kaksi samaa arvoa, muut eri arvoja), b) kaksi paria, c) kolmoset (kolme samaa arvoa, muut eri arvoja), d) suora (kortit peräkkäisiä arvoja), e) väri (kortit samaa maata), f) täyskäsi (kolmoset ja pari), g) neloset (neljä samaa arvoa), h) värisuora (kortit saman maan peräkkäisiä arvoja). JOO. Järvessä on tuntematon määrä N kaloja. Järvestä pyydystetään K kalaa, jotka merkitään (vahingoittamatta kaloja mitenkään). Jonkin ajan kuluttua pyydystetään n kalaa ja huomataan, että k niistä on merkittyjä. Laske tämän tapahtuman tn PN olettaen, että tänä aikana merkityt kalat ovat ehtineet täysin sekoittua muiden kalojen joukkoon ja että järven kalojen joukko on pysynyt samana. Kalojen lukumäärää N voidaan nyt arvioida (estimoida) valitsemalla N siten, ettäpN saa maksimiarvon. Osoita (esim. IaskemallapN+1/PN), että tällä tavalla saatu arvo on [n· f ]. l O l . Osoita, että
lukuun 1
165
kiinteillä n, k E N (k � n), kun P1 edustaa otantaa ilman takaisinpanoa ja P2 takaisinpanolla (A k == "otoksessa on tasan k valkoista palloa") ja kun K......., oo ja N
K -� oo.
102. Jatkoa tehtävään 1.86: Osoita, että kysytty tn on likimain (Laplacen sääntö).
(n+ 1 )/(n+ 2)
l 03. Jatkoa tehtävään 1.82: Oletetaan, että kokeessa on n (vastaajan kannalta riip pumatonta) kysymystä ja että vastaaja on saanut s tehtävää oikein. Mikä on tällä ehdolla vastaajan tietämien kysymysten lkm:n jakauma? J 04. Arpajaisissa on N arpaa, joista K on voittoja. n henkilöä valitsee peräkkäin umpimähkään aina yhden arvan jäljelläolevista. Laske tn, että a) k. henkilö saa voiton, b) k. henkilö saa ensimmäisen voiton, ehdolla että hän saa voiton. l 05. Luvuista l, 2, ... 1 N valitaan umpimähkään yksi n kertaa takaisinpanolla. Osoita, että n:n ollessa paljon pienempi kuin N, tn, että kaikki saadut luvut ovat eri lukuja, on likimain exp ( -
n(n - 1)) 2N
Totea tämän avulla, että kyseinen tn on �
! , kun
n::::::; 1.1sv'N. (Syntymäpäiväprobleemalle (N == 365) tästä saatava arvio 22.5 on hyvä li kiarvo todelliselle arvolle n := 23.) 106. Oletamme, että uhkapelissä voittotn yhdellä kierroksella on 1/ ( N E N+) ja että pelikierrokset ovat riippumattomia. a) Kuinka monta kertaa on pelattava, jotta 1 ? 2 b) Ikivanha "pelurin sääntö" sanoo, että tarvittava pelien lkm n on P("ainakin yksi voitto")>
n
pienin kokonaisluku, joka on ?: Uf.
Totea, että tämä sääntö pätee arvoilla N = 1, 2, ... , 14 mutta ei enää, kun N = 15. c) Osoita, että kaikilla N 2N S: n < N !n 2 + I 3
166
lukuun 1
ja että n N---, Jn2, kun N---, oo.
Huom. Tehtävissä 107 ...111 esiintyvät stokastiset prosessit ovat esimerkkejä ns. Markovin ketjuista. 107. (Satunnaiskulku) Oletetaan, että hiukkanen liikkuu kokonaislukujen joukossa Z s.e. kunakin ajanhetkenä 0, 1,2, ... se ottaa yhden askelen oikealle (tn: llä 4) tai vasemmalle (tn: llä f ). 1
2
1
2
---+----+---+--------·-- --+-
a) Millä tn:llä origosta lähtevä hiukkanen on n:n askeleen jälkeen pisteessä k? b) Oletetaan, että origosta lähtenyt hiukkanen on palannut sinne2n askeleen jäl keen (n E N+)· Mikä on tällä ehdolla tn, että hiukkanen ei lainkaan käynyt ori gon vasemmalla puolella? Ohje: Yhdistämällä (aika,paikka)-koordinaatiston pisteet hiukkasen kulkua voidaan kuvat murtoviivalla (polulla):
Pisteestä (0, 0) lähtevät pisteeseen (2n, 0) päättyvät polut, jotka käyvät aika akselin alapuolella vastaavat kääntäen yksikäsitteisesti polkuja, jotka lähtevät pisteestä (0, -2) ja päättyvät pisteeseen (2n, 0) ("Heijastusperiaate"), ks. kuva. 108. Ratkaise sopivan heijastusperiaatteen (ks. edellisen tehtävän ohjetta) avulla seuraava ongelma: Peter ja Paul heittävät lanttia 2n kertaa yksikköpanoksin
167
lukuun 1
Uos tulos on kruunu, Peter voittaa Paulilta yhden rahayksikön; kääntäen, jos tulos on klaava). Mikä on tn, että Peter on voitolla koko pelin ajan? 109. (Uhkapelurin tuho) Muutetaan tehtävän 107 satunnaiskulkua siten, että tilat -a ja b ovat absorboivia, so. satunnaiskulku päättyy, kun hiukkanen ensimmäisen kerran tulee tilaan -a tai b (a, b E N+). Tämä kuvaa yksikköpanoksin pelat tavaa lantinheittopeliä, missä a on pelurin ja b pelipankin alkupääoma. Osoita, että origosta alkava satunnaiskulku absorboituu pisteeseen -a (ts. lantinheitto päättyy pelurin vararikkoon) tn: llä b / ( a+ b ). Ohje: Johda palautuskaava ko. ab sorptiotn:lle olettaen, että satunnaiskulku alkaa pisteestä k ( a � k � b ). 110. (Polyan uurnamalli) Laatikossa on a valkoista ja b mustaa palloa. Laatikosta valitaan pallo umpimähkään, palautetaan se ja lisätään c nostetun väristä palloa (a, b E N+, c E Z). Jos a + b + c > 0, toisessa kokeessa valitaan pallo umpimähkään ( a + b + c):stä pallosta ja menetellään kuten edellä. (Jos c == 0 tai c l kyseessä on tavallinen otanta takaisinpanolla/ilman takaisinpanoa). Oletetaan, että a + b + ( n - 1)c > 0. a) Laske tn tapahtumalle "n:Ilä nostolla saadaan tasan k valkoista palloa ( k == 0, 1, ... , n)"
Ak
ja osoita, että se voidaan lausua (kun c /. 0) muodossa
. . (:z:) _
k+l) ( :z: E ll"', k E n iM) . m1ssa k - :i:(:i:-1)·..k(:i:' b) Osoita, että tn saada k. nostolla valkoinen pallo on= a/( a + b) kaikilla k. 11J)
!
11 J. Kahdesta ulkoisesti täysin erottamattomasta lantista 1. lantin klaavatn on ja 2. lantin Pelaajan tarkoituksena on saada klaava mahdollisimman usein. Tätä varten hän toimii seuraavasti:
!.
aluksi hän valitsee lantin umpimähkään, - jos edellinen tulos on klaava, hän heittää seuraavan kerran samalla lantilla, jos taas kruunu, hän vaihtaa lanttia. Johda palautuskaava tn: lie
P( "n. heitto lantilla 1 ")
Pn ja osoita sen avulla, että Pn
3 5
J 10
(-i)n-1 4
(n
1,2, ... ).
168
lukuun 1
Määritä tämän avulla Jim P( "klaava n. heitolla").
n-HX>
Harjoitustehtäviä lukuun 2 l . Anna esimerkki kahdesta eri sm:sta, joilla on sama jakauma (ja jotka on mää ritelty samassa tn-avaruudessa). 2. Kahta noppaa heitetään. Kuvatkoon X maksimia pisteluvuista. Ilmaise tapah tumat
{X
3}, {X :S: 3}, {X :S: 5} \ {X :S: 3}
luettelemalla niihin kuuluvat alkeistapaukset ja määritä näiden tapahtumien tn:t. 3. Laatikosta, jossa on 6 punaista ja 9 valkoista palloa, nostetaan 3 palloa umpi mähkään ilman takaisinpanoa. Kuvatkoon sm X punaisten pallojen lukumää rää otoksessa. Määritä X :n arvojoukko ja pistetn:t P{ X k }, kun k kuuluu X :n arvojoukkoon. 4. Edellisen tehtävän laatikosta nostetaan palloja yksitellen ilman takaisinpanoa. Olkoon Y sen kerran järjestysluku,jolla saadaan ensimmäinen punainen pallo. Ilmoita Y:n arvojoukko ja määritä pistetn:t P{Y = k }, kun k kuuluu Y:n arvojoukkoon. 5. Henkilö hamuilee avainnippuaan ulko-ovella. Nipussa on n avainta, joista yksi sopii oveen. Olkoon X sen kerran jä�jestysluku, jolla ovi aukeaa. Laske X :n ptnf ja kf olettaen, että henkilö valitsee avaimen umpimähkään ja a) muistaa mitä avaimia hän on turhaan yrittänyt, b) ei muista mitä avaimia hän on turhaan yrittänyt. 6. Lanttia heitetään, kunnes sekä kruunu että klaava ovat esiintyneet ainakin kaksi kertaa. Olkoon X sen kerran järjestysluku, jolla peli päättyy. Johda X :n ptnf ja kf ja määrää pienin arvo n, jolla P{X :S: n} > 0.9. 7. Ilmoita satunnaismuuttujan X jakauma, jos
Hwjoitustel1täviä lukuun 2
170
a) X on viallisten lkm laatikossa, johon on pakattu 48 tuotetta; oletamme, että kullakin tuotteella toisista riippumatta tn 0.05 olla viallinen, b) X on ässien lkm vedettäessä l 3 korttia ilman takaisinpanoa kort tipakasta, c)X on tietyssä lokerossa olevien pallojen lkm (n palloa, k lokeroa), d) X on turhien ke1tojen lkm toistuvassa kahden nopan heitossa ennen ensimmäisen kuutosparin esiintymistä, e) X on värisokeiden lkm lO hengen otoksessa (takaisinpanolla) 100 hengen populaatiossa, jossa on 3 värisokeata. 8. Laske tn, ettäX 011 parillinen, jos a) X"' Bin(n,p), b) X,..., Geom(p), c) X,.,., Poisson(>.). 9. (Huygensin probleema) A ja E heittävät vuorotellen noppaa A:n aloittaessa. Pelin voittaa se, joka saa ensimmäisen kuutosen. Määritä A:n ja E:n voittotn:t ja vedonlyöntisuhde P(A)/ P(E). l0. Aja E ovat päättäneet kahvilassa ollessaan pelata vuorotellen peliautomaatilla, jossa on vain yksi voittomahdollisuus. Se, joka ensin saa voiton, saa toiselta ilmaiset kahvit. E on taitavampi pelaaja kuin A; E:n voittotn on P2 ja A:n P1 (P2 > pi). Osoita: Jos A saa aloittaa, peli on reilu, ts. A:n ja E:n tn:t ilmaiseen kahviin ovat samat, täsmälleen silloin kun P2
=
Pi
1 -P1
(Oletamme, että pelit ovat riippumattomia.) 11. Viesti koostuu sadasta merkistä Uoko O tai 1), joista jokainen merkki voi tiedonsiirtovaiheessa vaihtua (nollasta ykköseksi tai päinvastoin) tn:llä p = 0.001 (muista merkeistä riippumatta). Millä tn:llä viesti on alkuperäisessä muodossaan kymmenen tiedonsiirtovaiheen jälkeen? 12. TodistaHuomautuksen 2.1.l7 väite: JosXn"' Bin(n,pn ) jan -t oo,pn s.e.
(> 0), niin
(k
0,1, ... ).
-t
0
lukuun 2
171
13. Jatkoa de Meren probleemaan (Esim. 1.1.6): Laske odotusarvo a) kuutosten lkm:lle neljän nopan heitossa, b) kuutosparien lkm:lle 24:ssä kahden nopan heitossa. 14. Herra K lähettää ystävälleen kaksi ki1jaa, joiden arvot ovat 100 mk ja 150 mk. Paketin tn kadota matkalla on 0.1. K aprikoi, lähettääkö kitjat yhtenä vai kahtena eri pakettina. Vertaile menetelmiä seuraavin kriteerein a) katoamisesta johtuvan tappion odotusarvo, b) tn, että ystävä saa molemmat kirjat, c) tn, että ystävä saa ainakin yhden kirjan. 15. Jatkoa tehtävään 2.5: Määritä E(X) tapauksissa a ja b. 16. Suoritetaan riippumattomia kokeita siihen asti, kunnes saadaan ensimmäinen positiivinen tulos; kullakin kerralla positiivisen tuloksen tn on 0.05. Kuvatkoon sm X suorituskertojen lukumäärää. Määritä a) X :n arvojoukko, b) X:n ptnf, c) X:n kf, d) X :n odotusarvo, e) "todennäköisin" suorituske1tojen lkm (ns. moodi). 17. Tikkataulu muodostuu samankeskisistä r-, 2r-, ... , 1Or-säteisistä ympyröistä (r > 0 vakio), joista muodostuva uloin ympyrärengas antaa yhden pisteen, seuraava 2 pistettä jne. Keskellä oleva ympyrä antaa 10 pistettä. Oletam me, että tauluun heitettäessä osa-alueen tn on verrannollinen sen pinta-alaan. Määritä yhdellä (tauluun osuvalla) tikalla saatavan pisteluvun odotusarvo. 18. Lentoyhtiö tietää kokemuksesta, että keskimäärin 5 % paikan varanneista jää saapumatta koneeseen. Siksi yhtiö myykin 257 lippua koneeseen, johon mah tuu 250 matkustajaa. Millä tn:llä jokainen koneeseen saapuva saa paikan? 19. Jatkoa edelliseen tehtävään: Arvioi kysyttyä tn:tä korvaamalla poisjäävien lkm:n jakauma sopivalla Poisson-jakaumalla. 20. Lautta kulkee salmen yli rannalta A rannalle B säännöllisesti 10 minuutin välein ja sille mahtuu 8 autoa. Oletetaan, että rannalle A ei jää yhtään autoa lautan edellisen kerran lähtiessä. Oletetaan lisäksi, että seuraavan 10 minuutin aikana rantaan A saapuvien autojen lkm on Poisson-jakautunut sm, odotusarvona 5. Millä tn:llä lautta tulee täyteen käydessään seuraavan kerran rannassa A?
172
lukuun 2
21. Noppaa heitetään 4 kertaa. Olkoon X suurin esiintyneistä pisteluvuista. Mää ritä E(X). 22. Olkoon X diskreetti sm, jonka arvojoukko sisältyy joukkoon N={0,1,2, ...} ja qk
= P{X 2". k}
1,2, ...).
(k
Osoita, että E(X)
00
Lqk k=I
(odotusarvo on olemassa, jos ja vain jos I: qk
0 ja että ko. sarja suppenee itseisesti.
Osoita: Jos { A1, ... , An } on (n, :F, P}:n ositus, niin E(X)
n
L P(Ai)E(X I Ai).
i=I
ä.
24. Sarjatuotannossa toimiva kone tuottaa hyväksyttävän tuotteen tn:llä p Joka kerralla koneella on tn p = J(ioo vioittua. Olkoon X koneen ennen ensimmäistä vioittumista tuottamien hyväksyttävien tuotteiden lkm. Laske E(X). 25. Määritä toistuvassa nopanheitossa ennen ensimmäistä kuutosta saatavien pis telukujen summan odotusarvo. 26. Labyrintissä olevalla rotalla on alkupisteessään valittavana kaksi suuntaa: jos se lähtee oikealle, se palaa alkupisteeseen 3 minuutin vaelluksen jälkeen, jos taas vasemmalle, se pääsee ulos 2 minuutin vaelluksen jälkeen tn:llä * ja palaa alkupisteeseen 5 minuutin vaelluksen jälkeen tn: llä r Laske rotan labyrintissä viettämän ajan odotusarvo olettaen sen valitsevan suunnan alkupisteestä aina umpimähkään. 27. Tutki, voidaanko vakio c määrätä s.e. f : R --+ Ron tiheysfunktio, kun
173
lukuun 2
a) f(x) = c(2 x), xE(0,2), b) f(x) c/x, X> J, X>(), c) f('x) ce- 2"', ja f ( x)
0 muilla x:n arvoilla. Myönteisessä tapauksessa johda kf.
28. Satunnaismuuttujan X tiheysfunktio f on X> 0, muulloin.
f(x) a) Määritä vakio c, b) johda kf, c) laske
P{O l}
pätee
E(N)
e.
1. Ol koon Z mittausvirheiden aiheuttama pinta-alan virhe. Laske E( Z) ja D 2 ( Z). 11. Vertaile Tsebysevin epäyhtälön
P{/X antamaa arviota tarkkaan arvoon tapauksissa k a) Tas(O, l ), b) Exp().), c) N(µ, o-2 ).
2 ja 3, kun X :n jakauma on
12. Laskettaessa n reaaliluvun aritmeettinen keskiarvo luvut pyöristetään koko naisluvuiksi. Oletamme, että pyöristysvirheet ovat riippumattomia ja Tas( )-jakautuneita sm: ia. Olkoon X aritmeettisen keskiarvon virhe. Mi kä on n:n vähintään oltava, jotta
!, !
P{IXI � 0.01} < 0.05. Käytä arviointiin Tsebysevin epäyhtälöä. 13. Miljoonan luvun keskiarvo on l 0. Lukujen neliöiden keskiarvo on 101. a) Anna Tsebysevin epäyhtälön avulla yläraja niiden lukujen mää rällä, jotka ovat� 14. b) Miten a-kohdan arvio tarkentuu, jos tiedetään, että lukujen ja kauma on symmetrinen keskiarvon suhteen? 14. Osoita, että Tsebysevin epäyhtälöä ei voi parantaa, ts. annetuilleµ E R, o- > 0 ja k � 1 on aina olemassa jakauma, jolle P{ JX - µ/ 2:': ko-} = �2 . 15. Olkoot X ja Y sm:ia, joilla on varianssit. Osoita, että seuraavat ehdot ovat yhtäpitäviä: (i) (ii) (iii)
Cov(X, Y)
= 0,
E(XY) E(X)E(Y), D 2 (X + Y) = D 2 (X) + D 2 (Y).
Harjoitustehtäviä lukuun 3
182
16. Osoita kahdelle tapahtumalle Aja B: Aja B ovat riippumattomia, jos ja vain jos Cov(IA, lB) = 0. 17. Olkoot X1, ... , Xm , Y1, ... , Yn sm:ia, joilla on varianssit. Osoita, että
L L aibkCov(Xi, Yk). m
n
i::::I k=I
18. Jatkoa esimerkkiin 1.5.15 (rencontre -probleema). Olkoon X niiden henki löiden lkm, jotka saavat oman hattunsa. Laske E(X) ja D 2 (X). (Vihje: Indikaattorit) 19. Viidentoista arvan joukossa on kolme , joilla voittaa 50 mk, neljä, joilla voittaa 10 mk, loput arvat ovat tyhjiä. Olkoon X ma". Laske E(X).
"kaksi arpaa ostavan henkilön voittosum
2 0. Noppaa heitetään n kertaa. Laske esiintyneiden pistelukujen lkm:n odotusarvo ja sen likiarvo tapauksissa n 2, 4, 6, 12. 21. n palloa sijoitetaan k lokeroon. Olkoon X miehitettyjen (so. ei-tyhjien)loke roiden lkm. Laske indikaattorien avulla E(X) ja D 2 (X). 2 2 . Tarkastellaan n henkilön otosta suuresta väestöstä , jossa veriryhmät jakautuvat kuten harjoitustehtävässä 1.34. Määritä otoksessa esiintyvien veriryhmien lkm:n odotusarvo ja sen likiarvo tapauksissa n = 4, n - 10. 23. Jokaisella lottokierroksella tulos on joukon {1, 2, . .. , 39} umpimähkään valit tu 7-alkioinen osajoukko. Olkoon X n:llä kierroksella esiintyneiden lukujen määrä. Laske E(X)ja D 2 (X). 2 4. Määritä X:np-fraktiili tapauksissap b)X "'Exp(2),c)X"' N({j). 2 5. Sm X saa arvot l, 2, 3, kunkin tn:llä E(X2 ) ja E(X 3 ).
0.5, 0.75, 0.99 , kun a)X ""Tas(O , I),
t. a)Määritä X:n tngf, b)laske E(X),
2 6. Olkoon P( A) p. Määritä indikaattorin l A tngf ja johda tämän avulla Bin(n,p)-jakauman tngf. 2 7. Olkoon X N-arvoinen sm ja G sen tngf. a)Mitä ovat G(O), G( l)? b)Lausu G:n avulla tn, että X saa parillisen arvon.
Harjoitustehtäviä lukuun 3
183
28. Olkoot X ja Y riippumattomia. Johda ehdollinen jakauma
P{X
k IX+ Y
= n}
(k=0,1, ... ,n),
kun a) X,.._, Bin(n,,p), Y rv Bin(n2,P), b) X rv Poisson(Å1), Y rv Poisson(Å2), c) X, Y rv Geom(p). 29. Laske suoraan (so. tngf:ita käyttämättä) lastenlasten lukumäärän odotusarvo ja varianssi Esimerkin 3.6.10 oletuksin. 30. Linnunradassa on viimeksi räjähtänyt supernova vuosina 1987, 1604, 1572 ja 1054. On arveltu, että näitä räjähdyksiä tapahtuu keskimäärin kerran 300 vuodessa. Oletetaan, että räjähdykset muodostavat Poisson-prosessin. Laske tähän nojautuen tn sille, että a) tietyssä 60 vuoden jaksossa räjähtää ainakin 2 supernovaa, b) tietyssä 450 vuoden jaksossa ei räjähdä yhtään supernovaa. 31. Kioskiin saapuvien asiakkaiden lkm muodostaa Poisson-prosessin, intensiteet tinä 10 (yksikkönä tunti). Oletamme, että 15 minuutin aikana on saapunut kaksi asiakasta. Mikä on tällä ehdolla tn, että a) molemmat saapuivat ensimmäisen 5 minuutin aikana, b) ainakin toinen saapui viimeisen 5 minuutin aikana? 32. Kaukopuhelujen saapuminen muodostaa Poisson-prosessin. Tiedämme, että hetkeen t > 0 mennessä on saapunut yksi puhelu. Miten jakautuu tämän puhelun saapumishetki T? (Opastus: Laske
P{T:::;sjX([O,t])
I}
(O 0),
(f(z) = 0, kun z :::; 0). Määritä vakio c, jakauman nimi, sekä E(X) ja
D 2 (X).
184
Harjoi tusteh täviii lukuun 3 Määritä E(X-k), kun X odotusarvo on olemassa?
rv
Gamma(r, ,\) ja k E N+. Millä k:n arvoilla
36. Todista Lauseen 3.7.4 kohta (iii). 37. Olkoot X 1 , ••• , Xn riippumattomia, yhteisenä jakaumana Gamma(r, ,\). Mi ten jakautuu keskiarvo
38. Johda sm:n Y
=
.Jx" tfja määritä E(Y), D 2(Y ), kun Y ,...., x;, = Gamma( I, i ).
39. Olkoot X1 , X2 , X3 riippumattomia, kukin jakaumaltaan Exp(..\). a) Määritä sm:n
tf ja odotusarvo. b) Olkoon Y sm:ista X 1 , X2 , X3 suuruudeltaan keskimmäinen. Määritä Y:n tf ja odotusarvo. 40. Oletetaan, että molekyylin nopeudet x-, y- ja z-koordinaattiakselien suuntaan ovat riippumattomia, N(O, u 2)-jakautuneita sm:ia. Määritä molekyylin vauh din tf. (Maxwell päätyi tähän jakaumaan lähtien siitä, että kyseisen nopeusja kauman on oltava invariantti 3-ulotteisen avaruuden koordinaatiston kiertojen suhteen.)
(*) Tähtitehtäviä lukuun 3 41. Todista odotusarvon aito positiivisuus (L.3.1.4(v)). 42. Osoita, että sm:t X ja Y ovat riippumattomia,jos ja vain jos
E(g(X)h(Y)) = E(g(X))E(h(Y)) kaikille rajoitetuille (Borel-)funktioille g, h: lFt -··-• IFt. 43. Olkoon X Jl Y, X, Y
rv
N( µ, 0' ). Osoita, että 2
E(max{X, Y}) = µ + Ohje: Tarkastele ensin tapaus µ = 0, 0. Ohje: Sovella Markovin epäyhtälöä (L.3.1.6).
47. (Jensenin epäyhtälö) Oletetaan, että derivoituvan funktion g derivaatta on kas vava. Osoita: Jos sm:illa X ja g(X) on odotusarvot, niin
g(E(X)) � E(g(X)). 48. a) Osoita, että sm:lle X � 0 pätee jollakin t jos ja vain jos on olemassa luvut M ja .X
> 0,
> 0 s.e. kaikilla x
> 0.
b) Osoita edelleen, että ko. ehdosta seuraa kaikkien kertalukujen momenttien olemassaolo, ts. kaikilla n EN+. (Funktiota M ( t)
E( et X) kutsutaan X :n moment1igeneroivaksi fimktioksi.)
186
lukuun 3
49. Ajatellaan, että olisi annettava mahdollisimman hyvä ennuste sm:n X arvolle (ilman, että on käytettävissä mitään havaintoja X:stä). Jos ennuste on c, hyvyyden kriteerinä voidaan pitää riskin
r(e) = E(L(X, e )) minimoitumista, kun L on jokin ns. tappiofunktio. Osoita: a) Jos E(X2) < oo ja tappiofunktioksi valitaan
c) 2 ,
L(x,c)=(x
niin optimaalinen e:n valinta on odotusarvo, C
E(X).
b) Jos X:llä on jatkuva jakauma tf:na f (voit olettaa, että jakauma on keskittynyt välille [ a, b]) ja tappiofunktioksi valitaan
L(x, c)
lx - ei,
niin optimaalinen e:n valinta on mediaani (ei välttämättä yksikäsitteinen),
c) Jos X:llä on diskreetti jakauma ja tappiofunktioksi valitaan X
L(x, c) = { �:
X
e, 'f e,
niin optimaalinen e:n valinta (ei välttämättä yksikäsitteinen) on moodi, so. sel lainen X: n arvo, jolla pistetn saa suurimman arvon. 50. Olkoon {X1, ..., Xn } otos jostakin jakaumasta ja B jokin tämän jakauman parametri. Sm
on parametrin B harhaton estimaattori, jos
E(T) Oletetaan, että jakaumalla on varianssi.
e.
Ha�ioitllstehtäviii lukuun 3
187
t
a) Totea, että X1 ja X = :L?=t Xi ovat odotusarvon harhattomia estimaat toreita. Miksi X on parempi? b) Määritä vakio c s.e. n
c E(X;
T
x)2
i::::J
on jakauman varianssin harhaton estimaattori. c) Jos n = 2k + 1, k E N+, suuruudeltaan keskimmäistäX-arvoa, X( k+ i), kut sutaan otosmediaaniksi. Osoita esimerkillä, että sen ei tarvitse olla jakauman mediaanin harhaton estimaattori. 51. (Waldin identiteetti) Olkoon X 1, X2, ... jono sm:ia, joilla on sama odotusarvo µ = E(Xk) ja olkoon N N-arvoinen sm, jolla on odotusarvo. Merkitään N
LXk.
SN
k=I
Osoita: Jos
kaikilla k E N+, niin E(SN)
= µE(N).
Ohje: Oleta aluksi, että N on rajoitettu, N � no E N+ ja kirjoita sN
=
E 1 N2k}xk. nn
{
k:::::I
52. Osoita, että haarautumisprosessille (ks. Esimerkki 3.6.1 1) pätee
ja D 2( Zn ) missäµ = E(Y),
17'
2
= µn -10' 2( 1 + ... +µn -1),
D 2 (Y).
53. Olkoon Tn (origosta laskettuna) Poisson-prosessin n. piste. Osoita, että Tn rv Gamma(n, A), missä A on prosessin intensiteetti. Ohje: Käytä ensin yhteyttä {Tn :;
t} = {X([O, t]) � n}.
Harjoitustehtäviä lukuun 3
188
54. Osoita, että f'(!) = ft ja laske f'(n +!),n EN+. 55. Määritä gammafunktion avulla N(O, 1)-jakauman ns. itseiset momentit rEK Millä r:n arvoilla odotusarvo on olemassa? 56. Osoita, että
kun r1, r 2 > 0. 57. Olkoot X1 , X2 , ... riippumattomia, Exp(>.)-jakautuneita sm:ia, n
ja N
= sup{n EN+
[ Sn ::; t}
(t > 0).
Osoita, että N noudattaa Poisson-jakaumaa ja määritä jakauman parametri. 58. Auton renkaan kesto (ennen puhkeamista) noudattaa eksponenttijakaumaa, parametrina>. = 0.0001, yksikkönä kilometri. Millä tn:llä kolmella vararen kaalla voi tehdä 12000 km:n matkan? 59. Parturiliikkeessä oli A:n astuessa sisään 9 parturia, joilla kaikilla oli asiakas käsiteltävänä. Lisäksi tuoleilla istui lehtiä lueskelleen 3 henkilöä vuoroaan odottaen. A havaitsi tämän tilanteen tietäen lisäksi, että kunkin asiakkaan käsittely kestää 25 minuuttia. Johda T:n tf, kun T on satunnaismuuttuja, joka A:n silmin katsottuna kuvaa hänen odotusaikaansa ja laske E(T).
60. Todista Lauseen 3.9.4 kohdat (v) ja (vii). (Kohdan (v) symmetria tarkoittaa sitä, että -X"' X, ts. P{X ::; x} = P{X 2: -x} kaikilla x.) 61. Osoita, että Exp(>.)-jakuman karakteristinen funktio on 0 on vakio ja m(B) on joukon B pinta-ala. Olkoon m(B) > 0 ja X ( B) 1. Osoita, että tällä ehdolla satunnaisen pisteen jakauma on tasainen joukolla B.
200
lukuun 5
36. Olkoot X ja Y sm:ia,joilla on varianssit. Osoita: Jos
E (Y I X
= :v) = a:v + /3
(kaikilla x),
missäa ja f3 ovat vakioita, niin Y:n paras lineaarinen ennuste ehdolla{X on ax + /3.
= ;e}
37. Oletetaan, että satelliitista saapuva signaali on muotoa
S =X+ Y, missä X on havainto ja Y on häiriö (kohina). X rv N(µ, 0, r > 0). Osoita, että parin (X, Y) jakauma on kaksiulotteinen normaalijakauma ja määritä sen parametrit.
lukmm 5
201
43. Jatkoa tehtävään 5.28: Laske tn:t tapahtumille
> O}, {max{X,Y} > 0 ja min{X,Y} < O}.
{max{X,Y}
a) b)
44. Oletetaan,että (X,Y) rv N(O, O;o},O'?;p). Osoita,että
= P{X :S: OjaY :S: O} = 41 + "ll
P{X? OjaY? O}
1
P{X? OjaY :S: O} = P{X :S: OjaY?:: O} = - 4
45. Sm-parin (X, Y) jakauma on N(O, O; 1, 1;p)ja Z a) Johda Z:n kf ja tf, b) osoita,että
E(Z)
�7!'
arcsinp,
f arcsinp. �11'
= max{X,Y}.
�;.
46. Sm-parin (X, Y) jakauma on 2-ulotteinen normaalijakauma tf:na f, , ) f(;cy Merkitään Ec
= {(;c,y)
1
Q(x,y)
c},
c
> 0.
Osoita, että sm-parin (X, Y) arvo osuu ellipsin Ec sisäpuolelle tn:llä l exp( fc).
Harjoitustehtävien vastaukset Luku 1 1. a)0.9 b)0.81 c)0.14 2. a)0.142 b)0.134 c)0.031 d)0.01 3. a)0.167 b)0.444 c)0.75 4. a)0.512, 0.384, 0.096 , 0.008 5. 0.418 7. 0.2� P(A n B) �0.45 8. a)0.8 b)0.4 c)0.4 d)0.8 e)0.2 9. (iii) a) P(A n B) b)1 - P(A) - P(B) + P(A n B) c) P(A) + P(B) - P(A n B) d) P(A) + P(B) - 2P(A n B) 10. (i) induktio (ii) de Morgan. 11. a)0.65 b)0.09 c)0.22 12. Q={l,2,3,4},Pk=(k+l)/14. 13. a)Pk = k/55, P(A) = 0.618, P(B) = 0.255, b)Pk = ln k/(Jn10!), P(A) = 0.564, P(B) = 0, 237. 14. Olennaista on todeta, että nyt täysadditiivisuuden (TN3) sijasta riittää todistaa äärellinen additiivisuus: A n B = 0:::::} P(A U B) = P(A) + P(B). 15. 0.4 16. 3628800, 0.156
Vastaukset, luku 1
204 17. 480 18. 14400 19. a) 2.82· 10 8 (3 d 6 h 28 min)
b) 3.30· 108 (3 d 19 h 33 min).
20. 9.1 . 10- 6 21. 0.533 22. a) 17558424 b) 25974 c) 3497624 23. a) 0.778 b) 0.222 c) 0.556 24. a)
(:)k n(;=/), b)
molemmat= n!/ ((k - l)!(n - k)!).
25. a) 10 b) 9 26. a) 0.375 b) 0.063 27. 0.149 28. a) 0.105 b) 0.676 c) 0.063 29. a) 0.2 b) 0.05 c) 0.15 d) 0.467 e) 0.367 30. Todistuksen voi perustaa a) induktioon, b) kombinatoriikkaan, c) analyysiin (derivoimalla funktiota/( x) = ( 1 + x t). 31. a) 0.9997 b) 0.084 32. a) n/N 33. 0.815, 0.044, 0.229, 0.771 34. 0.045 35. a) 0.9999 b) 0.381 c) 0.868 36. a) 0.355 b) 0.976 c) 0.501 37. 0.5
39. 0.100
205
Vastaukset, luku 1
41. 34650
42. a)0.036 b)0.321
43. (
7) (k
J)n -i /k n
44. I::=o(-1tG)0). c)c 2,F(x)=l28. a)c
1 b)F(:e)=l
(x+J)e-"'(:e>O) c)0.264
29. a)0.2 b)0.4 c)0.1 30. 0.409 31. a)O.l b)0.1 c)0.01 32. I - :e/6, 0 � x � 6 (0, jos x>6). 33. Y:n kf saadaan ottamalla tn:t puolittain yhtälöstä {Y � y} 34. Å 2'. 0.231 35. a)ja b)0.223 36. 0.082 37. b � 0.0905 38. a)0.955 b)0.0228 c)0.941 39. 0.891 40. 31.2
{ X � (y
(i)
= L ip. = LPi L 1
a)/(b - a)}.
k=I
.
Vastaukset, luku 2
21
41. a)0.997 b)0.159 c)15.9 42. a)0 b)4 c) .Ji72 44. F(x)
= 0, 1 -p tai I sen mukaan, onko .i: .t b)F(t) =(1 - e->.t)3, f(t) c)Bin(3, e-.:\t).
= 3.Xe->.t(l - e-,\t)2(t > 0)
k=0, 1 ,. . . , n (k+1)/(n +1) 2 , 2 k n +l, ... ,2n . (2n -k+1)/(n +l) , 1 b) k! 1 tai Zn- k+ 1 sen mukaan onko O :; k :Sn vai n < k :S2n .
48. a)/(k)
{
49. a)Käytä Lausetta 2.6.3. b)Ovat. 50. a)N(2µ, 4u 2 ) b)N(µ, u 2/2) c)N(O, 2u 2 ) d)N(6µ, 13u 2 ) 51. 0.841 52. 0.477, 0.159 53. n= 10000 54. a)f(z) 55. f(z)
-l 0)
2.Xye->- 11 (y > 0), E(Y) = 2
60. F(x) = �arctanx+ olemassa.
i,
f(x)
(y > 1)
{ji 1r(i!� 2) (x E llt). Odotusarvoa ei ole
VastaukseJ,Juku _ 2_ _
212 61. Induktio. 62. N· ( 1
( 1 - p) k
63. a) 4 b) l 1
+ t;)
1
64.a)f(1)==3,/(k) (k EN + ) b) E(X) - 2.33 65. a) e->.pt
' ( 1) k-1 3 2
(k=2,3, ...),F(k)
1 ({) k1 - l 3 -
b) T"' Exp(Ap)
66. 0.821 67. 0 68. TN II: L.2.1.5 69. TN II: L.2.2.4 ( ii) 70. Esim. induktiolla n:n suhteen kaavassa p (n?:=1 {1A; E Ei}) nr:,c) P{IA; E Ei}. 71. Osoita ensin, että funktio G(t) = P{X
G'(t) =
AG(t).
72.
f(z) =
{ i-
z2 /2 (3
(z
z) 2 /2 ,
,
> t} toteuttaa differentiaaliyhtälön
O.3.:,?e-J>.3! (x > 0), l/). b) f(x) = 6>..c 2>-3!(J e-h) (x > 0), 5/(6>..) (x 41.Käytä täysadditiivisuutta (TN3)ositukseen
{X> O}
=
> 0)
= 1 I LJ Ak, Ak = { k ::; X< k _ I }.
k=I
42. ( =}) L.2.6.6 ja L.3.1.l(ii). (.), ks. HT 3.39b.
51. ( i) Kun N � n0, opastus riittänee. ( ii) Tapauksessa X � 0 voit käyttää kohtaa a ja Huomautuksen 3.1.2 kohtaa (] oc) ( iii) Yleinen tapaus selviää hajotelmalla X = x + - X (Huom. 3.1.2(2° )) 52. Induktio (apuna voi käyttää myös HT 3.65:n tulosta). 53. Ohjeesta saadaan Tn :n kf:lle Fn 1-
At)k I: e->.t (__ k!
n-1
k= D
V äite seuraa tästä derivoimalla.
(t > 0).
216
Vastimkset, luku 3
54. r( ! ) palautuu N(O, 1)-jakauman tf:on. L.3.7.2(iii):stä saadaan I r(n + 2) 55. 2/i ·
v,r· l· 3. 5" ·(2n - l)/2n.
r ( !.:}1) / vif, kun r > -1.
56. Lähde integraalista r(ri)r(ri) raavat sijoitukset
{:
t2
{
t
u
= fr� Ja°° x r 1 - 1y r2
= r cos 0
{
r sinO
57. Totea ensin, että { N '2'. n} = { Sn � 3.7.6. Tulos: N ,...., Poisson(>.t) .
1e-(:i:+y) dx dy ja tee seu
V= r� w = cos2 0
t}, missä Sn
Li::: 1 Xi.
KäytäLausetta
58. Käytä HT 3.57:n tulosta ja Esim. 2.6.10:n induktiivista yleistystä. Tulos: tn = 0,294.
E(T)
10.
60. (v) onR-arvoinen(2t) (1>(t))2 seuraa, että [(t)J 1 kaikilla t E R. L.3.9.4(vii):n nojalla X :n täytyy olla vakio. 64. Totea (L.3.9.7), ettän(t)
= (1 +
n
+ �t:(�)
r·
217
luku 3
65. i E (e tS) = E
s(t)
=
L P{N
k=O
(f
k=O
k) it l{N=k}e (Y1+.. ·+Y )
k} (.1/(>.1
+ >.2), 0.333
8. a)(a-x) 2 /a2 b)a/3
9. (3b - a)2 /a2 , 1 - 3(a - b)2 /a2 sen mukaan, onko 1
10 . x
+ 61 , 31 , 67 - x sen mukaan, onko O < x
P(A)
= 0.306.
11. a) Tulos on Esimerkissä 2.6.14 b)- ln z (0< z< 1) C) 0< Z � ] ), ] /( 2z 2 ) ( z > ] )
!(
1 2. f(y,z)
13. 0.3
= n(n- l)(y - zr- 2
14. a)Esim. (XI Y
15. f(x)
=
5 5 � 61, 61 < x < _ 6, 6 < x < J .
(0< z< y< 1).
= y) rv Tas(-�,�)
2nx(1 - x2)n-l
(O-y)), z+ Jj>..
28. a)(21r)-1 b)N(O, 1 ), N(O) 2) c)-0.707 d)N(-:v,l),N(-�,f) e) :v,-y/2
5 1· ?9 - · a) • 0, O,· 16' 4' b)N(O,1�), N(O,i), N( 30. X
, i),N(�,
i).
= U, Y = -U + V3 V ( vastaus ei ole yksikäsitteinen), 2X Y "' N(0, 4)
31. Kun s > 0, t E (0,21r), on P{R � sjaG :=:; t}
=
jj (b-a)X + a
Eksponenttijakauma
Huom. X
=
= l,
2
karakteristinen funktio Huom, X
Tas(a,,b) (a < b): P{a 0), P{X > O} = I,
tf kf
f(x) = .\e->.x F(x) = 1 - e->.x
odotusarvo
E(X) = ±
varianssi
D 2 (X) =
karakteristinen funktio
±X
rv
Standardinormaalijakauma
= (1
;2
rv
(t E IB.)
- �) - I
Exp(.\). Exp(.\)
X
(x > 0)
= Gamma(!,.\).
N(O, !),
1 - 2 cp(x)= y27re 1"' 1
tf kf
"' ( X)= y27r j 1
-oo
odotusarvo varianssi karakteristinen funktio
E(X) = O D 2 (X) = 1
0)
= -;;.'f!
tf
f(x)
kf
F(x)
= ."' f(x) = f'(r) E(X) X D 2 (X) {2 -r "t)
(r
> 0, >. > 0), P{X > O} (:c
> 0)
( ] -- �
.) Y rv Gamma(r2, >.) } ::;:,- X+ Y X 1L y
Gamma (
I,
l,
n.
rv
Gamma(r1 + r2, >.)
Tiivistelmäjakaumista.
Cauchy-jakauma
X
227 rv
l
l
f(x) = ?r,8 1
tf
kf
F(x)
l
=
1r
2 + (m�a)
(3
E(X) ei ole olemassa
karakteristinen funktio