Sannsynlighetsregning og statistisk metodelære 1: Sannsynlighetsregning [1, 5 ed.]
 8251908310 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Del 1

Sannsynlighetsregning 5. utgave

NB Rana Depotbiblioteket

TAPIR

© TAPIR

Uten skriftlig tillatelse er det ikke tillatt å kopiere eller mangfoldiggjøre dette skrift, eller deler av det, ifølge lov av 12. mai 1961 om opphavsrett til åndsverk.

Første utgave 1972 Andre utgave 1976 Tredje utgave 1979 Fjerde utgave 1985 Femte utgave 1988 Trykk: Bind: Papir: Omslag:

Tapir Julius Maske A/S G-print 90 gr. Leif Gaustad

ISBN 82-519-0831-0

,,Sandsynlighedsregningen er en matematisk Videnskab og som saadan henter den hjcelp fra Aritmetiken og Geometrien. Ved disses Bistand har den bygget sig et Palads, hvis faste Mure trodse Tvivlens og Kritikens skarpe Pile. Den yder Raad og Bistand snart til Astronomen og Fysikeren, der komme og bede om Oplysning i mere end et tvivlsomt og vanskeligt Spørgsmaal, snart til Trigonometristen og Landmaaleren, snart til Statsmanden og Statistikeren. ” Fra Dr. A.S. Guldberg: „0m Sandsynlighedsregningen og dens Anvendelse på Hazardspil og Forsikringsvæsen”, (side 2), Christiania 1873.

VI

Forord til forste utgave Statistisk tenkemåte og statistiske metoder er i de seneste årtier tatt i bruk innenfor nær sagt alle områder av næringsliv og forskning. Dette gjelder ikke minst samfunnsvitenskap, medisin, naturvitenskap og teknikk. (Gallup­ undersøkelser, analyse av data som er innsamlet eller som er resultat av eks­ perimenter, vurdering av forsøksopplegg, og beskrivelse av fysikalske eller teknologiske prosesser.) Ved slike analyser gjør en i stadig større utstrekning bruk av matematiske (sannsynlighetsteoretiske) modeller. Fagfolk på de forskjelligste felt føler derfor et økende behov for å være orientert om de viktigste prinsippene i den statistiske metodelære og om grunnbegrepene i sannsynlighetsregning bl.a. for å kunne følge med i sine egne fagtidsskrifter. I dag gis det derfor innføringskurs i sannsynlighetsreg­ ning og statistikk ved en rekke postgymnasiale undervisningsinstitusjoner. Denne boken utgjør første bind av en bearbeidet versjon av mine foreles­ ningsnotater ved et innføringskurs i sannsynlighetsregning og matematisk statisikk ved Universitetet i Trondheim, Norges tekniske høgskole.

Hensikten med kurset er — etter at det nødvendige grunnlag er lagt i sannsyn­ lighetsregning — å gi en innføring i grunnbegrepene i den statistiske metode­ lære. En tar sikte på at studentene etter endt kurs 1) 2) 3)

skal kunne gjenkjenne enkle standardsituasjoner og vite hvordan disse best kan analyseres, forstå hva som ligger i de viktigste begrepene og kjenne såpass til terminologien at de kan kommunisere med en fagstatistiker i mer kompliserte situasjoner.

I dette bind gis en innføring i elementene av sannsynlighetsregningen og i de mest benyttede modeller med tilhørende sannsynlighetsfordelinger. I annet bind er det meningen å ta for seg den statistiske metodelære med hovedvekt på estimering og hypotesetesting. I forbindelse med utarbeidelsen av første bind har jeg hatt god hjelp av universitetslektorene Per Hokstad og Liv Høyland, samt av cand, real Ivar Heuch og cand, real Bent Natvig.

Det som her presenteres er ment som en foreløpig utgave. Jeg er derfor inter­ essert i å få såvel kommentarer som kritikk og også i å bli gjort oppmerksom på trykkfeil slik at den endelige utgave kan bli bedre enn den foreløpige. Trondheim, juni 1972 Arnljot Høyland

VII

Forord til annen utgave De 9 første kapitler er, bortsett fra mindre endringer og rettelser, stort sett de samme som i første utgave. I kapitel 10 har jeg føyd til noen avsnitt der jeg presenterer vanlig forekom­ mende sannsynlighetsfordelinger.

I kapitel 11 har jeg tatt med definisjoner av konvergens i sannsynlighet og av konvergens i fordeling. Enkelte universitets- og høgskolelærere i statistikk har uttrykt at de finner det naturlig å avslutte et kurs i sannsynlighetsregning med utvalgte avsnitt fra estimeringsteori. Derfor inneholder annen utgave av boka tre nye kapit­ ler, 12, 13 og 14, der en tar for seg estimeringsproblemet. Dette emne hører strengt tatt ikke hjemme i sannsynlighetsregningen og er derfor trykt i en annen farge som et tillegg. Disse tre kapitlene er også tatt med i del II av læreboka, der den statistiske metodelære behandles samlet.

I forordet til første utgave ba jeg om kommentarer og kritikk. Jeg vil her be­ nytte anledningen til å takke dem som har pekt på svakheter og trykkfeil i første utgave. Spesielt vil jeg takke høgskolelektor Henrik Dahl og universi­ tetslektor Trygve Nilsen. Samtidig vil jeg takke universitetslektor Liv Høyland for uvurderlig hjelp i forbindelse med utarbeidelsen av annen utgave. Trondheim i januar 1976

Arnljot Høyland

Forord til tredje utgave Jeg har rettet noen trykkfeil og foretatt noen mindre endringer. For øvrig er tredje utgave identisk med den forrige. Trondheim i juli 1979 Arnljot Høyland

VIII

Forord til fjerde utgave Ennå noen trykkfeil er oppdaget og rettet. Nå skulle det forhåpentligvis ikke være mange tilbake. Dessuten er noen få avsnitt skrevet om. Videre er det gjort noen typografiske endringer slik at det skulle bli lettere for brukeren å finne fram i boka. Trondheim i november 1984

Arnljot Høyland

Forord til femte utgave Den såkalte ”inverse Gaussfordeling” er i de senere år blitt brukt stadig mer ved analyse av levetidsdata av en bestemt type. Ennå har få lærebokforfattere tatt den med. I denne utgaven har jeg imidlertid funnet det riktig å ta med et lite avsnitt om denne fordelingen, særlig av hensyn til dem som senere skal sette seg inn i pålitelighetsteori.

Dessuten har jeg tatt med definisjoner av begrepene modalverdi og unimodale fordelinger og rettet opp noen få trykkfeil.

Forøvrig er femte utgave identisk med den forrige. Madison, Wisconsin 1988 Arnljot Høyland

INNHOLD

1

2

3

Stokastiske forsøk - Utfallsrom - Hendelser 1.1 Matematiske modeller 1.2 Stokastisk forsøk (Random experiment) 1.3 Utfallsrom - Enkeltutfall 1.4 Hendelser 1.5 Sammensetning av hendelser - Litt mengdealgebra 1.6 Venn-diagrammer 1.7 Anvendelse av union- og snittsymbol på flere enn 2 hendelser 1.8 Statistisk regelmessighet - Relativ hyppighet Sannsynlighetsregning 2.1 Definisjon av sannsynlighetsbegrepet 2.2 Sannsynlighetsregning i endelige utfallsrom 2.2.1 Uniforme sannsynlighetsmodeller 2.2.2 Litt kombinatorikk 2.2.3 Tilfeldig utvelging fra endelig populasjon. Stikkprøve 2.3 Betinget sannsynlighet 2.3.1 Definisjon av betinget sannsynlighet 2.3.2 Multiplikasjonssetningen 2.3.3 Ordnet stikkprøve. Ekvivalenssetningen 2.3.4 Oppdeling av utfallsrommet. Total sannsynlighet 2.3.5 Bayes formel 2.4 Uavhengige hendelser

23 26 29 32 33 35 36 37

Endimensjonale sannsynlighetsfordelinger 3.1 Stokastiske variable 3.2 Hendelser definert ved stokastiske variable 3.3 Fordelingsfunksjon 3.4 Diskret sannsynlighetsfordeling 3.5 Forventningsverdi og varians for diskrete variable 3.6 Kontinuerlig sannsynlighetsfordeling 3.7 Forventningsverdi og varians for kontinuerlige variable 3.8 Funksjoner av stokastiske variable 3.8.1 Fordeling for en funksjon av en stokastisk variabel 3.8.2 Forventningsverdi 3.9 Tsjebysjeffs ulikhet 3.10 Moment. Sentralmoment 3.11 Kvantiler - Median - Kvartiler 3.12 Modalverdi

42 42 45 45 48 50 55 58 60 60 63 66 66 67 67

1 1 2 3 3 4 6

6 7 10 10 13 13 17

X

4

Viktige sannsynlighetsteoretiske modeller 68 4.1 Binomisk modell 68 4.1.1 Binomisk fordeling 68 4.1.2 Bemoullis lov om de store tall 72 4.1.3 Beregning av binomiske sannsynligheter 72 4.2 Hypergeometrisk modell 74 4.2.1 Hypergeometrisk fordeling 74 4.2.2 Beregning av hypergeometriskesannsynligheter 75 4.2.3 Beregning av E(X) 76 4.3 Poisson-modell 77 4.3.1 Poissonforde lingen 77 4.3.2 Beregning av Poisson-sannsynligheter 78 4.3.3 Utledning av Poissonfordeling (Poissons punktprosess) 78 4.4 Sammenheng mellom binomisk, hypergeometrisk og Poisson­ fordeling 80 4.4.1 Binomisk fordeling - hypergeometrisk fordeling 80 4.4.2 Binomisk fordeling - Poissonfordeling 81 4.5 Ventetid i Poissons punktprosess 82 4.5.1 Eksponensialfordeling 82 4.5.2 Utledning av eksponensialfordeling 82 4.6 Gaussmodell 83 4.6.1 Standard-normalfordelingen 84 4.6.2 Beregning av sannsynligheter i Gaussmodell 85

5

Flerdimensjonale sannsynlighetsfordelinger 5.1 Todimensjonal fordeling 5.1.1 Hendelser definert ved vektorer i planet 5.1.2 Fordelingsfunksjon for vektoren (X1?X2) 5.1.3 Diskret todimensjonal sannsynlighetsfordeling 5.1.4 Kontinuerlig todimensjonal sannsynlighetsfordeling 5.1.5 Betingede fordelinger 5.1.6 Uavhengige variable 5.1.7 Kovarians. Korrelasjon 5.1.8 Setninger om dobbeltforventning 5.2 n-dimensjonale fordelinger 5.2.1 Fordelingsfunksjon for vektoren (X15...,Xn) 5.2.2 Diskret n-dimensjonal fordeling 5.2.3 Kontinuerlig n-dimensjonal fordeling 5.2.4 Uavhengige variable 5.2.5 Kovarians. Korrelasjon 5.2.6 De store talls lov 5.2.7 Indikatorvariable 5.2.8 Approksimasjon av E[g(X15..., Xn)] og Var[g(X1,...,Xn)]

87 87 87 88 90 94 97 101 103 107 108 108 109 110 111 112 113 113

115

XI

6

Viktige flerdimensjonale sannsynlighetsteoretiskemodeller 6.1 Multinomisk modell - Multinomisk fordeling 6.2 Den multinormale modell - Multinormal fordeling 6.2.1 Binormal fordeling Ordningsobservatoren - Ekstremvariable - Median Variasjonsbredde 7.1 Innledning 7.2 Fordeling for ekstremvariable 7.3 Fordeling av X(k) 7.4 Fordeling for variasjonsbredde

117 117 119 119

8

Momentgenererende funksjon 8.1 Definisjon 8.2 Egenskaper ved den momentgenererende funksjon 8.3 Karakteristisk funksjon

130 130 132 134

9

Konvolusjon 9.1 Definisjon 9.2 Lukkede fordelingsklasser 9.3 Alternativ fremgangsmåte ved bestemmelse av konvolusjon

136 136 136 138

10

Noen viktige fordelinger 10.1 x2-fordelingen 10.1.1 Definisjon. Egenskaper 10.1.2 Forbindelse mellom normalfordelingog x2-fordeling 10.2 Students t-fordeling 10.2.1 Definisjon 10.2.2 Forbindelse mellom normal-, x2- ogt-fordeling 10.3 Fishers F-fordeling 10.3.1 Definisjon 10.3.2 Forbindelse mellom x2-, t- °g F-fordeling 10.4 Gammafordelingen 10.4.1 Definisjon. Egenskaper 10.4.2 Ventetid i Poissons punktprosess 10.5 x-forde lingen 10.5.1 Definisjon. Egenskaper 10.5.2 To fordelinger avledet av x-fordelingen i) Rayleighfordelingen ii) Maxwell(-Boltzmann)-fordelingen 10. 6 Fordeling for levetid - Weibullfordelingen 10. 7 Betafordelingen 10. 8 Lognormalfordelingen 10. 9 Negativ binomialfordeling (kalles av enkelte Pascals fordeling) 10.1 0 Den inverse Gaussfordelingen

140 140 140 142 143 143 144 146 146 147 149 149 150 151 151

7

122 122 124 126 127

153 154 155 157 158 160 162

XII

11

Stokastisk konvergens - Sentralgrenseteoremer 11.1 Konvergens i sannsynlighet 11.2 Konvergens i fordeling 11.2.1 Definisjon 11.2.2 Asymptotisk normalitet 11.2.3 Lindeberg - Levys sentralgrenseteorem 11.3 Approksimasjon ved normalfordeling 11.3.1 Innledning 11.3.2 Binomisk fordeling 11.3.3 Middeltallets fordeling 11.4 Bevis for Sentralgrenseteoremet (Setning 11.2.)

168 168 169 169 170 170 171 171 171 173 173

Appendiks I

Gammafunksjonen

175

Appendiks II

o-felt av hendelser - Sannsynlighetsfelt

177

TILLEGG

12

Innledning til estimeringsteorien

13

Punktestimering 13.1 Innledning 13.2 Estimering av forventningsverdi og varians 13.3 Prinsipper for konstruksjon av estimatorer 13.3.1 Sannsynlighetsmaksimeringsprinsippet 13.3.2 Minste kvadratsums prinsipp 13.3.3 Momentprinsippet 13.4 Markov-estimatorer

3 3 8 9 9 13 17 18

14

Intervallestimering 14.1 Innledning 14.2 Konstruksjon av konfidensintervall

19 19 20 25

Stik

kordliste

1

1.

STOKASTISKE FORSØK - UTFALLSROM HENDELSER

1.1.

Matematiske modeller

Innenfor naturvitenskap og teknikk blir det stadig mer vanlig å nytte ma­ tematiske modeller av de fenomener som studeres. Fenomenene beskrives ved hjelp av vektorer, funksjoner, mengder etc. som pålegges visse relasjo­ ner. For å være »realistisk» må modellen beskrive de trekk ved fenomenet som er vesentlige i den konkrete situasjon som foreligger, men behøver ikke være nøyaktig i alle detaljer. En av pionerene innenfor den matematiske statistikk, Jerzy Neyman, ut­ trykker dette på følgende måte i artikkelen »On the problem of estimating the number of schools of fish»:x)

Every attempt to use mathematics to study some real phenomena must begin with building a mathematical model of these phenomena. Of necessity, the model simplifies the matters to a greater or lesser extent and a number of details are ignored. The success depends on whether or not the details ignored are really unimportant in the development of the phenomena studied. The solution of the mathematical problem may be correct and yet may be in violent conflict with realities simply because the original assumptions of the mathematical model diverge essentially from the conditions of the practical problem considered. Beforehand, it is impossible to predict with certainty whether or not a given mathematical model is adequate. To find this out, it is necessary to deduce a number of consequences of the model and to compare them with observation.»

Dersom modellen impliserer at resultatet (forløpet av fenomenet) er éntydig gitt når bare utgangsbetingelsene er spesifisert, sies den være deterministisk. Keplers lover er et eksempel på en deterministisk modell av planetbevegelse. Visse fenomener lar seg ikke beskrive på en hensiktsmessig måte ved en de­ terministisk modell. Når en for eksempel i forbindelse med genetiske stux) Univ, of California, Publ. in Statistics Vol I 1954.

2

dier gjentatte ganger krysser individer av genotypen Aa, viser det seg at avkommet i omtrent 1/4 av tilfellene blir av genotype AA, i 1/4 av til­ fellene av genotype aa og i 1/2 av tilfellene av genotype Aa. Fenomener som dette beskrives oftest ved en sannsynlighetsteoretisk (stokastisk) mo­ dell. Mendels arvelover er et eksempel på en sannsynlighetsteoretisk mo dell av nedarving.

De nødvendige byggestener som benyttes ved konstruksjon av sannsynlighetsteoretiske modeller, finner vi i sannsynlighetsregningen. Vår første oppgave skal derfor bli å utvikle det nødvendige begrepsapparat for sann­ synlighetsregningen og utlede regneregler for dette.

1.2.

Stokastisk forsøk (Random experiment)

I forrige avsnitt nevnte vi at visse fenomener ikke lar seg beskrive på hen­ siktsmessig måte ved en deterministisk modell og ga et eksempel på en slik situasjon. La oss kort referere noen andre:

Eks. 1.1.

Kast med et pengestykke. Registrer resultatet som »Kroneside opp» eller »Myntside opp».

Eks. 1.2.

Kast med en terning. Registrer resultatet som antall øyne som terningen viser.

Eks. 1.3.

Trekk et kort fra en stokket kortstokk. kort som trekkes ut.

Eks. 1.4.

Kast med et pengestykke inntil resultatet »krone» opptrer første gang. Noter antall kast i kastserien.

Eks. 1.5.

Tenn en ny lyspære og la den lyse inntil den brenner ut. Noter levetiden.

Eks. 1.6.

Velg en stålstang tilfeldig fra et stål-lager. Bestem flytegren­ sen for denne.

Eks. 1.7.

Ta en prøve fra en kjemisk oppløsning. denne.

Registrer hvilket

Bestem pH-verdi for

Hva er det som karakteriserer alle disse situasjoner?

A)

I hvert enkelt tilfelle kan en ikke forutsi hva resultatet av »eksperimentet» vil bli. En kan imidlertid angi en mengde av mulige enkeltresultater slik at hvert forsøk gir som resultat ett og bare ett av re­ sultatene i mengden.

Stokastiske forsøk - Utfallsrom - Hendelser

B)

3

I hvert enkelt av tilfellene kan en gjenta eksperimentet under samme (eller tilnærmet samme) betingelser så mange ganger en ønsker.

Slike eksperimenter vil vi kalle stokastiske forsøk.

1.3.

Utfallsrom - Enkeltutfall

En mengde resultater som den vi beskrev i A ovenfor, kalles et utfallsrom for forsøket og vil her bli betegnet med S. Elementene (resultatene) i S vil vi kalle enkeltutfall (i forhold til S). Utfallsrommet S vil ikke være en­ tydig gitt i enhver situasjon (se eks. 2.2, s. 16), men ofte fremtrer et be­ stemt utfallsrom som naturlig og hensiktsmessig.

I I I I I

eks. 1.1 eks. 1.2 eks. 1.3 eks. 1.4 eks. 1.5

er er er er er

S S S S S

= {Krone, Mynt}. = {1, 2, 3, 4, 5, 6}. = {Kl. Ess, Kl. 2, . . ., Sp. Da, Sp. Ko}. = {1, 2, 3, 4, 5, 6, . . . }. = {t: t > 0}, der t e R, og Rstår for mengden av de reelle tall.

I eksemplene 1.1, 1.2 og 1.3 består utfallsrommet av endelig mange ele­ menter. I eksempel 1.4 består utfallsrommet av et ikke endelig, men nummererbart antall elementer. Utfallsrom av disse to typer sies være diskrete. I eksempel 1.5 er utfallsrommet hverken endelig eller nummererbart, men består av alle positive reelle tall. Når S, som her, utgjøres av alle reelle tall i et nærmere angitt intervall, sies utfallsrommet å være kontinuerlig. Utsagnet »S er mengden av alle elementer x i intervallet (a,b)» skrives S = {x: a < x < b}

At S består av alle x som tilfredsstiller en bestemt matematisk relasjon ø(x) = c, uttrykkes analogt slik: S = {x: ø(x) = c}

Klammeparentesene { } vil bare bli brukt i forbindelse med karakterisering av hendelser (mengder).

1.4.

Hendelser

Når en analyserer eksperimenter (situasjoner), er en ofte interessert i mer

4

sammensatte resultater enn enkeltutfallene. I eks. 1.2 kan f.eks. utfallet av et temingspill avhenge av om kastet resulterer i et odde eller et like antall øyne; i eks. 1.3 kan en være særlig interessert i at trekningen re­ sulterer i et billedkort; i eks. 1.4 at vi blir nødt til å kaste mer enn 4 ganger før vi får »krone»; i eks. 1.5 at levetiden for lyspæren skal over­ skride 1 000 timer, osv. I alle disse eksemplene ser vi at det sammensatte resultat (odde antall øy­ ne, billedkort, osv.) kan beskrives som en delmengde av utfallsrommet S for vedkommende eksperiment. (A sies være en delmengde av B dersom ethvert element i A også er et element i B. Dette skrives slik: ACB.)

En delmengde A av utfallsrommet kaller vi en hendelse A.

Resulterer eksperimentet i et enkeltutfall e som tilhører A (eeA), sies hen­ delsen A å ha inntruffet. Er derimot resultatet et enkeltutfall e som ikke tilhører A (e£A), sies hendelsen A ikke å ha inntruffet.

1.5.

Sammensetning av hendelser - Litt mengdealgebra

To hendelser A og B sies være like dersom de inneholder de samme enkelt­ utfall, dvs. ACB og BCA. Dette skrives også A = B. Den hendelse som er definert ved delmengden {e: e^A}

vil vi kalle komplementcerhendelsen (komplementet) til A og betegne med A*. (Andre betegnelsesmåter er Å, Ac og CA.) La S betegne utfallsrommet for et bestemt eksperiment, og la A og B være to hendelser (i S). Da er en undertiden interessert i å kunne karakterisere det sammensatte resultat som består i at »enten A eller B (eller begge to)» inntreffer, m.a.o. at minst én av de to hendelser inntreffer. Denne hendel­ se kan beskrives med delmengden

{e: eeA eller eeB} I mengdelæren betegnes denne mengde som unionen av A og B og skrives AUB.

Om vi i eks. 1.3 lar A betegne hendelsen »Det trekkes et billedkort» og B betegne hendelsen »Det trekkes en spar», betegner altså (AUB) at trekning­ en resulterer i »billedkort eller spar». Vi ser lett at hendelsene (AUA*) og S består av de samme enkeltutfall,

Stokastiske forsøk - Utfallsrom - Hendelser

følgelig er (1.1)

AUA* = S

S må altså alltid inntreffe og er en sikker hendelse. Av og til er vi også interessert i å kunne karakterisere det sammensatte resultat at »både A og B inntreffer på en gang». Denne hendelse kan beskrives ved delmengden

{e: eeA og eeB} I mengdelæren betegnes denne mengden som snittet (intersection) av A og B og skrives AAB.

I eksemplet ovenfor vil (AAB) betegne at trekningen resulterer i at det trekkes et billedkort i spar. Det kan selvfølgelig inntreffe at A og B ikke har noen elementer felles. I så fall sies A og B å være disjunkte. For at (AAB) også i dette tilfel­ let skal kunne sies å være en mengde, innføres begrepet tom mengde. En tom mengde er altså en mengde som ikke inneholder noen elementer. Bokstaven 0 reserveres til å betegne slike mengder. 0 representerer da samtidig en umulig hendelse.

At A og B er disjunkte hendelser, kan vi nå skrive slik:

(1.2)

AAB = 0

Eksempel: I eks. 1.5 lar vi A betegne at en gitt lyspære skal ha levetid kortere enn 1 300 timer, B betegne at den skal ha levetid lenger enn 1 000 timer og C at den skal ha levetid lenger enn 1 500 timer. Da be­ tyr (AAB) at lyspærens levetid ligger mellom 1 000 og 1 300 timer, mens (AAC) = 0.

Øving 1.1. Verifiser følgende relasjoner:

i) ii) iii) iv)

AAA* = 0 AUØ = A 0* = S S* = 0

v) vi)

SAA A

= A = (AAB) U (AAB*)

5

6

1.6.

Venn-diagrammer

Undertiden er det nyttig å illustrere sammensetning av hendelser ved så­ kalte Venn-diagrammer. Utfallsrommet representeres da f.eks. ved punktene i et rektangel, og hen­ delsene A og B ved mengder av punkter innenfor to gitte konturer:

Fig. 1.1 AUB, AUB, A* er da representert ved de skraverte områder i figurene 1.2 til 1.4.

Øving 1.2. Vis at hendelsen »Hverken A eller B inntreffer» kan betegnes ved (A*CiB*), alternativt ved (AUB)*, slik at (A*ØB*) = (AUB)*. Vis og­ så at (A*UB*) = (AUB)*.

1.7.

Anvendelse av union- og snittsymbol på flere enn 2 hendelser

La S være et utfallsrom og A15 A2, . . An være n hendelser (i S). Det sammensatte resultat »Minst én av hendelsene A15 A2, . . ., An» beskrives

Stokastiske forsøk - Utfallsrom - Hendelser

da åpenbart ved gjentatt bruk av unionsymbolet, ): ved

(. . .( (A1UA2)UA3)U . . . UAn). En overbeviser seg lett om at parentesene er overflødige. derfor kortere skrives som n U j=l

Resultatet kan

Ar J

Det sammensatte resultat »Alle hendelser Ax, A2, . . ., An inntreffer (på én gang)» beskrives analogt ved (. . .( (Aj OA2 )fiA3 ). . . An).

Også her er parentesene overflødige, og en skriver resultatet n

n A;.

j=l

J

Ovenstående skrivemåte generaliseres til uendelige sekvenser av hendelser Ai, A2, • • • oo

oo

U A: betegner da at »minst én A, opptrer», mens A A, betegner at samt-

j=i

J

J

j=i

J

lige Aj opptrer (på én gang).

La oss til slutt definere hva vi skal forstå ved parvis disjunkte hendelser. En sekvens hendelser Ax, A2, . . ■ sies være parvis disjunkte dersom for alle i f j Ai^Aj 1 J = 0

Øving 1.3. Vis at i)

AjOfA^As) = (A1OA2)U(A1nA3)

ii)

(U A,)U(O AD = S

iii)

(U Aj)n(O A*) = 0

1.8.

n

n

j=i

J

n

j=i

j=l

J

n

J

j=i

J

Statistisk regelmessighet - Relativ hyppighet

Vi har nå utviklet et hensiktsmessig begrepsapparat for å kunne beskrive totalmengden av alle mulige enkeltutfall (utfallsrommet) og kan definere sammensatte resultater i forhold til dette (hendelser). Men fremdeles er

7

8

vi temmelig hjelpeløse når det gjelder å beskrive hva resultatet vil bli der­ som eksperimentet virkelig blir utført. Siden et stokastisk forsøk karakte­ riseres ved at en ikke kan forutsi hva resultatet vil bli, kunne situasjonen synes håpløs. Et stokastisk forsøk er imidlertid også karakterisert ved at det kan tenkes gjentatt under samme (eller tilnærmet samme) betingelser så mange ganger en ønsker. La oss anta at vi har med et konkret stokastisk forsøk å gjøre hvis utfalls­ rom er S, og la A representere en bestemt hendelse (i S). La oss gjenta forsøket n ganger og betegne det antall av disse som resulterer i A med nA. Da viser det seg erfaringsmessig at den relative hyppighet av A, n^Jn, har tendens til å stabilisere seg i nærheten av et bestemt tall p når n gjø­ res større og større, og om vi utfører en ny forsøksserie, vil erfaringsmes­ sig «A/« lgien stabilisere seg i nærheten av det samme tall p. Et stokas­ tisk forsøk viser seg erfaringsmessig å være underlagt det vi kaller statis­ tisk regelmessighet. Dette tallet p synes det naturlig å konsentrere opp­ merksomheten om. Når vi senere i den samme situasjon snakker om sann­ synligheten for hendelsen A, er det dette tallet p vi tenker på. Disse be­ traktninger vil ikke bli brukt som definisjon av sannsynlighetsbegrepet, men utelukkende som en motivering. Det sannsynlighetsbegrep som vi skal inn­ føre, vil bare ha mening i situasjoner som kan beskrives ved stokastiske for­ søk som er underlagt statistisk regelmessighet.

Eksempel: La eksperimentet bestå i å knipse en tegnestift og registrere om den blir liggende med spissen opp (A) eller ikke (A*). Her består utfalls­ rommet av to enkeltutfall ej og e2.

ei •

e2



Fig. 1.5 A er definert ved et.

Dersom vi knipser tegnestiften et stort antall (n) ganger og registrerer i hvor mange (nA) av disse vi får resultat A, vil erfaringsmessig nA/n ha en tendens til å stabilisere seg i nærheten av et bestemt tall. Dette vil være det samme i nye kastserier med samme tegnestift, men nA/n vil kunne nærme seg et annet tall dersom vi knipser med en annen tegnestift, der

Stokastiske forsøk - Utfallsrom - Hendelser

9

f.eks. forholdet mellom skivediameter og nållengde er et annet. Når vi sier at sannsynligheten for at tegnestiften skal bli liggende med spissen opp er 0.42, skal altså dette, bety at i en lang kastserie vil den bli liggende med spissen opp i ca. 42 % av kastene.

Øving 1.4. La eksperimentet bestå i å kaste med to mynter, qg la A betegne at myntene blir liggende med forskjellige sider opp. (En med kronesiden opp, én med myntsiden opp.) Gjenta eksperimentet 100 gang­ er og bestem nA/n. Gjenta eksperimentet 100 nye ganger og bestem nA/n i denne serie. Sammenlign resultatene.

oooOOOooo La oss til slutt summere opp hvilke egenskaper relativhyppigheter nødvendigvis vil måtte ha:

i) dersom A = S

ii) iii)

n

n

n

dersom AGB = 0

2. 2.1.

SANNSYNLIGHETSREGNING

Definisjon av sannsynlighetsbegrepet

Den som først utviklet sannsynlighetsregningen var Cardano (1501-1576). Manuskriptet til hans verk »The Book on Games of Chance», var avsluttet i 1564, men ble riktignok ikke trykket før i 1663. I mellomtiden var Christian Huygens bok »Calculations in Games of Chance» blitt publisert i 1657x? Som titlene på de to nevnte bøker forteller, ble sannsynlighetsreg­ ningen nyttet til beskrivelse og analyse av hasardspill. Jakob Bemoullis »Ars Conjectandi» (Kunsten å gjette), publisert i 1713, representerer en milepel i sannsynlighetsregningens historie, og bør også nevnes. Vi skal komme tilbake til den såkalte klassiske måte å definere sannsynlig­ het på i 2.2.1. Her skal vi nøye oss med å peke på at definisjonen er brukbar i forbindelse med hasardspill der utfallsrommet er endelig og det er innebygd en symmetri i spillet som gjør at en vil kunne si at enkeltutfallene vil opptre »like ofte».

Sannsynlighetsbegrepet har senere vært definert på forskjellige måter. Den definisjonsmåte vi skal nytte, skyldes A.N. Kolmogorov xx) og skriver seg fra 1933. Han innfører sannsynlighet som en mengde-funksjon P(-) som knyt­ ter reelle tall til hendelser Aj, A2, . . . i utfallsrommet S for et stokastisk forsøk. Argumentet for funksjonen er altså en mengde (hendelse), funksjonsverdien et reelt tall. (For at definisjonen skal være presis, trenges egentlig også en angivelse av den klasse A av hendelser P() er definert for. Se Appendix II.) Kolmogorov stiller opp følgende 3 aksiomer som sannsynlighetsregningen bygger på:

X)

7 Se f.eks. Olav Reiersøl: Notes on some propositions of Huygens in the calculus of probability. Nordisk Matematisk Tidskrift 1968. XX^A.N. Kolmogorov (1903 -1987).

Sannsynlighetsregning

I

0 < P(A)

II

P(S) = 1

III

Dersom A1? A2, . . . er en endelig eller uendelig sekvens av parvis disjunkte hendelser, skal

11

P(A1UA2U. . . ) = S P(AA j=l

III innebærer spesielt at

III'

P(AiUA2) = P(At) + P(A2), når AjOA, = 0

Legg forøvrig merke til analogien mellom de egenskaper relativhyppigheter har (se s. 9) og aksiomene.

(Det forhold at en matematisk teori bygges opp på aksiomer, er ikke noe særsyn. Euklids geometri og Newtons mekanikk representerer to andre eksempler på slik oppbygging.) Til tross for den generalitet som preger aksiomene, kan en umiddelbart avlede interessante setninger fra dem. Setning 2.1. (Komplementsetningen)

P(A*) = 1 - P(A)

Bevis: Siden AHA* = 0, følger av III' at P(AUA*) = P(A) + P(A*). På den annen side er (AUA*) = S og derfor P(S) = P(AUA*) = 1. Herav følger Setning 2.1.

Korollar 2.1.

P(0) = 0

Bevis: Velg A = S i Setning 2.1. Da er P(S*) = 1 - P(S) = 0, og siden S* = 0, følger påstanden.

En umulig hendelse får altså sannsynlighet 0. (En sikker hendelse har ifølge aksiom II sannsynlighet 1.)

12

Setning 2.2. (Addisjonssetningen)

P(AXUA2) = P(AJ + P(A2) - P^AAJ Bevis: Vi konstaterer først at

(AiUAJ = A1U(A2AA1*) Siden Ai og (A2nAj*) er disjunkte, er ifølge III'

(2.1)

P(AjUA2) = P(Ai) + P(A2nA1K)

Nå har vi at A2 = (A2nA!*) u (A2nAi) og siden (A^A^) og (A2nAi) er disjunkte, er ifølge III' (2.2)

P(A2) = P(A2nAi*) + P(A2nAi)

Løser vi (2.2) m.h.p. P(A2OA1?e) og setter resultatet inn i (2.1), følger Setning 2.2.

Setning 2.3. 3

P(AiUA2UA3) = S P(A:) - P(AjnA2) - P(AjnA3) j=i - P(A2AA3 ) + P(A1nA2nA3) Beviset overlates leseren som en øving. (Hint: Innsett først (A2UA3) = B, nytt foregående setning på P(A1UB) og sett så inn for B.)

Ved induksjon kan en nå bevise den generelle addisjonssetning: Setning 2.4. n

n

P(U A) = Z P(Æ) - S PtAiAAj) + j=l

J

j=l

J

i P(At).

2.2.

Sannsynlighetsregning i endelige utfallsrom.

Vi skal først ta for oss situasjoner som kan beskrives ved endelige utfalls­ rom. Enkeltutfallene i S betegner vi ej, e2, . . ., em. (I dette tilfelle vi­ ser det seg at en kan la A omfatte alle delmengder av S). La oss se hvilke konklusjoner vi nå kan trekke ved hjelp av Kolmogorovs aksiomer: Vi betegner hendelsen {ej} med Aj, j = 1, 2, . . ., m. Til enhver slik hend­ else er det knyttet en sannsynlighet P(Aj) > 0. Videre vet vi at

s = AjUA2U. . . UAm

og at AjOAj = 0 for alle i f j.

Ved å benytte aksiomene II og III får vi altså at 1 = P(S) = P(AJ + . . . + P(Am),

m.a.o. at (2.3)

m

SP({eJ) = l

j=i

J

De sannsynligheter som er knyttet til enkeltutfallene {ej} i et endelig ut­ fallsrom er altså alltid ikkenegative tall med sum 1.

Ut over dette kan vi ikke generelt si noe om størrelsene på de enkelte P({ej })•

La B være en hendelse sammensatt av enkeltutfallene e,J 1 e,J 2 . . ., e