Elementær innføring i sannsynlighetsregning og problemløsninger ved analyse av måleresultater
 8241902298 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Arvid Erdal

Elementær innføring i sannsynlighetsregning og problemløsning ved analyse av måleresultater

ALMA MATER

Det må ikke kopieres fra denne bok i strid med åndsverkloven eller avtaler om kopiering inngått med Kopinor, interesseorgan for rettighetshavere til åndsverk. Kopiering i strid med lov eller avtale kan medføre erstatningsansvar og inndragning, og kan straffes med bøter eller fengsel.

ALMA MATER FORLAG AS Postboks 4213 Nygårdstangen 5028 Bergen

© ALMA MATER FORLAG AS og forfatteren 1997 ISBN 82-419-0229-8 Digitaltrykk allkopi

Forord I 1972 ble det gitt ut et kompendium for studenter som tok emnet Fk 15 - Eksperimentalfysikk. Studieplanen i fysikk ved Universitetet i Bergen er siden den gang revidert flere ganger, og kompendiet er nå revidert og utvidet. FYS 130 - Grunnkurs i eksperimentalfysikk, som inngår i emnegruppen i fysikk, skal ifølge Studiehåndboken for realfag gi studenten en innføring i “å kunne måle ved generell bruk av måleinstrumenter som anvendes i enkle eksperimenter”. FYS 134 - Eksperimentalfysikk, som også inngår i emnegruppen i fysikk, “gir en videreføring av måleteknikk og behandling av måleresultater som omhandles i FYS 130. ... Laboratorieoppgavene demonstrerer ideer fra forskjellige deler av fysikken”. Formålet er å “gi studenten kjennskap til vanlig måleutstyr in­ nen fysikk og gi trening i utførelse og vurdering av eksperimenter”. Hensikten med kompendiet er fortsatt at det skal være til hjelp for dem som tar disse eksperimentelle emnene. For å bruke måleutstyr og behandle måledata må visse grunnleggende synspunkter klarleg­ ges, og kompendiet gir en elementær innføring i begreper, terminologi og metoder som brukes. Bevis og utledninger er ikke pensum til FYS 130 og FYS 134, men er tatt med for å vise hvordan formler og databehandlingsmetoder er blitt til. I fremstillingen ses problemene mest fra ståstedet til en eksperimentalfysiker og mindre fra ståstedet til en teoretiker. Hvis studenten etter å ha lest dette kompendium lettere kan sette seg inn i den videregående litteratur i emnet, er intensjonen med kompendiet innfridd. Bergen, juli 1997

A. E.

Innhold Forord 1

3

Grunnbegreper 1.1 Begrepet måling........................................................................................................ 1.2 Egenskapenes ubestemthet..................................................................................... 1.3 Hvorfor er alle egenskaper ubestemte?.................................................................. 1.4 Måling av ubestemthet........................................................................................... 1.5 En definisjons sikkerhet — to betraktningsmåter.................................................. 1.6 En målemetodes usikkerhet..................................................................................... 1.7 Tallbilder av fysiske størrelser............................................................................... 1.8 Gjentatte målinger .................................................................................................. 1.9 Feil og forfalskning — tilfeldige og systematiske feil......................................... 1.10 BIPM-metoden for angivelse av ubestemthet........................................................ 1.11 Eksempler for å belyse forskjellen mellom usikkerhet og feil............................ 1.12 Den sanne verdi........................................................................................................ 1.12.1 Eksempel med SKF-kule ......................................................................... 1.13 Opprinnelsen til ubestemthet og forfalskning........................................................ 1.14 Hvordan bestemme ubestemtheteni praksis?.........................................................

11 11 12 12 13 13 15 15 16 16 17 18 19 19 20 22

2 Sannsynlighetsregning 2.1 Innledning.................................................................................................................. 2.2 Statistiske fenomener............................................................................................... 2.3 Begrepet sannsynlighet............................................................................................ 2.4 Bertrands paradoks..................................................................................................

23 23 23 23 24

3 Sannsynlighetsregningens fundament 3.1 Første aksiom............................................................................................................ 3.2 Annet aksiom............................................................................................................ 3.3 Tredje aksiom........................................................................................................... 3.4 Mulige relative frekvenser for A og B...................................................................... 3.5 Fjerde aksiom........................................................................................................... 3.6 Femte aksiom........................................................................................................... 3.7 Nytten av sannsynlighetsregningen.........................................................................

26 26 26 27 27 28 28 29

4 Elementære regneregler 4.1 A og B utelukker hverandre..................................................................................... 4.2 A og B er stokastisk uavhengige ............................................................................

30 30 30

Generelle teoremer.................................................................................................... Komplementær hendelse.......................................................................................... “Ærlige” terninger .................................................................................................... Sannsynlighet for telle-arrangement....................................................................... Sannsynligheten for atomspaltning.......................................................................... Hasardspill av de Méré.............................................................................................

30 31 32 32 33 33

5 Bernoullifordelingen 5.1 Ordning av svarte og hvite kuler............................................................................. 5.2 Bemoullis problem.................................................................................................... 5.3 Bernoulliformelen ....................................................................................................... 5.4 Bernoullifordelingen................................................................................................. 5.5 Bernoullifordelingens form....................................................................................... 5.6 Bernoullifordelingens maksimalverdi .................................................................... 5.7 En analytisk approksimasjon til Bp(N',k)................................................................ 5.8 Hvordan Æ* avhenger av x....................................................................................... 5.9 Laplaces formel.......................................................................................................... 5.10 Feilintegralet og standardavviket........................................................................... 5.11 Feilintegralet.............................................................................................................

35 35 36 36 36 37 38 39 40 41 42 43

6 Kvantitativ skala for sannsynligheter 6.1 Estimat for verdien av en sannsynlighet................................................................ 6.2 Merknader til sannsynlighetsbegrepet ................................................................... 6.3 Statistisk sikkerhetsmargin....................................................................................... 6.4 Poissonfordelingen................................................................................................... 6.5 Statistisk sikkerhetsmargin mer presist formulert ................................................

45 45 46 46 47 47

4.3 4.4 4.5 4.6 4.7 4.8

7 Forventningsverdier 49 7.1 Begrepet forventningsverdi....................................................................................... 49 7.2 Generelt uttrykk for forventningsverdien av k....................................................... 50 7.3 Forventningsverdien ved spesielle fordelinger....................................................... 51 7.4 Forventet kvadratverdi ............................................................................................. 52 7.5 Momenter................................................................................................................... 53 7.6 Forventet verdi av en funksjon av k......................................................................... 53 7.7 Forventningsverdien av måleavviket 8/c ................................................................ 54 7.8 Standardavviket ......................................................................................................... 54 7.9 Sentralmomenter av høyere orden .......................................................................... 55 7.10 Spredningen av Bemoulli-og Poissonfordelingene ............................................ 56 7.11 Radioaktiv spaltningslov......................................................................................... 57

8 Forventningsverdier av forskjellige funksjoner 8.1 Generelle relasjoner................................................................................................... 8.2 Approksimative uttrykk for fordelinger med markerte maksima.....................................................................................................................

59 59

60

Forventningsverdier for funksjoner av flere variable 9.1 Definisjoner............................................................................................................... 9.2 Forventningsverdier for summer eller produkter av funksjoner........................................................................................................ 62 9.3 Korrelasjonskoeffisienten.......................................................................................... 9.4 Merknader til korrelasjonskoeffisienten ................................................................ 9.5 Spredningen av en sum av to variable ................................................................... 9.6 Approksimative uttrykk — funksjon med flere variable...................................... 9.7 Eksempler med ukorrelerte størrelser...................................................................... 9.8 Korrelerte størrelser................................................................................................... 9.8.1 Eksempel 1.................................................................................................. 9.9 Kovarianser ved sammensatte størrelser................................................................ 9.9.1 Eksempel 2.................................................................................................. 9.10 Generalisering av likning (138).............................................................................. 9.10.1 Eksempel 3..................................................................................................

61 61

10 Teoriens relasjon til praktisk nytte 10.1 Forventningen og standardavviket for middelverdien ......................................... 10.2 Estimat 5 for standardavviket ct.............................................................................. 10.3 Estimat for kovariansen covtø........................................................................... 10.4 Det additive uttrykk................................................................................................. 10.5 Uttrykk på produktform........................................................................................... 10.6 Planlegging av målinger ........................................................................................ 10.7 Bedring av presisjon ved økt antall målinger........................................................ 10.8 Den multinomiske fordeling — histogram...........................................................

71 71 72 73 74 74 75 76 78

11 Gaussfordelingen 11.1 Tilfeldige feilkilder.................................................................................................. 11.2 Modell av måleprosessen........................................................................................ 11.3 Kontinuerlige måleverdier ..................................................................................... 11.4 Sannsynlighetstetthet .............................................................................................. 11.5 Fra modell til erfaring.............................................................................................. 11.6 Eksempel på ikke normalfordeling........................................................................ 11.7 Sannsynlighet for verdi i intervallet (a — y) til (a+y)........................................ 11.8 Ubestemthet i estimatet s........................................................................................ 11.9 Numerisk beregning av ubestemthet..................................................................... 11.10 “Maks.-min.” estimator for standardavviket......................................................

81 81 81 84 85 87 87 Sl 87 88 89

12 Gaussfordeling eller normalfordeling med to variable

91

9

62 63 64 65 66 66 67 68 69 69 70

13 Estimering av fysiske parametre fra observerbare data 95 13.1 Modellbetraktninger .............................................................................................. 95 13.2 Praktiske tilfeller.................................................................................................... 95 13.3 Metode for å estimere én parameter ..................................................................... 96 13.4 Estimering av én parameter når modellen (teorien) inneholder flere variable fysiske størrelser................................................... 99

14 Estimering av flere parametre 102 14.1 Spredningen av parametrene a og b............................................................................ 107

15 Optimal metode for å estimere parametre 109 15.1 Spredningen av den optimale målte verdi.................................................................. 111 15.2 Prinsippet om “maksimum sannsynlighet”............................................................... 112 16 En anvendelse av maksimum-sannsynlighetsmetoden 114 16.1 Det beste valg av funksjonene ¥(a.b;x.y)............................................................... 115 16.2 Spredningen av de optimale målte parametre å og b............................................... 119

17 Eksempler fra evaluering av tellereksperiment 121 17.1 Differanse mellom to intensiteter............................................................................... 121 17.2 Måling av store differenser mellom to intensiteter.................................................. 122 17.3 Den praktiske fremgangsmåte ved måling av differansen mellom to intensiteter 123 17.4 Estimering av forholdet mellom to intensiteter........................................................ 124 17.5 Bestemmelse av en absorbsjonskoeffisient fra to måleresultat......................................................................................................... 125 17.6 Bestemmelse av en absorbsjonskoeffisient når vi har bakgrunnsstråling ................................................................................................ 126 18 Evaluering av parameter fra målinger under varierte betingelser 130 18.1 Bestemmelse av en absorbsjonskoeffisient I............................................................130 18.2 Spredningen av jj og Å .............................................................................................. 131 18.3 Løsning av maksimum-sannsynlighetslikningene ved iterasjon (gjentaking)......................................................................................... 132 18.4 Et numerisk eksempel................................................................................................. 133 19 Bestemmelse av parametre fra sammensatte målinger 136 19.1 Estimering av én parameter ffa sammensatte måleserier............................................................................................................ 137 20 Middelverdien av målinger med ulik vekt

139

21 Minste kvadraters metode 141 21.1 Ubestemthet i gradient og skjæring med y-aksen..................................................... 143 21.1.1 Bruk av ubestemthetene s,............................................................................ 143 21.1.2 Bruk av spredningen av punktene............................................................... 144 21.2 Andre eksempler........................................................................................................144 21.3 Bestemmelse av en absorbsjonskoeffisient II........................................................... 145 21.4 En mindre fordelaktig metode ................................................................................. 146 21.5 Kritiske bemerkninger til minste kvadraters metode.............................................. 147

22 Tellestatistikk 148 22.1 Grunn for at tellinger av radioaktive partikler kan være Poissonfordelt............ 148 22.2 Eksempel fra Rutherford og Geiger.......................................................................... 148 22.3 Tolking av telleresultat..............................................................................................149

23 %2 - Chi-kvadrattesten 151 23.1 Definisjoner................................................................................................................. 151 23.2 Et talleksempel.......................................................................................................... 152 23.3 /2-testen når yobs er tall.............................................................................................. 152 23.4 Eksempel med Rutherfordog Geigers data............................................................... 154 23.5 Tilfeldige tellinger medGeiger-Miiller-rør............................................................... 154 24 Resymé

156

Litteratur

158

Register

159

Kapittel 1 Grunnbegreper 1.1

Begrepet måling

Vi vil først belyse det grunnleggende begrep måling. Når vi beskriver eller karakteriserer tingene omkring oss, gjør vi det ved hjelp av deres egenskaper. Det kan være egenskaper som lengde, bredde, høyde, tyngde, densitet, syre- og base-konsentrasjoner, oppløselighet, farve, ledningsevne osv. Som eksempel vil vi se på en vei mellom to byer. Den egenskap ved veien som i regelen har størst interesse er dens lengde. Vi vil kanskje karakterisere veien som lang. En slik beskrivelse vil mange finne lite tilfredsstillende, og de vil ofte spørre: hvor lang? Svaret får vi gjennom måling av veiens lengde. Det kan f.eks. være 43 km. For den som vet hva en km er, gir svaret et tydelig bilde av veiens lengde. Etter dette kan vi definere: Måling er fremstilling av et tallbilde av en egenskap ved en ting. Tallet i tallbildet sier hvor mange ganger den målte egenskap er større enn en gitt egenskap av samme art: enheten. Dette forhold kalles måltallet. Vi kan også si: Måling er en sammenlikning av en egenskap med en enhet for denne egenskap. I tallbildet skriver vi navnet på denne enhet etter tallet som gir forholdet mellom den målte egenskap og enheten for denne, og måltall med tilhørende enhet er verdien av egenskapen. Tallbildet gir en forestilling om størrelsen av den målte egenskap bare hvis en er fortrolig med enheten. En må altså nærmest ha “personlig kjennskap” til enheten 1 km (ha “opplevet” 1 km) for å kunne knytte en klar forestilling til tallbildet 43 km. Den nytte vi kan få av tallbildet er derimot ikke avhengig av om vi kan, som i dette eksemplet, forestille oss enheten. Den store nytten ved måling ligger i den presise karakteristikk av egenskapen som tallbildet gir eller kan gi. I kjemien brukes betegnelsen sterke eller svake syrer, men dette er ingen presis karakteristikk av egenskapen sur. Først ved å måle ionekonsentrasjonen av H" og lage oss et tallbilde (pH-verdien) kan vi få en presis karakteristikk av egenskapen sur. I prinsippet består måling i en opptelling. Som eksempel kan nevnes veiing på en skålvekt ved å telle masseenhetene som er preget inn på loddene, og avmåling av “metervarer” ved å tel­ le hvor mange ganger meterstokken (enheten) kan legges etter hverandre langs tøystykket. Ofte føres måling tilbake til avlesing på en skala, dvs. opptelling av inndelinger på en målestokk. Ek­ sempler: termometer, voltmeter, klokke, pH-meter, byrette osv. Ethvert måleapparat inneholder derfor i praksis en skala, og da måling er grunnlaget for all naturvitenskap, har H.S. Eddington rett i sin uttalelse: “The whole subject matter of exact science consists of pointer readings and similar indications”.

11

Å lese av på en skala kaller vi å observere. En observasjon er altså en avlesning på en skala. Det søkte tallbilde kan være selve observasjonen som f.eks. avlesning av strømmen på et amperemeter eller det kan være en funksjon av en eller flere observasjoner. Når resultatet, tallbildet, er en funksjon av flere enkle observasjoner, snakker vi om en sammensatt måling. (Eksempler: Ved å observere trådens diameter d, kan en måle tverrsnittarealet av tråden da S = *d2. Måling av massetetthet p kan utføres ved å observere masse m og oppdrift o i vann. n_ masse _ \ P “ volum “ aPvannJ

1.2

Egenskapenes ubestemthet

De egenskaper som vi tillegger tingene og gjør til gjenstand for måling, har det til felles at deres verdier er mer eller mindre ubestemte. At en egenskaps verdi er ubestemt, vil si at egenskapen kan ha alle mulige verdier innenfor et visst intervall, ubestemthetsintervallet. Jo bredere dette intervall er desto større sies egenskapens ubestemthet å være. Egenskapenes ubestemthet kan være av høyst forskjellig størrelse. Enkelte ganger kan den ses umiddelbart, som f.eks. ubestemtheten i bredden av en elv. Vindstyrken en dag det blåser, er en høyst ubestemt egenskap med variasjoner som varierer både i tid og sted. I andre tilfeller ligger ubestemtheten langt under det som kan måles. Fluktuasjoner i massen av et metallstykke som ligger i et evakuert rom, vil ikke kunne påvises ved måling. Men likevel må vi etter litt omtanke erkjenne at massen må utvise variasjoner på grunn av utvekslingen av atomer og elektroner som til stadighet finner sted med omgivelsene.

1.3

Hvorfor er alle egenskaper ubestemte?

Følgende forhold forklarer hvorfor alle egenskaper er ubestemte. I tingenes verden (dvs. i mak­ rokosmos) eksisterer det ikke noe fullstendig regelmessig legeme eller to ting som er fullsten­ dig like. F.eks. finner vi ikke på et tre to blad som er fullstendig like eller i gaten to brosteiner som er helt make. Heller ikke finnes det to prosesser som foregår på nøyaktig samme måte, f.eks. to fullstendig like “slag” av hjertet. I vitenskapelig forskning og i teknisk virksomhet må vi imidlertid mer eller mindre se fullstendig bort fra slike forskjeller og fluktuasjoner. Det­ te er en forenkling vi er nødt til å gjøre da det ellers ville være umulig å drive vitenskapelig forskning. Vi betrakter altså den reelle verdens uregelmessige legemer som fullkomment regelmessige legemer, og vi betrakter legemer og prosesser som i den reelle verden bare i større eller mindre grad likner på hverandre, som fullkomment like legemer eller prosesser. Vi avbilder med andre ord legemene og prosessene i den reelle verden med legemer og prosesser som er enklere enn virkeligheten, men på den andre siden også bare tenkte. Herav følger umiddelbart at de egenskaper vi tilskriver ting og prosesser må bli ubestemte i vår bruk eller betydning av ordet. For å klargjøre denne betraktningsmåte vil vi se på en “kule” fra et kulelager. En SKF-kule ser glatt og regelmessig ut, men passende måleredskap vil vise at den ikke er en fullkommen kule. Vi nøler likevel ikke med å betrakte (avbilde) SKF-kulen som en fullkommen regelmes­ sig kule og tilskriver den en bestemt diameter. For å klargjøre tankene vil vi støtte oss til en figur. Den sterkt opptrukne kurve i figur 1 forestiller med grov overdrivelse snittkurven mel­ lom et plan gjennom “sentrum” for SKF-kulen og SKF-kuleoverflaten. Den opptrukne sirkel 12

Figur 1. Til belysning av begrepet ubestemt egenskap. fremstiller snittet med den tenkte kule som altså er vårt bilde av den reelle. De to stiplede sirk­ ler er snittet med henholdsvis en innskrevet og en omskrevet kule. Vi tenker oss altså en kule innskrevet i den reelle slik at intet av den innskrevne kules overflate kommer utenfor SKFkuleoverflaten, men høyst berører denne. Den omskrevne kule omslutter helt SKF-kulen slik at denne høyst berører den omskrevne kuleflate på “innsiden”. Av figuren forstår vi at alle målte “diametre” på SKF-kulen kan gi verdier i intervallet Dmin til Dmax, og egenskapen diameter som vi tilskriver SKF-kulen, må bli ubestemt slik vi tidligere har brukt ordet.

1.4

Måling av ubestemthet

Den større eller mindre ubestemthet av en egenskap kommer til syne ved en større eller mindre bredde av ubestemthetsintervallet. Som et mål for ubestemtheten er det derfor naturlig å vel­ ge ubestemthetsintervallets hele eller halve bredde. Vi velger å bruke ubestemthetsintervallets halve bredde, og heretter er den halve bredde et mål for egenskapens absolutte ubestemthet. Målt slik er ubestemtheten uttrykt i samme enhet som egenskapen. Mye brukt som mål for ubestemtheten er også den relative ubestemthet definert som forholdet mellom den absolutte ubestemthet og egenskapens hovedsaklige størrelse. Den relative ubestemthet multiplisert med 100 kalles den prosentiske ubestemthet. Både den relative og den prosentiske ubestemthet er uavhengig av egenskapens enhet. Disse mål kan derfor brukes til å sammenlikne forskjellige egenskapers ubestemtheter, mens den absolutte ubestemthet bare kan brukes når vi sammen­ likner ubestemtheter for egenskaper av samme slag. Som eksempel kan vi anta at bredden av en kanal ligger mellom 32.2m og 32.8m. Her er ubestemthetsintervallets bredde 0.6m og den absolutte ubestemthet altså 0.3m. Den rela­ tive ubestemthet er 0,3/32 eller avrundet 0,3/30 = 1/100. Den prosentiske ubestemthet er 1%. Utsagnet “ligger mellom 32,2m og 32.8 m” skriver vi vanligvis kortere slik: 32,5 ±0.3 m.

1.5

En definisjons sikkerhet — to betraktningsmåter

En egenskap som viser en ubestemthet på f.eks. 1% sies ofte å være definert med en usikkerhet på 1 % eller med en tilsvarende sikkerhet. Dette utsagn avspeiler en betraktningsmåte som avviker fra den vi hittil har brukt, nemlig at enhver egenskap har én og bare én for denne egenskap karakteristisk ubestemthet. Ifølge den andre betraktningsmåten kan en egenskap defineres med større eller mindre sikkerhet eller med enhver toleranse innenfor visse grenser. Vi vil belyse denne siste betraktningsmåte nærmere.

13

Alle egenskaper som vi tilskriver ting, må defineres. Herav følger at vi alltid vil ha en stor eller liten usikkerhet på definisjonene av disse egenskaper. Usikkerheten i begrepet “elvens bredde” ligger i at begrepet sier intet om stedet der bredden tenkes målt, til tross for at bredden avhenger av stedet. Tilsvarende avhenger “vindstyrken” både av tid og sted (innenfor det gitte tidsrom og den gitte lokalitet). Begrepet “vindstyrken” uttaler intet presist om hvilket øye­ blikk og på hvilket nærmere bestemt sted vindens hastighet tenkes målt. Av denne usikkerhet i begrepene følger ubestemtheten i de tilsvarende egenskaper. En kan åpenbart om nødvendig i større eller mindre grad redusere ubestemtheten på en egenskap ved tilføyelser som reduserer mulighetene for forskjellige fortolkninger av egenska­ pen. Følgende eksempel vil klargjøre hva det siktes til. En taler om “avstanden mellom to byer” langs en bestemt vei. Dette begrep er relativt meget ubestemt. Det sies intet om hvorfra i den ene og hvortil i den andre by avstanden skal regnes. Begrepet er likevel presist nok definert når det f.eks. er snakk om oversikter over byavstander i en håndbok for bilister. Begrepet kan skjerpes ved å tilføye at avstanden skal regnes f.eks. fra torget i den ene by til torget i den andre. Det kan skjerpes enda mer ved å definere avstanden som avstanden fra en merkestein i den ene by til en merkestein i den andre. Enda skarpere definisjoner av avstander bruker geodetene når de måler fra et merke innsatt i en stein eller betongblokk til et tilsvarende merke i en annen blokk. Hvor skarp en definisjon av en egenskap skal være, avhenger ene og alene av i hvilken forbindelse begrepet skal brukes. En viss ubestemthet kan alltid tolereres. Etter anvendelsen må en vurdere hvor stor ubestemthet en kan tillate, eller sagt på en annen måte, hva en i det gitte tilfellet tør betrakte som uvesentlig. / all praktisk virksomhet må vi alltid skjelne mellom vesentlig og uvesentlig. Et illustrerende eksempel har vi i definisjonen av enheten for lengde: en meter. Hele mete­ rens historie skal ikke gjentas her. Vi vil bare nevne at i tiden 1889 til 1960 var en meter definert som avstanden ved 0°C mellom to streker på den internasjonale meterprototypen av platinairidium. På grunn av strekenes endelige bredde var definisjonsusikkerheten på 1889-meteren av størrelsesorden 0.0001 mm (relativ ubestemthet 10 7). Ved internasjonale sammenlikninger av fysiske størrelser kunne en i tiden like etter siste krig i mange tilfeller ikke tolerere denne store ubestemthet. I 1960 ble derfor meteren definert som en lengde som er 1650763,73 gan­ ger bølgelengden i vakuum av den stråling som svarer til overgangen mellom nivåene (2p)10 og (5d)5 i atomer av krypton 86 (86Kr), en av de 6 stabile krypton isotoper. I prinsippet er denne definisjons usikkerhet bare begrenset av linjenes naturlige bredde som lå langt under den måleusikkerhet som var gjeldende i 1960. Bølgelengden var reproduserbar med en relativ ubestemthet på ca. 10 8 altså 10-20 ganger mindre enn 1889-meterens relative definisjonsubestemthet. I 1983 ble meteren definert på nytt:“£n meter er lengden som er lik den avstand som plane elektromagnetiske bølger tilbakelegger i vakuum på 1/299792458 av ett sekund." Denne definisjon baseres på at lysets hastighet i vakuum er definert som eksakt 299792458 m/s. Den relative ubestemthet på definisjonen av meteren er nå 10 14. I 1964 ble sekundet definert som tiden for 9192631770,0000 perioder av en spesiell atomovergang i 133Cs atomer. Konklusjonen av disse betraktninger blir at alle egenskaper vi tilskriver tingene er ubestem­ te enten fordi vi må forenkle problemene ved å lage oss modeller (kf. eksempel SKF-kulen) eller fordi definisjonene av begrepene vi nytter til vår beskrivele er usikre (kf. eksemplet veien mellom to byer). I motsetning til de fysiske størrelsene som alle er ubestemte, har vi konstantene som f.eks. n og e (grunntallet i det naturlige logantmesystemet) som i prinsippet er definert 14

uten ubestemthet.

1.6

En målemetodes usikkerhet

Vi framstiller tallbilder av en egenskap ifølge vår definisjon av begrepet måling. Egenska­ pen forutsettes å ha neglisjerbar ubestemthet. Til tross for denne mangel på ubestemthet vil vår målemetode ved gjentatte målinger gi verdier varierende innenfor et visst intervall. Den måletekniske virksomhet gir altså et ubestemt resultat, og ubestemtheten på tallbildet avspeiler usikkerheten ved målemetoden. Vi kan derfor si: Usikkerheten ved en målemetode måles ved ubestemtheten på tallbildet (dvs. på resultatets måltall) forutsatt at ubestemtheten på den målte egenskap er liten mot den funne ubestemthet på tallbildet. En målemetodes usikkerhet kan etter dette enten uttrykkes absolutt eller relativt (prosentisk). Hvis vi f.eks. måler tyngdens akselerasjon g = 9.8 ± 0.1 m/s2, sier vi at målemetodens usikkerhet er 1% fordi den absolutte ubestemthet av egenskapen er 1% av verdien for denne egenskap. (I dette eksempel forutsetter vår modell (teori) at tyngdens akselerasjon ikke har noen målbar ubestemthet. Hele ubestemtheten på tallbildet skyldes målemetoden.)

1.7

Tallbilder av fysiske størrelser

Ved innføringen av begrepet “en målemetodes usikkerhet” forutsatte vi at ubestemtheten på den målte egenskap var liten eller forsvinnende mot den ubestemthet i tallbildet som usikker­ heten ved målemetoden bidro til. Omvendt vil vi nå anta at vi måler en egenskap med kjent ubestemthet med en målemetode hvis usikkerhet er forsvinnende mot denne ubestemthet. Det er da innlysende at tallbildet vil vise den ubestemthet som den målte egenskap har. Ubestemt­ heten på en egenskap finner en nettopp ved gjentatte målinger av egenskapen med en metode hvis usikkerhet er meget liten i forhold til egenskapens ubestemthet. For å klargjøre kan vi tenke på den ovenfor nevnte kanal hvis bredde var 32.5 m med en ube­ stemthet på 1%. I begrepet “kanalens bredde” sies intet om hvor bredden tenkes målt. Måler vi da bredden ved en rekke vilkårlige valgte punkter langs kanalen og utfører vi alle målinger med en metode som f.eks. bare har en usikkerhet på 0,1%, må de funne tallbilder variere nøyaktig like mye som bredden selv varierer, dvs. tallbildets ubestemthet er lik egenskapens ubestemt­ het. Tallbildets ubestemthet avspeiler altså nå ikke målemetodens usikkerhet som bare er 0,1%, men egenskapens 10 ganger så store ubestemthet. Er ubestemtheten på egenskapen, a^%, av samme størrelsesorden som usikkerheten til målemetoden, au%, vil ubestemtheten til tallbildet, ai%, være avhengig av både ubestemthe­ ten på den målte egenskap og usikkerheten ved den benyttede målemetode. Senere (kf. kapittel 9.5) vil det bli vist at «t er gitt ved (1) eller grafisk illustrert; ay er hypotenusen i en rettvinklet trekant der az og a\[ er kateter. Av (1) fås umiddelbart følgende fundamentale (og i grunnen selvinnlysende) setning: Ved måling kan tallbildet aldri ha mindre ubestemthet enn ubestemtheten til den egenskap som måles.

15

Eller i en annen formulering: Ingen egenskap kan måles med større “effektiv" sikkerhet enn den sikkerhet som egenska­ pen er definert med. (Eks. 1889-meteren) Av (1) fremgår også klart, og det er også umiddelbart innlysende, at en kan fremstille tall­ bildet av en ubestemt egenskap med enhver toleranse større enn ubestemtheten på den målte egenskap. Dersom vi vil fremstille tallbildet med minst mulig ubestemthet, dvs. egenskapens ubestemthet a^, må a^ C Ved i praksis å bruke en målemetode hvis usikkerhet er 1/2 av ubestemtheten på den egenskap som skal måles, får vi

«T = y/aE + (0.5aE)2 = 1, laE

(2)

altså en ubestemthet ubetydelig større enn ubestemtheten ved den målte egenskap.

1.8 Gjentatte målinger Vi erkjenner at ethvert måleapparat har en endelig oppløsningsevne, dvs. en minste skala-enhet slik at egenskapens verdi uttrykt i enheter av denne minste enhet alltid vil være et helt tall. Hvis vi gjentar en måling på en og samme egenskap, vil vi derfor få ett av to resultat:

1. Vi finner samme verdi på skalaen. Altså: Vår målemetode er ikke god nok til å uttale noe om egenskapens ubestemthet. Denne er mindre enn målemetodens minste skala-enhet. Ifølge (1) får vi da at ubestemtheten på tallbildet er lik målemetodens usikkerhet.

2. Vi finner en spredning av verdiene. Altså: Denne spredning er resultantspredningen som skyldes ubestemtheten av egenskapen og usikkerheten ved målemetoden ifølge (1). Den store nytte ved å gjenta en måling, ligger i at først ved gjentagelser kan en få avgjort om en har resultat av type 1 eller 2. Dessuten vil antall gjentagelser, som vi senere vil forstå (kf. kapittel 11.8), være bestemmende for troverdigheten av målingen.

1.9 Feil og forfalskning — tilfeldige og systematiske feil Vi vil nå definere enda to begreper av fundamental betydning: Målemetodens feil og produktets (tallbildets) forfalskning. La oss tenke oss at vi har foretatt en måling (av f.eks. lyshastigheten før 1983). Vi har planlagt og utført denne med stor flid og er derfor tilbøyelig til å slutte at det funne tallbilde er et riktig eller “sant” bilde av den målte egenskap. (Erfaring viser at en skal være meget forsiktig med en slik slutning.) Sett nå at andre et annet sted med en annen metode har målt den samme egenskap med en liknende sikkerhet, men målingen har gitt et tallbilde som er ensidig forskjøvet i forhold til det vi har funnet og langt mer enn ubestemthetene kan forklare. Figur 2 a-b gir et bilde av situasjonen. S er her en skala for egenskapen som vi måler. Vår måling har gitt ubestemthetsintervallet I. Gjentatte målinger har fordelt seg innenfor dette intervall omkring en viss verdi FV som vi er tilbøyelig til å identifisere med den sanne verdi. Linjen under illustrerer analogt situasjo­ nen på det andre stedet hvor de har funnet ubestemthetsintervallet II beliggende omkring SV. 16

FV

SV

I

III

a

s

s

SV ----------------------------------------------- ------------------II K---

F

b

--- X

Figur 2 a-b. Til belysning av begrepene usikkerhet og feil, ubestemthet og forfalskning. De to resultater FV og SV kan umulig begge være riktige. På grunn av uoverensstemmelsen gjennomgår vi meget kritisk alle forhold som kan tenkes å ha innflytelse på vårt resultat, og oppdager herved tross all vår flid at vi har oversett et vesentlig forhold. Vi korrigerer og finner nå at ubestemthetsintervallet er rykket til høyre (til III) og ligger praktisk sett på samme sted som II. Vi vil da foreløpig og med god grunn føle oss overbeviste om at det praktisk sett felles intervallmidtpunkt SV er den søkte sanne verdi. Er vår antagelse riktig, sier vi at vår metode ved første måling var beheftet med en feil, og denne feil har ført til en forfalskning av tallbildet. Forfalskningen er målt ved den ensidige forskyvning F av resultatet FV i forhold til den sanne verdi SV. Vi presiserer begrepene usikkerhet og feil gjennom følgende definisjoner: En metodes usikkerhet avspeiler seg i resultatets ubestemthet, dvs. resultatets varierende avvik fra et visst gjennomsnitt. En metodes feil avspeiler seg i resultatets forfalskning, dvs. i resultatets ensidige avvik fra det søkte resultatet. De to begreper usikkerhet og feil eller de to ubestemthet og forfalskning er helt uavhen­ gig av hverandre, dvs. åsakene til de tilsvarende avvik må som regel søkes i helt forskjellige forhold. En metode kan samtidig vise usikkerhet og feil (tilfelle I figur 2a), og den kan ha en vesentlig usikkerhet, men være praktisk sett feilfri (tilfelle figur 2b). Vi erkjenner at usikkerhet (stor eller liten) ved en metode er uunngåelig og derfor må betraktes som et normalt trekk ved enhver metode. Feil ved en metode er derimot en anomali eller om en vil en sykdom, som det gjelder om å diagnostisere og helbrede. I den klassiske lære om måleteknikk brukes ordet feil for avvik i alminnelighet. For å skjel­ ne mellom et ensidig avvik og et avvik av tilfeldig, varierende karakter, betegner en den første som en “systematisk” feil, den siste som en “tilfeldig” feil. Vi vil beholde også disse begrep selv om de kan gi opphav til visse misforståelser. Vi har altså at metodens usikkerhet og egen­ skapens egen ubestemthet begge yter sitt bidrag til tallbildets ubestemthet eller med andre ord yter bidrag til de tilfeldige feil i måleresultatet. De systematiske feil har sine årsaker i feil ved målemetodene. (Merk spiren til forvirring ved bruk av ordet feil to ganger i samme setning, første gang i betydning avvik og andre gang i betydning anomali.)

1.10

BIPM-metoden for angivelse av ubestemthet

BIPM er forkortelse for Bureau International des Poids et Mesures. Et sterkt ønske om interna­ sjonal enighet når det gjelder utregning og kombinering av delubestemtheter (delusikkerheter) har ført til anbefalinger fra BIPM som de fleste land inkludert Norge har vedtatt å følge. 17

Ubestemtheten i et måleresultat består generelt av flere komponenter som kan grupperes i to kategorier i henhold til den måten komponentene er funnet: • Kategori A: De som er bestemt ved statistiske metoder. • Kategori B: De som er bestemt på annen måte.

Det er ikke alltid en enkel sammenheng mellom denne klassifiseringen og den tidligere innde­ ling i “tilfeldige” og “systematiske” ubestemtheter, (se kapittel 1.9). Kategori A vil i de fleste tilfeller korrespondere til det som tidligere ble kalt “tilfeldige feil”. Kategori B er derimot for­ skjellig fra det som tidligere ble kalt “systematiske feil”. Termen “systematisk” er av BIPM anbefalt å gå ut av bruk. Den tradisjonelle inndelingen baserte seg på den effekten ubestemthetskomponenten hadde på sluttresutatet, mens den nye inndelingen baserer seg på den måten ubestemtheten er funnet på. (Vent med å lese resten av kapittel 1.10 til du har lest kapittel 9.6). Komponentene i kategori A er karakterisert ved de estimerte varianser sj, (eller estimerte standardavvik s() og antall frihetsgrader. Kovariansene skal også oppgis der det er nødvendig. Ubestemthetskomponentene i kategori B skal oppgis som u2 og skal betraktes som tilnær­ minger til varianser. Her må det understrekes at dette ikke er varianser i statistisk forstand og bør derfor ikke kalles for varianser selv om de blir behandlet som om de var det. Tilsvarende skal Uj behandles som statistiske standardavvik. Dersom det er nødvendig, skal også kovarian­ sene (avhengigheten mellom ubestemthetene til to eller flere delubestemtheter) behandles på tilsvarende måte. Den kombinerte ubestemthet u finner en ved å kombinere alle komponentene i kategori A og B som statistiske varianser, dvs. kvadratisk summasjon som i likning (138). Den kombinerte ubestenthet u kan karakteriseres som ett standardavvik.

1.11

Eksempler for å belyse forskjellen mellom usikkerhet og feil

Vi har lært at usikkerhet fører til ubestemthet, og feil fører til forfalskning. Med et simpelt målebånd gjentar vi målinger av bredden av en bordplate. Resultatet varie­ rer ca. 0.5 mm på begge sider av en gjennomsnittsverdi. Disse variasjoner avspeiler målingens effektive usikkerhet (som innbefatter ubestemtheten på bordplatens bredde). En nærmere un­ dersøkelse av det simple målebånd viser at lOOcm på båndet i virkeligheten er 101 cm. Det tyder på at alle inndelinger er 1% for store, og herav at alt som måles med båndet finnes 1 % for lite. Måling med båndet sies å være beheftet med en feil på — 1% (minus fordi avlest resultat er mindre enn det riktige) med den følge at resultatet forfalskes — 1%. Leseren anbefales nå å undersøke med hvilken usikkerhet og med hvilken feil han/hun etter hukommelsen kan reprodusere 1 cm. Vi tar 10 strimler papir uten linjer. På hver strimmel avset­ ter vi to merker med avstand av 1 cm vurdert på skjønn. Deretter måles de virkelige avstander. Forfatteren fant tallene i tabell 1 for egen vurdering. Avvik i tabellen er avvik fra middelverdien. De gjentatte verdier fordeler seg innenfor et intervall med halve bredde ca. 1 mm. Dette er usikkerheten på skjønnet. Verdiene fordeler seg om gjennomsnittet 9.4 mm som avviker 0.6 mm fra det riktige. Skjønnet har en feil på —0.6 mm.

18

Nr.

Avstand [mm]

1 2 3 4 5 6 7 8 9 10

9,0 9,2 8,8 9,3 9,4 9,3 10,6 9,7 9,6 9,5

Avvik [mm] -0.4 -0.2 -0.6 -0.1 0.0 -0.1 + 1.2 +0.3 +0.2 +0.1

Middel: 9.4 mm

Tabell 1. Forfatterens vurdering av 1 cm på skjønn.

1.12

Den sanne verdi

I kapittel 1.11 har vi brukt begrepet den sanne verdi eller den riktige verdi av en målt størrelse, og dette begrep har krav på nærmere omtale. Som det tidligere er redegjort for, må vi i vitenskapelig forskning og teknisk virksomhet forenkle den reelle verden og innføre bilder (modeller) av den. I disse modeller er det hen­ siktsmessig å tilskrive alle fysiske størrelser eksakte verdier som vi kaller egenskapens sanne verdier. Hovedgrunnen til dette er at vi ved deduksjoner i modell-verdenen kan nytte en mate­ matisk beskrivelse der en som kjent bare anvender eksakte begreper. I vår modell-verden går vi faktisk videre og innfører størrelser som ikke er direkte målbare (f.eks. innføring av komplekse størrelser). Alle størrelser som inngår i modellene (f.eks. lovene for klassisk fysikk) må imidler­ tid ha relasjoner til målbare størrelser, og de målte verdier må da sees på som eksperimentelle tilnærmelser til de sanne verdier som inngår i modellene. Da det er de målte verdier som er grunnlaget og følgelig modellene som må tilpasses disse, er det mer korrekt å uttale at model­ lene er gode eller brukbare så lenge de tilfredsstillende kan beskrive sammenhengen mellom de målte verdier når disse (med sine ubestemthetsintervaller) i modellene erstatter symbolene for de sanne verdier.

1.12.1

Eksempel med SKF-kule

La oss som eksempel vende tilbake til vår SKF-kule og figur 1. I bildet (modellen) av SKFkulen betegner diameteren D SKF-kulens sanne diameter. Den matematiske beskrivelse gir volumet V av en kule uttrykt ved radius r

4 3

3

V = -nr3.

(3)

og herav følger hvis vår modell gir en korrekt beskrivelse av vår SKF-kule, at dens volum Vskf kan uttrykkes ved diameteren D 4 / D q 7t q Vskf = ^tt( —)3 = • 3

2

19

o

(4)

Alle målingene må foretas på den reelle “kule”, og dette fører til “diameter”-verdier som alle ligger mellom £>nun og -Dmaks- Volumet av SKF-kulen kan også måles direkte (f.eks. ved måling av oppdrift i vann). Hvis nå symbolene for de sanne verdier i (4) kan erstattes med de målte verdier av volum og diameter, sies vår modell (dvs. at SKF-kulen kan avbildes som en kule) å gi en tilfredsstillende beskrivelse av sammenhengen mellom de målte verdier.

1.13

Opprinnelsen til ubestemthet og forfalskning

Kildene til ubestemthet og forfalskning av måleresultatene er mange. En grundig gjennom­ gåelse faller utenom rammen til dette kompendium, men det kan være nyttig i korthet å peke på noen av kildene. For å nå til klarhet, minner vi om de ting og begreper vi har å gjøre med når vi måler. Måling kan som før nevnt oppfattes som en fremstilling. Det fremstilte produkter tallbildet. De anvend­ te redskaper er måleapparatene som sammen med den ting vi måler på, måleobjektet, utgjør målesystemet. Målingen utføres etter visse forskrifter eller etter en viss metode, målemetoden. Målesystemet er midlet som gir oss observasjonene, og herav kan det søkte tallbilde bereg­ nes. Anvisninger for denne beregning er gitt i målingens teori som er et bilde av sammenhengen mellom størrelsen av det søkte tallbilde og kjente egenskaper ved måleapparatet. Som regel har teorien karakter av en analytisk formel. (Eksempel: Måling av tyngdens akselerasjon g ved hjelp av en fysisk pendel, g = 4n2(k2 4- 12)/IT2. Her observeres svingetiden T og avstanden / fra massesenteret til svingeaksen. Treghetsradius k er en apparatkonstant. Måleobjektet er jord­ kloden.) Dersom en setter inn i formelen de kjente tallbilder av måleapparatets egenskaper og de observerte tallbilder, gir formelen tallbildet av den søkte egenskap ved måleobjektet. Herav følger at all ubestemthet i de innsatte tallbilder må avspeile seg som ubestemthet i det bereg­ nede tallbilde, altså i målingens resultat. Vi skal senere vise hvordan en fra ubestemtheten på egenskaper og observasjoner slutter seg til ubestemtheten på det søkte tallbilde. Nå kommer vi til spørsmålet om hvordan ubestemtheten på egenskaper og observasjoner inntreffer. For å forstå dette må vi betrakte de virksomheter målingen forutsetter. Vi har sett at måling beror på opptelling og vanligvis på opptelling av inndelinger på en eller flere skalaer, dvs. på avlesing av hvor en viser står i forhold til skalaens inndelinger. Normalt vil viseren ikke stå på en delstrek. For å tilstrebe størst mulig nøyaktighet forsøker en derfor å vurdere vise­ rens avstand fra den nærmest foregående delstrek. Usikkerheten på vurderingen, den såkalte avlesningsusikkerhet (avlesningsfeil), vil en ofte summarisk sette til 1/10 inndeling. Eksempel 6 7 8 9

I ItI I Her vil en lese 7,4 delstreker med en usikkerhet på 0,1 delstrek. Atså resultatet 7.4 ±0.1 delstreker. Avlesningsusikkerheten er ikke den eneste kilde til ubestemthet på målingens observasjo­ ner, ofte betegner den bare et lite bidrag til denne ubestemthet. Målingens utførelse omfatter i mange tilfeller en innstilling av målesystemet før observasjonen kan utføres. Innstillingen foretas etter et visst kjennetegn, som velges så tydelig som mulig. (Vektens innstilling på nullstillingen, telefonbroens (Wheatstones bro) innstilling på minimum av lyd, den optiske benk på maksimal skarphet av et bilde, fotometerbenken på like sterk belysning av to felter, libellen på “horisontalt”, ved titrering innstilles på farveomslag, osv.) Men innstillingen har naturligvis som enhver virksomhet sin usikkerhet, innstillingsusikkerheten (innstillingsfeilen), og denne

20

er ofte vesentlig større enn avlesningsusikkerheten. Dersom den bestemmes ved gjentagelse av innstillingen, må det bemerkes at den umiddelbart funne ubestemthet normalt innbefatter av­ lesningsusikkerheten, dvs. den er resultanten av denne usikkerhet og innstillingsusikkerheten. Måling omfatter ofte en avpasning av målesystemets tilstand. F.eks. kan temperaturen, trykk mm. ha en innvirkning på systemets tilstand, og dermed bli en kilde til ubestemthet i måleresultatet. (Eksempel: Temperaturen har innvirkning på den elektromotoriske kraft av Westons normalelement som er tilkoplet et potensiometer.) Som regel vil målesystemets tilstand avhenge av fremgangsmåten ved målingens utførelse. I slike tilfeller må det gis forskrifterfor fremgangsmåten. Usikkerheten i overholdelsen av slike “spesifikasjoner” vil bidra til ubestemtheten til det søkte tallbilde. Derfor er det så viktig å stu­ dere grundig bruksanvisningene som alltid følger med god måleapparatur. Alt i alt stammer altså ubestemtheten i det søkte tallbilde fra usikkerheten i alle de virk­ somheter som målingen omfatter (dvs. avlesning, innstilling, avpasning mm.). En særlig kilde til ubestemthet har vi i usikkerheten i måleredskapets fremstilling, selv om denne usikkerhet egentlig påvirker tallbildet ensidig. Spesielt må her fremheves usikkerheten på fremstilling av viserinstrumenters skala (voltmeter, termometer, osv.) og på avpasningen av sett av enkeltnormaler (sett av vektlodder, motstandsbokser osv.). Det enkelte sted på skalaen eller den enkelte normal har naturligvis bare ett bestemt avvik fra den nominelle avlesning eller verdi og et av­ vik som alltid er det samme (bortsett fra endringer i tidens løp). Dette avvik må derfor alltid gi anledning til et avvik av tallbilde med samme retning og størrelse, altså til ensiding avvik eller forfalskning. Dersom en ved gjentatte målinger av en og samme egenskap benytter forskjellige steder på skalaen eller forskjellige normaler i settet, gjør de individuelle avvik seg gjeldende som en kilde til ubestemthet i tallbildet idet vi regner med at de nevnte avvik, som jo avspeiler fremstillingsusikkerheten, snart vil gå til den ene side, snart til den andre. Til slutt vil vi bemerke at forstyrrelserfra omgivelsene ofte kan være en kilde til ubestemt­ het i tallbildet. Vi kan ha mange arter av forstyrrelser: mekaniske, termiske, optiske, magnetis­ ke. Hvordan de gjør seg gjeldende som kilder til usikkerhet i observasjoner, er kjent f.eks. fra mekaniske rystelsers innflytelse på et galvanometers avlesning, atmosfærens forstyrrelser ved astronomiske observasjoner, elektromagnetisk støy som forstyrrer elektroniske instrumenter osv. Spør vi nå etter kildene til tallbildets eventuelle ensidige avvik eller forfalskning, skal vi først rette vår oppmerksomhet på målingens teori som et bilde av målesystemet. Teorien er bare et bilde og dekker som de fleste bilder, bare tingen til en viss grad. Ensidige avvik mellom teorien og målesystemet er i prinsippet kilder som kan gi tallbildet, som beregnes ved teoriens hjelp, et ensidig avvik fra det riktige. (Eksempler: a) I mekaniske systemer har vi alltid friksjon, men i teorien ser vi ofte bort fra den. b) Måler tyngdens akselerasjon g vha. fysisk pendel og tar ikke hensyn til pendelutslaget.) En måling med en gitt toleranse krever derfor en nøye analyse av alle muligheter for ensidig avvik mellom to systemer: et tenkt system, dvs. det som teorien direkte representerer, og det virkelige system. Derfor tilskriver vi snart bildet, snart systemet skylden for forfalskningen og taler om en feil ved teorien eller en feil ved systemet. Avgjørende er her hva som må betraktes som primært gitt. Hvis det teoretiske bilde er gitt, og systemet fremstilt med teorien som forbilde, bærer fremstillingen av systemet naturlig skylden for et ensidig avvik mellom forbilde og system. Omvendt når systemet er gitt på forhånd og det derfor gjelder om å fremstille et bilde som dekker systemet med den gitte nøyaktighet.

21

Hittil er det i det vesentlige tenkt på målesystemets bygning, men det er klart at feil i bruks­ anvisningen for systemet eller ensidig avvik fra riktige bruksanvisninger, likeledes betegner kilder til forfalskning av målingens resultat. (Eksempel: Et nøyaktig kvikksølvtermometer må avleses i enten horisontal eller vertikal stilling bestemt av kalibreringsbetingelsene.) Vi skal ik­ ke her gå inn på de utallige former for feil og feilkilder en møter i måleteknikken, men bare til slutt nevne et rent psykologisk moment. En alvorlig kilde til forfalskning av måleresultatet har vi hvis observatøren har en særegen eller forutinntatt holdning. Den kanskje hyppigste forekom­ mende observatørfeil er tendensen til å anta at den første avlesning som tas er den riktige, og så se mistenksomt på ethvert avvik fra denne avlesning (ved gjentagelse av målingen). Tretthet, anstrengelse av øyet eller øyets posisjon i forhold til en skala er andre kilder til forfalskning. Oppsøking av feilkildene som fører til forfalskning av måleresultatet, svarer i måletek­ nikken til diagnosen i medisinen og gir opphav til liknende vanskeligheter. I sammenlikning med denne diagnostiserende virksomhet er vurderingen av gitte ubestemtheters innflytelse på tallbildet en relativt enkel sak, men allikevel en sak av den største betydning. Det skal bare fremheves at resultatet av den formelle vurdering av ubestemtheten bare sier noe om tallbil­ dets mulige avvik fra det riktige dersom en er sikker på at det ikke ved siden av ubestemt­ heten opptrer en forfalskning som eventuelt fører tallbildet mye lengre bort fra det riktige enn ubestemtheten kan gjøre det. (Se figur 2a-b.)

1.14

Hvordan bestemme ubestemtheten i praksis?

Tidligere definerte vi den halve bredde av ubestemthetsintervallet som mål for ubestemthet. Det hender at en kan danne et grafisk bilde av fluktuasjonene til den ubestemte egenskap. Som eksempel kan nevnes et registreringsdiagram for frekvensen av høyspenningen på en transformatorstasjon. (Et slikt diagram viser frekvensen som funksjon av tiden). 1 slike tilfeller har en umiddelbart ubestemthetsintervallet for øye og kan lett måle dets bredde som avstanden mellom to parallelle linjer som avgrenser fluktuasjonene. Nå foreligger ubestemthetsintervallet som regel ikke umiddelbart, og spørsmålet blir da hvordan det i praksis skal bestemmes. Det skjer normalt ved å ta ut stikkprøver i et pas­ sende antall. Det er innlysende at en ved et industrielt produkt, f.eks. et lampeparti, måtte måle lysstrømmen for alle de lamper som partiet omfatter for å være helt sikker på å få ubestemthetsintervallets grenser bestemt. Analogt skulle en, når det er tale om en måling, gjenta målingen et ubegrenset antall ganger. I virkeligheten må en naturligvis såvel ved det industriel­ le som ved det måletekniske produkt nøyes med et begrenset antall stikkprøver, og det vil ved målingen si et begrenset antall gjentagelser av målingen. At vi generelt alltid er henvist til å trekke våre konklusjoner på grunnlag av et begrenset antall målinger, stikkprøver av begrenset størrelse, leder oss til sannsynlighetsbetraktninger Før vi kommer videre med å finne praktiske mål for ubestemtheten av våre målinger, er det derfor nødvendig å definere sannsynlighetsbegrepet og lære noe om de grunnleggende regler for sannsynlighetsregningen. Dette skal vi så nytte ved behandling og tolkning av måledataene.

22

Kapittel 2

Sannsynlighetsregning 2.1

Innledning

På 1500- og 1600-tallet var det vanlig for overklassen å fordrive tiden med terning- og kort­ spill, og å risikere betydelige pengebeløp i forbindelse med dette. Herved oppsto behovet for å kunne forutsi mulighetene for gevinst ved de forskjellige typer av veddemål. Begrepet sann­ synlighet ble skapt på denne tiden, men har siden fått anvendelse langt ut over hasardspillemes rekker. Innenfor enkelte områder av fysikken er begrepet sannsynlighet like fundamentalt som begrepene tid og rom.

2.2

Statistiske fenomener

Sannsynlighetsregning anvendes ved behandling av statistiske fenomener. Dette vil si fenome­ ner som opptrer i mer eller mindre store antall. Det kan være et bestemt fenomen som gjentas et visst antall ganger (f.eks. måling av en fysisk størrelse) eller om observasjonen av den samti­ dige tilstedeværelse av mange ensartede fenomener (f.eks. molekylbevegelsen i en gass der ett molekyls bevegelse utgjør enkeltfenomenet). Ved en statistisk behandling studeres bare såkalte tilfeldige fenomener som betyr fenomener der det er umulig ut fra de kjente naturlovene å forutsi fenomenenes sluttilstand ut fra deres begynnelsestilstand. Eksempler på tilfeldige feno­ mener: terningkast og alle former for “ærlige” hasardspill, i bestemte tidsrom antall tellinger fra radioaktive preparater.

2.3

Begrepet sannsynlighet

Vi vil nå betrakte et bestemt tilfeldig fenomen og antar at vi har utført en serie på n observasjo­ ner. La «a av de n observasjonene betegne antall ganger resultatet er av en nærmere spesifisert klasse. Vi sier at resultat A (på engelsk: event A) har inntruffet. Tallet «a kalles den absolutte frekvens for resultatet A og brøken

/(^) = n

(5)

kalles den relative frekvens i den gitte observasjonsserie. Erfaringen viser nå at de tilfeldige va­ riasjoner eller statistiske fluktuasjoner, som de også blir kalt, ofte utjevnes etter den såkalte til23

feldighetslov, hvis gyldighet er en fundamental betingelse for all anvendelse av sannsynlighetsteorien for å beskrive de reelle fenomener. Vi har en nøyaktig spesifisert kategori K av observasjoner, og hvis vi i forskjellige observasjonsserier beregner de relative frekvenser av et bestemt resultat A, viser erfaringen at disse frekvenser bare avviker lite fra hverandre når hver serie består av et stort antall observasjoner. Hvis vi plotter disse relative frekvensene på en linje, vil med andre ord frekvensene grup­ pere seg om en felles verdi og desto mer utpreget jo flere observasjoner hver serie omfatter. For å betegne denne form for tilfeldighet blir ordene "stokastisk tilfeldighet” brukt. Når erfaringen viser at et tilfeldig fenomen er et stokastisk tilfeldig fenomen, er det “noe”, dvs. en fysisk egenskap ved fenomenet, som synes å være konstant. Som vi i kapittel 1.12 tilskrev alle fysiske størrelser eksakte verdier eller sanne verdier, er det nå for å nytte en mate­ matisk beskrivelse, naturlig analogt å idealisere forholdene (innføre bilder eller modeller) ved å abstrahere fra avvikene mellom de relative frekvenser og å introdusere ett bestemt tall som skal representere den “sanne” verdi av de relative frekvenser. Vi tolker altså de relative frekvenser som de eksperimentelle verdier av en og samme fysiske konstant som er bestemt av egenska­ pene ved kategori K av observasjonene og resultat A. Eller mer korrekt: rettferdiggjørelse av denne forenkling er basert på at tolkningen av modellen leder til tilfredsstillende beskrivelser av de statistiske fenomener vi møter i praksis. De relative frekvenser oppfattes som eksperimentelle verdier for denne fysiske konstant, og konstanten betegnes med P(A) og kalles for sannsynligheten for resultat A i kategorien K av observasjoner. På grunn av introduksjonsmåten kalles konstanten også den sanne relative frekvens av A. Det er viktig å merke seg at med denne definisjonen er sannsynligheten ikke definert for et resultat som bare kan inntreffe én gang, dvs. for et resultat som ikke kan reproduseres. F.eks. kan vi ikke snakke om sannsynligheten for det resultat at en bestemt tennis-spiller vil vinne en bestemt kamp til tross for at vi i dagligtale bruker ordet sannsynlighet om slike hen­ delser. Vår introduksjon av begrepet sannsynlighet er helt analog til introduksjonen av ethvert annet idealisert begrep som nyttes til å beskrive de observerte fenomener (f.eks. Evklids rette linje i geometri, posisjon som en kontinuerlig funksjon av tiden i mekanikk). På samme måte som vi ubevisst foretar de relevante idealiseringer som f.eks. fra “observert rett linje” til “Evklids rett linje”, og på samme måte som vi alltid prøver å holde den matematiske modell adskilt fra den korresponderende virkelighet, må vi nå i sannsynlighetsregningen venne oss til dels ubevisst å idealisere fra den relative frekvens av et resultat til dets sannsynlighet og dels til adskillelsen i vår bevissthet av de to begrepene frekvens og sannsynlighet.

2.4

Bertrands paradoks

Til slutt skal vi understreke at ved definisjonen av sannsynlighet er denne kjennetegnet som en funksjon av både egenskapene for resultatet og egenskapene for kategorien av observasjonene. Som regel er kategorien tilstrekkelig definert ved formuleringen av selve problemet. Men ofte overses nødvendigheten av å definere nøyaktig hvordan observasjonene skal utføres med derav følgende gale konklusjoner og paradokser. Som eksempel skal nevnes det såkalte “Bertrands paradoks” som F. L. Bertrand formulerte i 1899. Her består observasjonen i tilfeldig å trekke en korde i en sirkel med radius r og avlese dens lengde. Spørsmålet er: Hva er sannsynligheten for at kordens lengde er mindre enn siden i den innskrevne likesidede trekant, altså mindre

24

enn r? Fordi prosessen “tilfeldig å trekke en korde” ikke er en veldefinert operasjon, kan det fremsettes mange motstridende løsninger og her er to av dem: 1. Den perpendikulære avstand fra sentrum til korden er et tall mellom 0 og r. Korden er mindre enn r\/3 når avstanden er større enn r/2. Måles sannsynligheten som forholdet mellom den gunstige avstand r/2 og den mulige r fås 1/2.

2. Kordens sentralvinkel er et tall mellom 0 og n. Korden er mindre enn r\/3 når dens sentralvinkel er mindre enn 2n/3. Måles sannsynligheten som forholdet mellom den guns­ tige sentralvinkel 2n/3 og den mulige n fås 2/3.

25

Kapittel 3 Sannsynlighetsregningens fundament 3.1

Første aksiom

Etter å ha innført sannsynlighetsbegrepet slik det erfaringsmessig har vist seg passende for be­ skrivelsen av statistiske fenomener, skal vi nå formulere de fundamentale lover eller aksiomer, dvs. relasjoner mellom tallene som vi introduserer som sannsynligheter. Vi innser lett at ifølge vår definisjon av sannsynlighet kan disse relasjoner ikke velges fritt. Ved samtidig å innføre sannsynligheter for flere resultat vil det bestå visse relasjoner mellom de korresponderende re­ lative frekvenser. Ifølge definisjonen av sannsynlighet må vi forlange at de samme relasjoner også må holde for de tilsvarende sannsynligheter. Slik kan vi sette ned visse fundamentale lover som vil danne grunnlaget for alle etterfølgende deduksjoner. Men disse lover kan ikke selv bli matematisk utledet. (Dette er analogt til f.eks. aksiomene i Evklids geometri, Newtons lover i mekanikk og Maxwells likninger i elektrodynamikk.) Da en relativ frekvens alltid er av formen f = ha/h der 0 < riA < n, følger at 0 < f < 1 og vi må derfor forlange den samme relasjon for alle sannsynligheter. Første aksiom: Verdien av en sannsynlighet P er et tall mellom 0 og 1, begge grenser inklu­ dert O )---P(An),

(22)

som en generell utvidelse av teorem (16). Teorem (22) er altså bare gyldig når ethvert av de n resultatene er stokastisk uavhengige av et hvilket som helst annet resultat, samt av et hvilket som helst snitt av de øvrige resultat. A i, A2, ... An sies da å være stokastisk uavhengige. (Ofte sløyfes ordet “stokastisk”. Ordet har gresk opprinnelse og kan i vår betydning oversettes med “sannsynlighetsteori”.)

4.4

Komplementær hendelse

Hvis det er sikkert at minst ett av de n resultatene A i, A2, ... An vil intreffe, uttrykkes dette symbolsk ved Ai UA2U---UA„ = E. (23)

Aksiom II gir da P(Ai UA2U• • • UAn) = 1.

Hvis også de n resultatene utelukker hverandre to og to, dvs. A, CiA^ = 0 når i (24) P(Ai)+P(A2) + --- + P(A„) = 1.

(24) k, gir (17) og

(25)

Dette er en viktig likning i sannsynlighetsregningen. Ved symbolet A betegner vi at resultat A ikke har inntruffet. A kalles den komplementære hendelse til A. Da minst ett av de to resultatene A og A må inntreffe, og siden de ikke kan inntreffe samtidig, har vi A UA = E og A Cl A = 0. Av (25) får vi da

P(A) = l-P(Å).

(26)

Denne likning brukes ofte fordi det i enkelte tilfeller er enklere først å finne sannsynligheten P(Å) for at resultatet A uteblir.

31

4.5

“Ærlige” terninger

Rent unntaksvis kan verdien av sannsynlighetene bestemmes ved bruk av “enten eller” og “både og” reglene. Ved kast med terning har vi opppfylt alle betingelsene for gyldigheten av (25). De 6 mulige resultatene betegner vi med 1, 2,..., 6. På grunn av symmetri er de respektive sannsynlighetene like, slik at P(l) = P(2) = ••• = P(6) og (25) gir

P(l)+P(2)+ --- + P(6) = 1. altså P(fc) = -,

4.6

k = 1.2.--,6.

(27)

Sannsynlighet for telle-arrangement

Vi gir nå et annet eksempel der kvantitative utsagn om sannsynligheten kan utledes av “både og” regelen. Vi vil bestemme sannsynligheten P(t) for at et gitt telle-arrangement ikke registre­ rer noen pulser i løpet av en tid t. For å finne formen av funksjonen P(z), deler vi intervallet t i to deler t = h +t2

t=0

K— ti —— t2 —>1 Pulsene som tellearrangementet registrerer er uavhengige av hverandre. I første intervall tj kan eller kan det ikke bli registrert pulser (eventX eller A). Helt uavhengig av hva som inntreffer i første periode kan eller kan det ikke registreres pulser i annen del t2 av perioden (event B eller 5). Om en puls blir registrert i løpet av en tidsperiode er bare avhengig av lengden på perioden, og jo lengre perioden er, jo mindre sannsynlig er det at ingen puls blir registrert. Vi kan derfor si at sannsynlighetene for at ingen puls blir registrert i enten den første (event A) eller andre (event B) periode er gitt av henholdsvis P(t\) og P(/2)- mens sannsynligheten for at ingen pulser blir registrert i hele intervallet t (event A n B) skrives som P(Z) = P(fi + t2). Da hendingene A og B er uavhengige av hverandre gir “både og” regelen (16) at

P(ti +t2) = P(Anfi) =P(A)P(B) = P(n)P(t2).

(28)

Det er bare eksponensialfunksjonen som gir løsning til denne funksjonslikning med løsningen P(t) = e

(29)

der a er en positiv konstant. Grunnen til minustegnet er at P(t) må forventes å minke når t øker. For a — 0 fås P(t) = 1 uansett lengden av intervallet t. Dette svarer til beskrivelsen av tilfelle med null intensitet der vi er sikker på ikke å registrere noen pulser uansett lengden av perioden t. Jo større tz, jo mindre er sannsynligheten for at ingen pulser registreres i en gitt peride t. Vi forstår at a er et mål for intensiteten av den stråling som forårsaker pulsene. 32

4.7

Sannsynligheten for atomspaltning

Vi vil nå benytte begrepet betinget sannsynlighet for å bestemme sannsynligheten for spaltnin­ gen av radioaktive atomer. Aksiom V kan skrives som P(AHB) (30) P(B\A) = P(A) La oss betrakte et antall atomer som alle er intakt ved tiden t = 0. Sannsynligheten for at et spesielt atom fremdeles er intakt ved tid t > 0 betegner vi med P(t). Sannsynligheten for at et atom som var intakt ved et bestemt tidspunkt t\ < t (event A) og fremdeles intakt ved tiden t (event B), kan nå betraktes som en betinget sannsynlighet P(B\A). ARB betegner resultatet at atomet er intakt ved tiden t og var selvfølgelig også intakt ved tiden t\2a2

er på grunn av eksponensialleddet i (60), meget mindre enn den maksimale sannsynlighet.

5.10

Feilintegralet og standardavviket

Sannsynligheten for å finne resultat A eksakt k ganger når observasjonene gjentas N ganger er liten for alle verdier av k når N er stor, (kf. kapittel 6.6). På den annen side, om et bestemt resultat inntreffer eller ikke inntreffer eksakt k ganger i et bestemt eksperiment, har liten betyd­ ning. Det som har betydning i praktiske anvendelser, er utsagn om mulighetene for at resultatet av målingen leder til en verdi av k innenfor et nærmere spesifisert intervall, dvs. om det fås en verdi av k slik at f.eks. (63) k\ < k < ki-

Sannsynligheten for å finne en verdi innenfor intervallet (63) er ifølge (17) lik summen av sannsynlighetene som korresponderer til alle verdier av k innenfor (63), og som vi symbolsk skriver som Bp(N;ki < k < k2) = Y BpWk)41 = Noe-a‘

Vår modell for radioaktiv spaltning leder altså til at antall intakte atomer skal minke tilnærmet eksponensielt med tiden. Mer presist: det aktuelle antall intakte atomer kan beskrives av en trinn (step)-funksjon da det totale antall atomer alltid er et helt tall. Trinn-funksjonen vil variere omkring den eksponensielt avtagende forventningsverdi. Av kapittel 5.11 følger at vi med stor grad av sikkerhet kan vente at den aktuelle verdi N(t) ved en gitt tid t ikke vil avvike fra forventningsverdien < N(t) > med mer enn la oss si tre ganger standardavviket. Ifølge kapittel 7.10 har vi i vårt tilfelle G= ^Noe^^-e-01).

Om vår modell for radioaktiv spaltning beskriver de observerte data, er illustrert i figur 4. Fi­ guren er et resultat av en laboratorieoppgave for fysikkstudentene og viser antall partikler som ble målt fra en radioaktiv kilde (108Ag) som funksjon av tiden. Antall registrerte partikler i 10 s intervall er plottet og vist ved den brukkede kurven. I figuren er også tegnet forventningsver­ dien for antall utsendte partikler og de striplede kurvene markerer avvikene henholdsvis lik ett og tre standardavvik. Vi ser at som ventet slynger den brukkede kurven seg rundt forventnings­ verdien. I 20 av 69 måleintervall registreres avvik fra forventningsverdiene med mer enn ett standardavvik. Dette resultat er i god overensstemmelse med tabell 5. Ingen av registreringene overskrider tre standardavvik fra forventningsverdiene. 57

Tid [s]

Figur 4. Kurve for radioaktiv spaltning. Antall partikler som er registrert i 10 s inter­ vall er plottet som en brukket kurve. Verdiene varierer omkring forventingsverdiene for emitterte partikler og disse er representert med den heltrukne kurve. Grensene for henholdsvis ett og tre standardavvik er markert ved de stiplede kurvene. Ingen steder krysser brukket kurve grensen for tre standardavvik.

58

Kapittel 8

Forventningsverdier av forskjellige funksjoner 8.1

Generelle relasjoner

Av utledningen (101)

=£f(*)/>(*) k

kan vi utlede noen enkle egenskaper for forventningsverdien. Vi nevner

< a >=a når a er en konstant og også

< af(k) > = a< f(k) > . Videre har vi for to funksjoner f(k) og g(k) at

< af(k) + bg(k) >= a < f(k) > +b < g(k) >

(114)

når a og b er konstanter. Analoge uttrykk er gyldige for lineære kombinasjoner av mer enn to funksjoner. Avvik mellom den observerte verdi f(k) for funksjonen og forventningsverdien kan skrives W(k) = f(k)- < f(k) >,

og forventningsverdien for dette avvik er = 0.

Spredningen (variansen) av funksjonen f(k) kan defineres som < (5/(*))2> = < (/(*)-)>,

(115)

der < f (k) > kan betraktes som en konstant angående utregning av forventningsverdien (115). Utføres kvadreringen på høyre side av (115) og nyttes (114) får vi

< (5/w)2>=
-2-

Spredningen (variansen) av en funksjon f(k) fås som forventningsverdien for kvadratet av funksjonen minus kvadratet av forventningsverdien for funksjonen.

59

8.2

Approksimative uttrykk for fordelinger med markerte maksima

Hvis fordelingen p(k) har et skarpt maksimum rundt k « a og største delen av fordelingen inneholdes i området rundt maksimum, kan vi utlede visse approksimative uttrykk for forvent­ ningsverdiene for funksjoner f(k) som ikke varierer hurtig rundt k ~ a. Vi kan utvikle f(k) i Taylorrekke omkring k = a og får /(k) = /(a) + (k-a)/(a) + ^k-a)2f"(a) + ---.

(116)

Tar vi nå forventningsverdiene på begge sider av (116) får vi = /(«)+ /'(«) +^f"(a) < (k — a)2 >+•••,

(117)

og setter vi a = < k > gir (117) < /(k) > = f (a) + ^f"(a)m2 -I----- ,

der m2,... er sentralmomentene for fordelingen p(k). Hvis fordelingen har et skarpt maksimum, har m2 en liten verdi og vi får ^f(). (118) En noe bedre approksimasjon fås når vi også tar med det kvadratiske ledd i (117). Vi får da

^f() + ~m2f"().

Ser vi spesielt på funksjonen f(k) = Ink, får vi 1,0 I,, < InÅ: >æ In < k > — ~^rn2l < k > — In < k > —(o/ < k >)

For slike fordelinger der a/ < k > er små (og de øvrige ledd også er små) er forventningsver­ dien av Ink meget nær lik logaritmen til forventningsverdien av k. Det er viktig å merke seg betingelsene for gyldigheten av (118) når denne tenkes brukt i anvendelser. Et approksimativt uttrykk for spredningen av funksjonen f(k) fås ved i (115) og sette inn (116) og (117) med a = < k >

Tar vi med ledd av tredje orden i rekkene fås en noe bedre approksimasjon 2

< (S/(Æ)) > *m2f\) + m3f()/"« k>).

Spesielt for funksjonen f(k) = Ink får vi < (8InÆ)2 >æ m2/ < k>2 —m3! < k>2 .

60

Kapittel 9

Forventningsverdier for funksjoner av flere variable 9.1

Definisjoner

Ofte kan resultatet av et forsøk være at en rekke variable k, l,... hver kan anta spesifikke verdier kv, ... (y.p = 1, 2,...). For å forenkle fremstillingen vil vi nå bare betrakte tilfellet med to variable, og som et praktisk eksempel kan vi betrakte par av avlesninger fra et tellerarrangement. Alle slike mulige par kan vi betegne Aki der resultatet Aki inntreffer hvis resultatet av første avlesning er k og annen avlesning er /. Istedet for å betrakte avlesningspar fra ett tellerarrangement, kan vi også betrakte samtidige avlesninger fra to forskjellige arrangement. Det er hensiktsmessig å representere slike to-dimensjonale resultater ved et tallpar, dvs. vi erstatter Aki med k,l. Fordelingsfunksjonen blir i dette tilfelle en funksjon av to variable definert ved

p(Aki) = p(k.l),

der p(ky. l^) er sannsynligheten for at resultatet ky.l^ inntreffer. Fordelingen antas alltid å være slik at

XX p(^-0= L k l der summasjonene skal utføres over alle mulige kombinasjoner kv og /p. Vi vil nå følge analoge resonnementer som i kapittel 7.6 og utlede et uttrykk for forvent­ ningen for en vilkårlig funksjon av to variable k og l, altså Z = f(k.l). Analogt med (100) får vi sannsynlighetsfordelingen for Z gitt ved p(Z)=

X,

(120)

p(k.l).

f(k.l)=Z

Av (91) og (120) følger at

= =yzP(z) = yz y Z

=z

z

Z

p(k.i)

f(k.l)=Z

f(k.l)p(kd) = ^^f(kd)p(kAY

Z f(k.l)=Z

k

l

der siste likhetstegn følger av helt analoge resonnementer som ved (101). 61

(121)

9.2

Forventningsverdier for summer eller produkter av funksjoner

Hvis nåf(k.l) = j\(k) + f2(f) gir (121) at =

+ i

k

(122) i

k

Av addisjonsregelen (17) for sannsynligheten følger at sannsynlighetsfordelingene p\(k) og p2(Z) for henholdsvis k og l er

Pl(k) =^p(k.l)

og

p2(l) = ^p(k.l).

/

(123)

k

Av (101), (122) og (123) følger nå

< fi (k) +/2(Z) > - < fi (*) > + < /2(Z) > •

(124)

p(l\k) = ~~., Pi(k)

(125)

Av aksiom V følger at

P(*|Z) =

P2(l)

og

der p(k\l) betyr den betingede sannsynlighet for at verdien k inntreffer når verdien / alt har inntruffet. Analogt for p(l\k). Hvis nå

p(£|Z) = Pi(k), er ifølge kapittel 4.2 k og l stokastisk uavhengige og da kan vi av (125) skrive

p(k.l) = p\(k)p2(l).

(126)

I dette tilfelle får vi av (121) når f(k.l) = fi(k)f2(l) at

< fl(Vf2(l) > = YYf^f2f)Pl(k)P2(l) k

l

= (X/1WP1W)(X/2(Z)P2(Z)) =.

(127)

Vi presiserer at (124) er gyldig også når k og l er innbyrdes avhengige variable, mens (127) bare er gyldig når k og l er uavhengige variable, (kf. også kapittel 9.4.)

9.3

Korrelasjonskoeffisienten

Vi vil nå betrakte spesielt

f(k.l) = dkdl.

der dk = k— < k > og 5/ - l— < l >. Vi finner at < dkdl > = < (k- < k >)(/- )>. 62

Utføres multiplikasjonen på høyre side og nyttes (114) får vi = - = 0

(når k og l er uavhengige).

Verdien av < 5Æ8Z > kan således brukes som mål for avhengigheten mellom k og l. For å få et uttrykk med dimensjonen eller benevningen én for denne avhengighet dividerer vi (128) med kvadratroten av produktet av spredningene for k og l. Med (106) fås altså

< kl > - < k >< l > ------------------------------- Pki-

< 8Æ5Z >

+ x/

(129)

Innen statistisk litteratur finner du også navnet kovariansen mellom k og l på uttrykket < Skål >=< kl > — < k >< l > (engelsk covariance med forkortelse cov^ eller covarju). pik er den såkalte korrelasjonskoeffisient mellom k og l. Den har følgende egenskaper. 1. Hvis k og l er uavhengige er

lik null.

2. Hvis forbindelsen mellom k og / er lineær slik at observasjoner leder til verdipar k og l som tilfredsstiller k = al 4- (3, der a 0 og |3 er konstanter, får vi p^/ = ±1. + gjelder for positive a og - for negative a. Dette følger lett av (129), (109) og (106).

3. Hvis 0 < pki < 1 snakker vi om en positiv korrelasjon og hvis —1 < Pki < 0 snakker vi om en negativ korrelasjon mellom k og l. Positiv korrelasjon betyr at ved observasjon av tallpar k. I vil vi finne en viss preferanse for tallpar der både k og l avviker i samme retning fra deres respektive forventningsverdier. Ved negativ korrelasjon vil vi finne en viss preferanse for tallpar k. I der de respektive avvik er av motsatt tegn.

9.4

Merknader til korrelasjonskoeffisienten

Det er viktig å merke seg at for uavhengige variable k.l er pu = 0, men av pw — 0 for et par variable kan vi ikke konkludere at disse variable nødvendigvis er uavhengige. La oss se på en sannsynlighetsfordeling der p(±k.±l) = p(|Æ|, |/|). (130) Bruker vi nå (121) til å skrive ned de eksplisitte uttrykk for < kl >, < k > og < l > får vi av (130) at alle sammen inneholder ledd som parvis opphever hverandre og derfor vil alle sammen være null, altså = = = 0 og herav

Pki = li­ men k og l er ikke uavhengige. Bare dersom p(^M^I)

= pi(I^I)p2(|/|) 63

er k og l her uavhengige. Vi ser altså at korrelasjonskoeffisienten kan under spesielle forhold bli null uten at k og l er uavhengige. Hvis korreslasjonskoeffisienten er lik ±1 er det en ikke-statistisk lineær forbindelse mellom k og l. Det kan imidlertid være en sterk forbindelse mellom k og / uten at korrelasjonskoeffisi­ enten blir lik én. Hvis observasjonene leder til tallpar k og / slik at i hvert tilfelle vil

(131)

der f er en gitt funksjon, vil < dkdl > = < kf(k) > - ,

og korrelasjonskoeffisienten p# av dette uttrykk er i alminnelighet ikke lik én. Hvis f.eks. f(k) er en like funksjon (f(—k) = f(k)) og sannsynlighetsfordelingen av formen (130), får vi at pkl = 0 til tross for den strenge forbindelse (131) mellom k og l. Vi forstår av dette at korrelasjonskoeffisienten må behandles forsiktig. Det eneste sikre vi kan slutte av verdien for korrelasjonskoeffisienten for to størrelser er at størrelsene kan ikke være uavhengige hvis f 0. To størrelser sies å være korrelert hvis p« 0 og som forklart ovenfor: Uavhengige størrelser er ikke korrelerte. Korrelerte størrelser kan ikke være uavhen­ gige, men ukorrelerte størrelser kan eller kan ikke være uavhengige.

9.5

Spredningen av en sum av to variable

Vi undersøker nå tilfellet der

f(k.l) = k + l og finner ved hjelp av (124) at

< (k + l)2 > = < k2 >+2 < kl > + < l2 >

(132)

og

2 = +2 + .

(133)

Av (132), (133), (109) og (128) følger nå

= < (dk)2 > + < (dl)2 >+2< dkdl > .

(134)

Hvis spesielt k og l er ukorrelerte variable er < dkdl > = 0 og altså

< (d(k + l))2 > = < (SÆ)2 > + < (dl)2 >,

(134a)

eller med en annen notasjon

o^ = ) er en funksjon av 5 stokastisk variable. Hvis nå denne funksjon varierer så langsomt innenfor området der sannsynlighetsfordelingen for Z er konsentrert, at Z kan approksimeres med dens tangentplan, (de to første ledd i en Taylorrekke omkring P = f(< kil] >,)) kan vi skrive

Z^f« Jv +

>..< k ~ >,...,< k{sl >). Tar vi forventningsverdien på begge sider av (136) får vi < f(k^.k{2\,...,k^)>^f«k{l} >,,...,),

som er analog til (118). Vi regner ut < (Z- < Z >)2 > =

— V f

3/

2 -I- 9 V* V

Fdk^’

(137)

ved å bruke (136) og (137) og får

pcovk[i^kP-

(138)

når vi bruker navnet kovarians som forklart etter likning (129). Når vi for alle i j (i,j = l,2,....s) setter k(i}k(j}

< k(i} >< k'j} > = 0

i (138) får vi

) + (a|)M +-+(^)La‘“l) _,j(at) >—< (x— < x >)(x4-y— < x + y >) > = < (x- )(x4-y— — )> = < (x2 4-xy - x — x — x — y 4- 2 4- )> = 4- — < x >2 — < x >< y > — < x >2 — < y> 7

4- < x > 4- < x >< y >

= < x2 > - < x >2= o^. 67

Videre får vi dz 1 dx p w dz _ —x dw p w2

1

x+y —x (x + y)2

som innsatt over gir ( 1 \2 / —x \2 1 —X ( ~--- -G* ) + ( 7~Z--- ZTn 6w ) -f 2—--- - —---- -X Vx + y / \(x + y)2 / x + y (x + y)2 (x+y)2+x2-2x(x+y) , x2 2 (x + y)4 x+(x + y)4 y

som er identisk med (145). Metode 3. Hvis vi til slutt setter m = n = 0 og l — -1 i (141), får vi z = x/w slik som i eksemplet vårt der w = x + y, x og y er uavhengige størrelser og x, y, ct2 og o2 er kjent. Bruker vi nå (144) får vi

o2 c| + o2 x2 + (x+y)2

2 2 x(x + y) x

t x2(x + y)2 x

(x + y)2

som igjen er samme svar som (145).

9.9

Kovarianser ved sammensatte størrelser

For å bruke den generelle ubestemthetsforplantningsregelen (138), må vi kjenne k", oi(J og covk“ k'p n4r målte størrelser er avhengige av hverandre. Vi skal nå lære å beregne kovariansene når størrelsene er gitt som funksjoner av de målte variable. Vi har zi - f(k ^.k 2)....) og Z2 — g(k 1 k 2 ....) og skal finne covZ1Z2. Uavhengig av om k11 . k 21.... er korrelerte eller ikkeke er z\ og zi åpenbart korrelerte. Hvis nå z\ og Z2 kan approksimeres tilsvarende likning (136), får vi ved hjelp av (137)

dzi dz2 i dzi I dz2 coy^i)^2! 4-----dkl> Pdk2 p dk 2'-Pdk11 dz\ I dz2 I + dzi dz2 i \ p)COVÅ:[31i^31dk's 1 Pdks}[P dks^Pdk

/2.1 stedet for (136) skriver vi nå funksjonen z som at121

i (fc,2>->)

z^f{ ^0.

=

< (8Z)2 > = o^.

og

ky-k = ly-l,

(156)

og (156) i (155) gir nå N

N

1/^.1

z-Z(/v-/)2=Z/v2-^ v=l

v=l

Z/v

/v v=l

.

7

Nå er

(X'») =E^+2Z'v'^ V• 1

1

V=UV-1)=4

(158)

1 V=1

og derfor bruker vi (159) 72

som et estimat for fordelingens standardavvik og vi kaller 5 for standardavviketfor stikkprøven på N målinger. Det er viktig å merke seg at høyre side i (159) bare inneholder observerbare størrelser i motsetning til venstre side av (105). 5 danner altså en “bro” mellom den reelle verden og modellen av den representert ved størrelsen o.

10.3

Estimat sk[ for kovariansen covk[

I kapittel 9.3 innførte vi navnet kovarians mellom k og l og betegnet den statistiske relasjonen med covw = < (k- < k >)(/- < l >) >• Analogt med standardavviket eller variansen kan heller ikke kovariansen utregnes uten kjennskap til sannsynlighetsfordelingene for de variable. For å komme frem til et uttrykk som kan gi oss en tilnærmet verdi for kovariansen, vil vi nå studere uttrykket N

(160)

Z = ^(kv-k)(lv-l). v=l

der ky og k igjen refererer til henholdsvis (81) og (82) og tilsvarende for Zv og /. Vi vil nå gjennomføre tilsvarende resonnementer som i kapittel 11.2 og setter uv = ky— < k > og vY = Zv — < l >. Når kv og Zv er korrelerte, er følgelig også uv °g Vv korrelerte. Vi finner lett at =0.

u = k-,

kv-k = Uy-u,

(161) = 0.

Zv-Z = vv-v.

v-Z-.

Av (161) og (160) får vi nå N

N

Z= Nå er



N

N

= v=l X MWv- ™v=l T7 X Mv X Vvv=l

v=l N

(162)

N

N

X Mv X Vv = V=1 X MvVv + 2 v

vV

1 N Z= (i-jd) iy V=1

1

V= (1 - —) < wvvv >

X

V=1

2

< X UyVv >‘

iy

som med hjelp av (114), (161) og (128) gir

jv 1 < Z > = < y\{kv-k)(lv-l) >= (1 - —)ZVcovw = (ZV-l)cov*/. N v=l

(163)

Av (163) følger nå at 1 N _ _ < t—- ^(kv-k)(ly-l) > = covw. A

1 V=1

73

(164)

og derfor bruker vi 1 skl ~

N r V, (ky — k) (Zv — l)

(165)

~ 1 V=1

som et estimat for kovariansen mellom k og l. I analogi med resonnementene i kapittel 10.2 setter vi for kovarians av stikkprøven på N målinger. I modellen som vi arbeider med, bruker vi skrivemåtene cov^ og a, mens sh og 5- er størrelser som vi kan beregne på grunnlag av observasjoner.

10.4

Det additive uttrykk

I måleteknikken finner vi ofte at uttrykkene for resultatet kan være særlig enkle. Et av dem er det additive utrykk Z = ak{l} + bk{2} -ck{3} + •••. (166)

der a, b, c,... er konstanter uten ubestemthet og Z? 1Ål21, &(3>, ... er ukorrelerte variable. Ved fremgangsmåte som i kapittel 9.5 og bruk av (153) finner vi lett det generelle uttrykk analogt til (135) (se også (140)) Oz =

+ ^^2, + c2oJ3>

+••••

(167)

Legg merke til + for alle ledd selv om konstantene er negative. I praksis vil alle standardavvik (fyn, o^2i, ... bli estimert ved henholdsvis 5^21, ... av uttrykket (159).

10.5

Uttrykk på produktform

Svært ofte forekommer uttrykk på produktform, dvs. et potensprodukt av de ukorrelerte variab­ le med eksponenter uten ubestemthet. F.eks. kan vi se på et uttrykk som

k^l Z = a—-7-. md

(168)

der a, b, c og d er konstanter uten ubestemthet og k, l og m de ukorrelerte variable. Av (168) og (138a) får vi lett (se også (142))

(v) Z 2«(i’T) k 2+(-T) c l 2 +

W.

H r2

r.

(172)

etter følgende resonnement: P(r2|n) betyr sannsynligheten for at søyle 2 inneholder r2 resul­ tater når søyle 1 alt inneholder r\ resultater. Av (25) får vi at Pi + P2 +P1 +■■■ +Ps

som kan skrives som

= 1,

_PL_ + _P1- + ... + -Pl_ = 1.

(173) 1-pi 1-pi 1—Pi Når søyle 1 alt inneholder n resultater, vil søylene 2, 3,..., 5 tilsammen inneholde de resterende (N -rf) resultater, og sannsynlighetene for å finne disse resterende resultater i de respektive søyler fremgår ledd for ledd av (173). Sannsynligheten for å finne et resultat i søyle 2 er altså og (38) gir derfor at

P(r2\rf =

/V-rA / P2 \ ri /'1-pi/

_

V

P2

\N~ri~r2

1-pA

Helt analogt resonneres for P(r$\ri Dr2) osv. og herav følger (172). Vi sier at n, r2, ■■■, rs er multinomisk fordelt. Hver av sannsynlighetene p, er uavhengige av hverandre og (25) gir derfor £

Pj = l~Pi-

som betyr at sannsynligheten for å få et resultat i en av søylene som ikke er nummer i er 1 — p(. Hvor mange resultater kan vi forvente å finne i søyle i? Svaret følger av Bernoullifordelingen ved (46) eller (95) og er < rt> = Npi. (174)

79

Standardavviket er gitt av (50) eller (113) og blir

(175) Hvis nå p,

1, dvs. histogrammet inneholder mange søyler, kan (175) approksimeres ved

(176) Av (176) forstår vi at som mål for fluktuasjonene av antall resultater i en søyle, kan vi bruke kvadratroten av forventningsverdien for søylen. Derfor er det vanlig når en tegner histogrammer, å avsette de funne verdier med ubestemtheter lik kvadratroten av disse tall. De funne verdier brukes som tilnærmede estimater for forventningsverdiene. Når resultatene plottes og skrives som ri ± betyr dette at vi regner med ca. 68% sjanse for at den sanne verdi av r, ligger innenfor dette intervall (kf. kapittel 5.11).

80

Kapittel 11 Gaussfordelingen 11.1

Tilfeldige feilkilder

I kapittel 1.13 pekte vi på en del kilder som ga bidrag til ubestemtheten i måleresultatene. Det er ikke urimelig å anta at hver kilde kan gi et lite bidrag til avviket fra den sanne verdi. Var nemlig bidraget stort, ville vedkommende kilde lett røpe seg og dermed kunne bli eliminert. Vi antar derfor at avvik som skyldes den enkelte kilde er små, og at det totale avvik 8å.v — kv~ < k > er summen av alle avvik for enkeltkildene. I kapittel 7.7 fant vi at forventningsverdien av måleavviket åk er null. Den eneste implisitte forutsetning for dette er at måleverdiene k er tilfeldig variable. Som følge av foranstående finner en derfor ofte i litteraturen at “tilfeldige feilkilder” ved målingene defineres som ubestemthetskilder som bidrar til at < åk > = 0. Alle andre ubestemthetskilder betraktes som “systematiske feilkilder”. Med andre ord bidrar en systematisk feilkilde til at måleresultatet ensidig avviker fra den sanne verdi mens tilfeldige feilkilder kan bidra til at måleresultatet like ofte får for store som for små verdier i forhold til den sanne verdi. At < åk > = 0 er altså det matematiske uttrykk for at ubestemthetskildene er tilfeldige.

11.2

Modell av måleprosessen

Vi vil nå studere en modell for hvordan vi kan tenke oss et måleresultat fremkommer når vi måler en fysisk størrelse. La a betegne den sanne verdi av den målte størrelse. Vi tenker oss at enkeltmålingenes av­ vik fra a er et resultat av virkningen av en rekke ubestemthetskilder som hver kan bidra med +f eller - f til den sanne verdi a. Forholdene kan belyses ved diagrammet i figur 7.1 diagrammet har vi antatt N ubestemthetskilder. Kildene gir bidragene uavhengig av hverandre. Resultatet av målingene er illustrert i nederste linje i figur 7, og verdiene av målingene kan variere fra (a - Nf) til (a + Nf) i steg på 2f. Verdien (a - Nf) får vi når alle kildene virker med sine bidrag i negativ retning, og verdien (a 4- Nf) når alle kildene virker i positiv retning. Vi lar p betegne sannsynligheten for at kilden gir et positivt bidrag, og (1 — p) er da sannsynlighe­ ten for et negativt bidrag. Da kildene virker uavhengig av hverandre og positive og negative bidrag opptrer like ofte, følger det at p = (1 — p) — 0.5 og Bernoullifordelingen (38) gir oss sannsynligheten Bp(N-,s) for at 5 av de N ubestemthetskilder skal gi sitt bidrag i positiv retning. Det å gjenta en måling uavhengig av andre målinger i en serie kan likeverdig uttrykkes slik: Hvordan vil de N ubestemthetskilder kombinere sine bidrag til et totalavvik fra den sanne

81

Sann verdi

Måleresultat

Figur 7. Til belysning av ubestemthetskilders bidrag til måleresultatet. verdi? Hvis 5 kilder virker i positiv retning, vil (N — fra den sanne verdi der 2s — N = m

+ sf = (2s — N)f = mf være avviket

s = 0.5(N + m).

eller

(177)

Av (177), (38) og p = 0.5 får vi sannsynligheten for å oppnå et avvik e = zn/,

eller måleresultatet

x — a + E = a + mf blir A!

P(m)

(178)

Eksempel på Bernoullifordelingen (178) er vist i figur 8 for A = 5, 25 og 100. Det bemerkes at m ifølge (177) bare kan være like eller ulike alt etter som N er like eller ulike og £ kan derfor bare variere i steg på 2f. I vår modell av måleprosessen er det ikke urimelig å anta at antall ubestemthetskilder N er stort eller iallfall at N > ca. 10. Vi får herav at (61) kan nyttes som et approksimativt uttrykk for (178). Med a = Np, p = 0.5 og (177) får vi £

s — Np — N/2 + m/2 — N [2 = mf2 = — , 82

Figur 8. Bemoullifordeling for p = 0.5 og N = 5, 25 og 100. som innsatt i (61) gir sannsynligheten p(e) for å få et måleresultat som avviker e fra den sanne verdi 1 — e2 P(e)«_—-e ^(2/), (179) V 27t/l

der vi har satt h2 = 4Np(\ — p)f2 = Nf2. 83

(180)

Ifølge kapittel 5.8 er approksimasjonen (179) gyldig bare når avvikene £ ikke er for store. I analogi med betraktningene i kapittel 5.10 er vi nå interessert i sannsynligheten for å finne måleresultater der avvikene £y ligger innenfor et spesifisert intervall, f.eks.

Ae 2

Ae 2

J

La intervallet være illustrert slik

2f

a

—>i Ae k— Vi tenker oss f så liten at avvikene Ey kan variere i mange steg på 2 f innenfor intervallet Ae. (179) gir sannsynligheten for å finne én bestemt verdi av £ og ifølge (17) er sannsynligheten for å finne et avvik i intervallet Ae lik

1

e~^(2f)

f2nh

.— e

V2n/z

Ae.

(181)

hvor vi har valt Ae så liten at e er praktisk talt konstant innenfor dette intervall. Innfører vi nå istedet for E den målte verdi x og sanne verdi a kan høyre side av (181) skrives

1

-■__ e

v2nA

_,x 0,2 2a2 Aj,

(182)

som altså er sannsynligheten for å finne en målt verdi x i intervallet (x — ^) til (x + ^).

11.3

Kontinuerlige måleverdier

I kapittel 11.2 gikk vi ut fra at Nf var det største avvik fra den sanne verdi en måling kunne ha. Av (180) får vi at Nf — h2/ f og vi vil nå studere

Nå er h et endelig tall og f er liten og tabeller over siste integral i (183) (kf. kapittel 5.11) viser at dette er neglisjerbart i forhold til 1 når h/f — \'N er stor. Som eksempel kan nevnes at alt for h/f = 3.1, dvs. N = 10, er siste ledd i (183) mindre enn 0,002. Altså får vi at fordelingen (182) meget nær tilfredsstiller (25). 84

Av (91) og (182) får vi forventningsverdien av måleverdien x som £ a

=

f

2 _(x a)2

|

1

a,2 Ax =

y x .— e ^.2 v/2n/?

l'a+T

=j=r- /

xe

fZnh.la f

x~a y-

1 P? -4^dy

= a—= / e V2n-/-^

a.

Av (105) og (182) får vi standardavviket for fordelingen (182) a+7

O2 =

=

Y

i

_ (x-a)2

(x —a)2 ^-e 7 V2nh

i __ /ra+^f 7(x-a)2_ e \/2Tih.la-^

2*2 Ax

(x-a)2

2h2

2 dx = —A= /f+7 y2T e y2^dy^h~. \Z2n-'-?

Når vi sammenlikner (182) og (61), som er Bernoullifordelingen vi har benyttet i vår modell av måleprosessen, ser vi at fordelingene tilnærmet har samme forventningsverdi og standard­ avvik. Det er imidlertid en prinsipiell forskjell mellom Bernoullifordelingen og (182) idet Ber­ noullifordelingen bare beskriver situasjoner når måleresultatene er heltallige mens x i (182) ikke behøver være heltallig. Videre har vi i dette avsnitt latt intervallet (x — y) til (x+ ^r) bli uendelig lite ved å la Ax —> dx og erstattet summasjoner med integraler. Vi har med and­ re ord betraktet måleresultatet x som kontinuerlig variabel. Denne idealisering begrunnes ved følgende betraktning. Ved måling av enhver fysisk størrelse kan vi tenke oss måleresultatene notert som et helt multiplum av den minste skaladelstrek til måleinstrumentet. Alle sannsynlighetsfordelinger som beskriver fordelingen av måledata, burde derfor i prinsippet være diskrete sannsynlighets­ fordelinger slik som Bernoullifordelingen og Poissonfordelingen. Imidlertid kan vi i prinsippet tenke oss at alle målinger av fysiske størrelser kan bli utført med måleinstrumenter som har uendelig små skala-enheter. Av dette følger at måling av kontinuerlig variable fysiske størrelser resulterer i md/everdier som også er kontinuerlig variable. Hensiktsmessigheten av denne idea­ lisering ligger vesentlig i det forhold at en kan benytte den matematiske teknikk fra differensialog integralregningene istedet for regning med summer som ofte kan være brysomt. Vi har alt i dette avsnitt vist fordelen med integralregning.

11.4

Sannsynlighetstetthet

Erstatter vi h med o i (182) og ser bort fra leddet Ax vil (182) være identisk med den funksjon vi i kapittel 5.9 kalte Gaussfordelingen. (Merk at x i (182) og kapittel 6.9 er forskjellig definert.) Vi skriver derfor istedet for (182) 1

P{x)dx —

^-e

_ (x-a)2

dx.

(184)

V2no

og kaller P(x) en sannsynlighetstetthet og P(x) dx er sannsynligheten for å observere en verdi i intervallet dx omkring verdien x.

85

1

2(7V—1)’

eller skrevet på annen måte o 5 y/2(7V - 1) ~ v/2(N-l)’

(188)

Relasjonen (188) er meget viktig, og den forteller hvor stor ubestemthet i estimatet for stan­ dardavviket vi kan vente på grunnlag av N stikkprøver (eller N målinger). Er (V = 10 gir (188) at ubestemtheten på standardavviket er ca. 25% av 5 og for N = 100 er den ca. 7%. Vi ser altså at skal vi oppnå noenlunde sikkert estimat for standardavviket må N gjøres meget stor. Van­ ligvis velges ikke N stort over 10 og (188) sier da at det ikke er mening i å angi 5 i sluttsvaret med mer enn ett eller i høyden to siffer. Når sluttsvaret skal angis er det derfor av viktighet at antallet av stikkprøver oppgis.

11.9

Numerisk beregning av ubestemthet

Den numeriske beregning av resultatets ubestemthet krever at en kjenner verdien av de obser­ verbare størrelser og deres standardavvik. I kapittel 11.8 viste vi at estimatene for standardavvikene er tall av relativ stor ubestemthet. Har vi 10 stikkprøver som grunnlag er ubestemtheten ca. 25%. Det er da innlysende at det ikke stilles store krav til sikkerheten av den tallmessige beregning av resultatets ubestemthet. Av toleransene på denne beregning kreves nemlig bare at den er praktisk sett forsvinnende mot resultantubestemtheten som skyldes observasjonenes ubestemthet. Dette krav er normalt oppfylt når beregningen av hvert enkelt ubestemthetsbidrag gjennomføres med en toleranse på ca. 10% som betraktes som lite mot 25%. Resultanten av to ubestemthetsbidrag på henholdsvis 25 og 10% er jo 27% og altså bare uvesentlig forskjellig fra 25%. 88

N

2

3

4

5

6

7

8

9

10

11

12

d-N y/N

1,13

1,69

2.06

2,33

2,53

2,70

2,85

2,97

3.08

3,17

3,26

1,41

1,73

2,00

2,24

2,45

2,65

2,83

3,00

3,16

3,32

3,46

(y/N-dn) % du

25,2

2,5

-2,9

-4,0

-3,2

-2,0

-0,8

1,0

2,7

4,6

6,3

Tabell 7. Verdier av

og \/N for N fra 2 til 12.

De små krav som stilles til regningens nøyaktighet forklarer at en ofte kan utføre et over­ slag over ubestemtheten på resultatet av en måling før målingen er utført. Vi trenger nemlig bare å kjenne observasjonsverdiene med en toleranse på ca. 10% og så nøye vil en ofte på forhånd kunne si hva observasjonene vil bli. Utføres overslaget over resultatets ubestemthet etter målingens utførelse kjenner en observasjonsverdiene langt nøyaktigere enn deres anven­ delse i ubestemthetsoverslaget krever. Det følger da at en i denne regning ikke benytter alle sifrene i observasjonsverdiene, men avrunder tallene. Den tillatte avrunding vil normalt være gitt ved at den feil som innføres ved avrundingen ikke overskrider ca. 10%. Dette betyr at en kan og som regel bør avrunde til én- eller i helt spesielle tilfeller til enkle to-sifrede tall. Vi får derfor som regel: Det tallmessige overslag over ubestemthet er normalt regning med én-sifrede tall, altså en regning som vanligvis er “hoderegning ”.

11.10 “Maks.-min.” estimater for standardavviket Estimatet (159) for standardavviket er noe brysomt å bruke i praksis, og som det fremgår av forrige avsnitt, er ubestemtheten i estimatet ca. 25% når stikkprøven består av 10 målinger. Det er da naturlig å spørre etter andre metoder som kan gi oss et tilnærmet like godt estimat som (159). En slik metode eksisterer, og den er meget enkel å bruke. Vi skal ikke gå i detaljer, men kort skissere metoden. Vi forutsetter at antall stikkprøver N ligger mellom 3 og 12. Med Wn skal vi forstå om­ fanget av stikkprøven, dvs. Wy er lik differansen mellom den største og den minste verdi vi har funnet blant de N målingene og herav navnet “maks.-min.” estimator. Hvis målingene er normalfordelt, kan det vises at WN i gjennomsnitt er proporsjonal med standardavviket o for det univers prøven er tatt fra og lik dNc der d^ er en konstant som kan beregnes og bare er avhengig av antall stikkprøver N. Herav følger at /d^ gir oss et estimat for o. Det viser seg at dette estimat for o også gir gode resultater selv om fordelingen avviker noe fra normalfordelingen. En kan forundres over at et estimat som er barsert på bare to resultater, kan være nesten like pålitelig som et estimat basert på alle verdier i stikkprøven slik som (159) er. Overraskende nok kan det vises at “maks.-min.” estimatet bare er noe mindre troverdig enn (159). Tabell 7 gir verdiene for d^ når N varierer fra 2 til 12. Vi ser at d^ æ v W for N = 3 til 11, og dette betyr at har vi ikke tabellen foran oss, kan vi med god tilnærmelse sette at

(189)

y/N 89

Forfalskningen av estimatet for o ved å bruke N istedet for du er maksimalt 5% når 3 < N < 11. Så små forfalskninger er neglisjerbare sammenliknet med ubestemtheten i estimatet for o på 25% eller større når en bruker (159). Denne metode for å estimere G anbefales brukt da metoden er meget arbeidssparende.

90

Kapittel 12 Gaussfordeling eller normalfordeling med to variable Vi har en sannsynlighetsfordeling, p(X.Y), av to variable X og Y, som ikke behøver å være uavhengige, p^X.Y^De-^2^^2 (190) Fordelingen (190) kalles for den to-variable Gaussfordeling. A, B,CogD er parametre som må bestemmes slik at (se kapittel 10.1)

p(X.Y)dXdY = 1.

(191)

De-^+2BXY+CY^dxdy^L

(192)

Settes (190) i (191) får vi

For å løse integralet (192) vil vi bruke metoden med innføring av nye variable og benytte følgende regel (se lærebøker i matematikk) [f(x.y)dxdy = [I f(193) r J Jr' ' '«Ol

der x = ( T|), y = XP(^.T|), R et lukket område i xy-planet, R' det tilsvarende lukkede område i ^T|-planet og er Jacobideterminanten d(x.y) d(^-n)

dx

a? dy

5^ dx dy dx dy | ^dtTdndt

(194)

d^

Vi setter nå £, = aX + ØF og T| = yX 4- 8F der a, 0, y og 8 velges slik at + t|2 = AX2 + 2BXY + CY2. Etter litt regning gir dette

5^-øn a8- Øy 91

(195)

y _ «n a8 — Py A = a2 + y2,

C=p2 + S2, B = ap + y8.

som insatt i (192) gir

d(x.y)

d^dx\ = 1.

(196)

Jacobideterminanten (194) blir 3(x.y) _ i

a8- Py

d(^n) og

AC-B2 = (aS- py)2.

slik at

d(x.y) _

i

(197)

3(^-n) ” y/AC-B2 (197) innsatt i (196) gir nå

D

y/AC

B2

slik at D= \^AC-B2/2n.

(198)

med betingelsene at AC-B2>0.

A>0

og

C>0.

(199)

Hvis en eller flere av betingelsene (199) ikke er oppfylt, så vil integralet (191) ikke eksistere. (190) representerer altså en fordeling bare under forutsetning av at koeffisientene A, B og C tilfredsstiller (199) og D har verdien gitt av (198). Vi vil nå beregne forventningsverdiene for X og Y. Erstatter vi summetegn med integraltegn og setter henholdsvis X og Y for f(k.l) og p(X. F) for p{k. I) i (121), får vi med samme metode som er brukt ovenfor Z-f-oo /»4-°° / Xp(X.Y)dXdY = 0. (200) -co J —oo

Og

= o.

(2oi)

Hvis vi nå deriverer (190) med hensyn på A, får vi

aA

\ aA

2

/

idet D etter (198) oppfattes som en funksjon av A. B og C. Integrerer vi nå (202) over X og Y og endrer rekkefølge for integrasjon og derivasjon, får vi

- ~X2)p(X.Y)dXdY. 92

(203)

Ved hjelp av (191) og (198) får vi av (203)

, 31nZ> X2p(X. Y)dXdY = 2-^— = C/A. åA

(204)

der (205)

A = AC-B2.

Men venstre side av (204) er i analogi med (98) annen-ordens moment av den variable størrelse X slik at vi kan skrive = C/A. (206) og likeledes får vi når vi deriverer (190) henholdsvis med hensyn på B og C at

= —B/A.

(207)

< Y2 > = A/A.

(208)

Korrelasjonskoeffisienten, p%y, kan nå etter (128), (129), (200), (201), (206), (207) og (208) skrives

B (209) PXY ~ +y/ ~ + v AC' Fordelingen (190) kan generaliseres. Ved å sette

Y = y — b.

X =x — a,

der a og b er konstanter, kan sannsynlighetsfordelingen for de nye variable x og y skrives p^x

^[A(x-a)2-t-2B(x-a)(y-fe)+C(y-b)2]

(210)

2n

der A, B og C må tilfredsstille betingelsene (199). Vi ser at —

X > -\-a — a.

= b. < (&)>> = = < Y2 > = A/A. < 6a5v > = < XY > = B

B/A.

Ifølge(106) vil vi bruke notasjonen

2=gx

Og

2=ov.

Innfører vi nå ov og pxv som parametre i (210) i stedet for A, B og C, får vi av (211) (husk at p^ og B har motsatte fortegn) i

1 _ r(*~g)2 2o.„-i[~a-),~fc ।

p{x.y) =------------ ----- e 27ioxo /l-p^

x

93

y

)2i y

(212)

som yttrykk for normalfordelingen av de to variable x og y. Hvis og (212) kan da skrives som . \ P(x-y) =

\

1 r—

O\

e

-i(s^)2

= 0, er x og y ukorrelerte,

-Å(^)2 -e 2 °y = px(x) p2(y), \Z ^71 Qy 1

(213

der / s pi(x) =

1 l(x-a)2 e 5' . v2nox

(214

P2(y) -

1 lp-*)2 /— e 2 °y . V27iav

(215

og

Vi ser at (214) og (215) er som funksjonen i kapittel 5.9.x og y er altså hver for seg Gaussfordelt eller normalfordelt og derfor er det naturlig å karakterisere (212) som en normalfordeling av de to uavhengige variable x og y. Sammenlikner vi (213) med (126) får vi at i det spesielle tilfelle når to variable er normalfordelt og ukorrelerte, så er de også uavhengige. (Dette gjelder ikke generelt: to ukorrelerte størrelser kan godt være avhengige, se kapittel 9.4). Det er verdt å meke seg at hvis = +1 vil

hm

r

1 r/x — a\2 ~ x-ay — b iy — b\2~\} ----- =— I------ 2pxy--------------- F I------ ) } 2(1- p2y) Lk ax / • ax \ ov ) JJ —

r

1 ) r/x — a y — b\2 hm ------ -r- ।----------- —— I Lpxy~>+1 1 — Pxy a-.

G2(d] representerer altså spredningen (se (109)) av x forutsatt at vi for d setter parameterens sanne verdi a. Hvis fordelingen p(a;x) har en rimelig likhet med en Gaussfordeling, vil vi med stor sann­ synlighet ha at de målte verdier x vil tilfredsstille ulikheten g(a) — ocG(a) < x < g(a) + ctG(d),

(225)

der a = 3 eller 4. (Sml. (69) og kapittel 5.11). Likning (225) er utilfredsstillende fra en praktisk synsvinkel. (225) gir en øvre og nedre grense for den allerede kjente størrelse x uttrykt ved den ukjente parameter a. På liknende måte som i kapittel 6.1 må vi nå snu oppgaven ved å finne et estimat for den sanne verdi av a uttrykt ved målte verdier av x. Av (225) får vi med stor sannsynlighet at x = g(a) +r]G(a),

(226)

der |r|| < a. Vi innfører nå det vi kan benevne som den målte verdi, d, av a som løsningen av likningen g(å)=x. (227) 97

a er altså en funksjon av x og vi kan skrive d = g~\x),

(228)

der g 1 er den inverse funksjon av g. Det er verdt å merke seg at d bare kan bestemmes når funksjonen p(a';x) er kjent. Vi utvikler nå høyre side av (226) i Taylorrekke med hensyn på (a — d) og får g(a) +r|G(a) = g(d) + T|G(J) + (a — d)[g'(d) H- V|G,(a)] H------ F ledd av høyere orden. Ved hjelp av (226) og (227) og ved å neglisjere ledd av høyere orden, får vi nå

T]G(å) a = a---- ----------------- . g (a) + r|G'(a) Fordi |T| I < a og forutsatt at

g'(d) + r|G'(J) > 0

for

|t|| = < (SF(a;x)2 > .

Hvis vi nå antar at fordelingen av F har en rimelig likhet med en Gaussfordeling, vil vi med stor sannsynlighet ha at |F(a;x)| < ocG(a), (237) der a er sann verdi av parameteren, og x representerer verdiene av de målte størrelsene. Av (237) kan vi definere to verdier av a, a\ og a2, slik at

(i =1.2).

F(o(';x)±aG(fl;)=0

(238)

der vi for de to verdier av i velger fortegn slik at a\ < a'2. Likning (238) gir oss derfor betingel­ sen at den sanne verdi av a må oppfylle ulikheten Cl ।

Cl

Æ? •

(239)

Hvis vi nå utvikler F (a'; x) i Taylorrekke omkring å og ser bort fra høyere ordens ledd, får vi som første approksimasjon at F(a';x) = (a1 — a)

dF(a;x) dd

(240)

der a er verdien av a' slik at

F(d;x) = 0.

(241)

Videre får vi på samme måte ved å utvikle G(a') i Taylorrekke (og ser bort fra ledd av høyere orden) G(a) = G(d) + (a' - d)^' ~(242) da Av (238) får vi når F'(a';x) > 0, at F(a';x) = — aG(a\)

og

F(a2,x) = aG(a2),

og når F'(a';x) < 0 at

F(a;x) = aG(a\)

og

F(a'2,x) = —aG(a2).

som innsatt i (240) og (242) gir

, 621

_ a

aG(d) F'(d;x)| + aG'(d)

,

_

aG(d) a-, — a -I------------------------F'(d;x)|-aG'(d)

Antar vi videre at G'(d)| < F'(d;x)|, kan vi i stedet for (239) skrive

a-O.

G(a) F

G(d) a < a + a-——— 100

(243)

Utvikler vi nå venstre side av (241) i Taylorrekke med hensyn på (a - a) får vi 3F(a;x) 0 = F(a;x) + (å-a)—----- F ledd av høyere orden. da

(244)

Av (244) følger at

F(tz;x) = -{a - a)- ledd av høyere orden zu 3F(å;x) , $;3F(å;x)i = -(a-a)[< -gr->+8-3T“]- ” /-

\

= ~(a-a)
=G2(a)/ < 3F(a;x) under forutsetning av at 3F(a;x) >7^0. da I uttrykket på høyre side av (246) kan vi sette dF(a;x) dd

3F(a;x) da

uten dermed å begå en stor feil.

101

(246)

Kapittel 14 Estimering av flere parametre Vi skal nå beskrive metoden for å estimere flere parametre og vil nå generalisere betraktningene i kapittel 13.4 “Estimering av én parameter når modellen (teorien) inneholder flere variable fysiske størrelser”. Først vil vi finne metoden for å estimere to parametre a og b. Generelt trenger vi da minst to måleresultat x og y. Anta nå at sannsynlighetsfordelingen er av formen

p(a.b;x.y).

For å estimere parametrene, innfører vi analogt med (234) funksjonene

F(a.b;x.y) = F\ (a. b;x.y). F^a. b;x.y) som inneholder a og b eksplisitt. Vi forlanger at

/ / F(=0.

(247)

(248)

Hvis vi har funksjoner F'(a' .b'-,x.y) som ikke tilfredsstiller (247), kan vi skrive

/ / F/(a/. b’;x.y)p(a . b';x.y) dxdy = g(a'.b'), ./ .Is og får

F(a .b';x.y) — F'(a' .b';x.y) — g(a.b') som nye funksjoner som tilfredsstiller (247). Betingelsen (247) er altså ikke særlig alvorlig. Funksjonene F(a.b;x.y) har spredning

< (SF(a. b;x.y)^ >= J / F2(a.b,x.y)p(a. b,x.y)dxdy. Vi innfører nå funksjonene

/ / F2(a .b';x.y)p(a' .b';x.y)dxdy = G(a .b') J Js 102

(249)

slik at komponentene av matrisen G(a',b') ifølge (249) er transformasjoner av komponentene til F(a1. b'-,x.y) og gir spredningen av komponentene til F for a' = a og b' — b. Eksplisitt skrevet har vi < dFi(a.b,x.y)6Fj(a.b,x.y) >= Gij(a.b) (i. j=1.2). (250)

Analogt med utledningen av (237) vil vi nå anta at funksjonene F] og F? har tilstrekkelig konsentrerte fordelinger slik at vi med stor sannsynlighet har at \Fi(a.b-,x.y)\ < a^G^a.b)

(t=1.2),

når «2 velges passende stor. Herav følger at (251)

\Fi(a'.b'-,x.y)\ < ct^G^a.b')

definerer et område for a! og b' som med stor sannsynlighet vil inneholde de sanne verdier av parametrene a og b. For å avgrense området for a' og b' noe mer enn det som er definert ved (251), vil vi nå betrakte lineære forbindelser mellom F\ og F2. Vi definerer 2

F(a',b';x,y) = c\F\(a .b';x.y) + ciFzia .b'-,x.y) = ^CiF^a' .b';x.y)

(252)

1=1

der ikke både ci og c2 er null. Av (252) med hjelp av (248) og (250) (med litt omskrevet venstre side) får vi nå 2

< (j5F(a .b'-,x.y)^ > = ] > 2=1

2=1

2

2

= < ^CiFi(a'.b’-,x.y)^CjFj(a.b'-,x.y) > i=l

J=1

2

= < ^ CiCjF^a',b';x,y)Fj(ar ,b';x,y) > i,j=l 2

= y1 CiCjGij(a .b1)

for a' = a og b' = b.

(253)

1.2=1

Av (248) følger at funksjonen definert i (252) for a' = a og b' = b har forventningsverdien

< F(a.b',x,y) > = 0. 103

Vi antar nå at de målte verdier av F ikke avviker for sterkt fra forventningsverdien slik at vi for alle valg av koeffisientene ci og c2 med stor sannsynlighet har at \F{a .b'-,x.y)\=\^CiFi{a .b'\x.y') < i=l

CiCjGij(a .b')J .

(254)

Vi,J=l

For gitte verdier av x og y vil altså (254) definere et område for a' og b' som med stor sannsynlighet vil inneholde de sanne verdier av parametrene a og b. I stedet for (254) kan vi også skrive 2

F2(a.b';x.y) =x £ acjG^a’.b'-,).

(255)

U=1

det er meget sannsynlig at for vilkårlige valg av koeffisientene ci og C2 vil (x > 0) X = b.

(273)

eller: Forventningsverdien av de målte verdier av a og b er i første approksimasjon lik de sanne verdier av parametrene a og b. 106

14.1

Spredningen av parametrene a og b

Ser vi bort fra ledd av høyere orden, får vi av (268)

, ,/ , z, dFi(å.b-,x,y) , -dF^å.b^x.y) Fi[a .b ;x.y) = (a -a)------ ----------- 1- (b - b)------ --------da db og herav for i-j = 1.2 når vi setter a' — å = Sd og b' — b = 8b,

Fi{a .b'-,x.y)Fj{a .b'\x.y)

(. dFi(å.b\x.y)

= v515—da—

s-dFi(å.b-,x.y)\(

+ &b

Ji>—J

dFj(å.b;x.y)

-dFj(å.b,x.y)\

—S— + &b~db— 1

_ s2dFi(å.b;x.y)dFj(å.b-,x.y> ) -dFi(å. b;x.y) dFj(å.b;x.y) = (8d)2----- —— ------- —— + dabb------------- —------------- --------da da da db _dFj(å. b\x,y) dFj(a. b,x.y) ^2^F^å- F,x.y) dFj(å. b;x.y)

+Sb&a— ------- _—+{ib} — --------

Tar vi nå forventningsverdien av begge sider og neglisjerer ledd av høyere orden (av samme slag som vi neglisjerte i (270)), får vi

< Fj(a .b'-,x.y)Fj(a .b';x.y)

,s_,2 dFi(å.b;x.y) (6a) > = < Fi(ar. b' ;x,y)Fj(a' ,b' ‘,x,y) > = Gij^a.b').

(275)

(275) i (274) gir nå Gij(a.b') = < (8d)2 > Qia(å.b)Qja(å.b)

+ < 8d8b > Qia(å.b)Qjb(b.b)

+ < 8b8d > Qib(å.b)Qja(å.b) + < (8b)2 > Qib(å.b)Qjb(å.b). 107

(276)

Da (275) gir at Gjj(a'.b') — Gji(a'.b'), ser vi at (276) kan skrives som en multiplikasjon av matrisene Gu(a'.b’) G2i(a'.b')

Gn^.b') G22(a'.b')

Qla(å.b) Qia^a.b}

Q\b(a.b) \ / < (8a)2 > (hb(å.b) J y < db åa >

< åa åb > \ ' Qla(å.b) < (8b)2 > ) < Qlb(å.b)

Qia(a.b) Qib^a.b)

eller på symbolform

G(a/.b/) = Q(a.b)m2(a.b)Q(a.b).

(277)

der Q(a.b) er den transponerte matrisen til Q og m^^a.b} i analogi med (106) (og (109)) kalles spredningsmatrisen til parametrene å og b. Vi setter altså

m2(a.b) =

< (8a)2 > < åbåd >

< åaåb >\ < (8b)2 > ) ’

Multipliserer vi nå (277) fra venstre med Q 1 (a. b) og fra høyre med Q 1, får vi m2(å.b) = Q-1(d.b)G(a/.b/)Q- ^d.b),

(278)

der Q x(å. b} er den inverse matrisen til Q(d. b) og Q '(d.b) er den inverse matrisen til Q(d.b). Det forutsettes at det (Q) ± 0. Eksplisitt kan (278) skrives [^2(å.b)].. = ^QieGnQtj = iG^.b^Q^å .b)Q^(å .b).

(279)

OT OT

der 2ia(d. b) er elementene til matrisen Q 1 (d.b) og i. j. o. T = 1.2. Vi har også benyttet (275) som gir at Gij(al.b') = Gji(a'.b'). Vi gjør ingen stor feil ved på høyre side i (278) eller (279) å erstatte a1 og b’ med de målte verdier å og b. Altså får vi m2(a.b)~Q ’(a.b)G(d.b)Q ’(d.b).

(280)

lm2(å.b)]ij ^Y,G^a.b)QlO(å.b)QjX(a.b).

(281)

eller eksplisitt OT

Ved hjelp av (280) og (281) kan spredningen av parametrene a og b approksimeres ved målte verdier alene.

108

Kapittel 15 Optimal metode for å estimere parametre Vi vil nå undersøke nærmere hvordan vi kan velge funksjonen F(a'',x) for å bestemme den målte verdi å. Valget av funksjonen F(az;x) må tilfredsstille (234), og den målte verdi å er gitt av (241). Spredningen av å fant vi, etter visse enkle antagelser, kunne skrives som (246). Hvis vi aksep­ terer disse approksimasjonene, vil vi nå anta at den beste funksjon F (a', x) for å bestemme den målte verdi å av a, er den funksjon som gir (6 = G2(a) / < /da

>2 = < F2 > / < /da

>2_ minimum i F.

(282)

(Om vi i (246) på høyre side erstatter a med å eller omvendt, begås dermed ingen stor feil.) For å løse (282) vet vi at betingelsen (234) må oppfylles. Dessuten ser vi at funksjonen CF(a;x), med C / 0 innsatt i (246) og bruk av (236), gir uforandret verdi av spredningen til å. For å unngå denne tvetydighet kan vi i tillegg til betingelsen (234) velge betingelsen dF(a;x) da

der M er en vilkårlig konstant forskjellig fra null. Av (234) får vi / F(a;x)p(a';x)dx = O. da'./ og herav 3F(a;x) "dF(a,x) r dF(a-,x) —z------ p(a',x) dx = — / F (a; x)—zr------dx. da .1 da da Minimumproblemet (282) kan etter dette formuleres slik:I I F2(a;x)p(a;x)dx = minimum.

(283)

der

I F(a’,x)p(a',x)dx = O (284)

og

dp(a;x) I F(a-,x) — - ----- dx = —M. da

109

Likningene (283) og (284) representerer et variasjonsproblem forutsatt at x-verdiene (de målte fysiske størrelser) er kontinuerlige variable. Hvis de målte verdier x har diskrete verdier, må vi erstatte integralene med summer, og (283) og (284) vil da representere et ordinært minimumproblem. Vi vil nå løse (283) og (284) for det diskrete tilfelle og notere at løsningen også gjelder for det kontinuerlige tilfelle forutsatt at funksjonene som er involvert, oppfører seg tilstrekkelig vel. For å understreke den diskrete karakter av problemet, vil vi skrive x^ (k = 1.2....) for punktene i område x. Vi kan skrive F(a;xJt) = Fk,

p(a;xk)=pk, dp(tz;xi) , Ba ~Pk'

(285)

°g

(286>

Med notasjonen (285) kan vi skrive

X^=1

YPk=°-

Minimumsbetingelsene (283) og (284) kan nå med notasjonen (285) skrives 0 = ^Fkpk = minimum

(287)

der ^FkPk = 0

(288)

og

Vi vil nå løse minimumproblemet ved å bruke metoden med Lagrangemultiplikatorer. Metoden gir at

lYFkPk + ^YFkPk + ^2^FkPk + ^] =0-

(289)

der oppgaven blir å finne verdiene av Lagrangemultiplikatorene Å] og X2 slik at verdiene av Fk fra (289) tilfredsstiller (287). Utfører vi derivasjonen på venstre side av (289) og ordner litt på leddene, får vi ^(2Fkpk 4-Xipk 4-^2Pk)Fk + ^Fkp'k + Xi ^Fkp'k + Å2^Fkpk = 0.

(290)

Skal venstre side av (290) bli null for alle måleverdier, må hvert summeledd være lik null. (288) gir da først at M =0. og

2Fkpk 4-Åipt + ^-2Pk — 0

for

k =1.2....

(291)

At Xi = 0 ser vi også ved å summere (291) over alle verdier av k og benytte (286) og (288). Multipliseres nå (291) med Fk og summeres over k, får vi ved hjelp av (286), (287) og (288)

29 - å2M = 0. 110

Vi kan altså fritt velge en verdi for X2 forskjellig fra null bare vi for M velger verdien Å/ = 20/X2.

(292)

X2 = -2,

(293)

Fk = Pk/Pk-

(294)

ø = -M = ^Pk/Pk-

(295)

Hvis vi nå spesielt velger

0 at

får vi av (291) for verdier av

(292), (293), (294) og (287) gir nå

(294) og (295) er altså løsningen på vårt minimumproblem. Går vi tilbake til vår opprinnelige notasjon i (285), kan vi skrive din p(a';x) (296) F(a';x) = da'

Den beste funksjon for å estimere verdien av en parameter a er den deriverte av logaritmen til sannsynlighetsfordelingsfunksjonene med hensyn på parameteren.1 Likning (296) er riktig bare for verdier av de målte størrelser x der p(a;x) f 0 (betingelsen for (294)). Punkter i område x der p(a;x) = 0 kan en imidlertid alltid neglisjere.

15.1

Spredningen av den optimale målte verdi

Av (296) følger at

d2lnp(a;x) da2

dF(a;x) da

(297)

og (296) i (236) gir

/dlnp(a;x) \ 2

da

\

(298)

/

Vi noterer videre at p.g.a. normaliseringen jp(a;x)dx = 1, så er

/■ d2p(a;x)

(299)

—x / p(a-,x)dx = 0. daz J

og videre har vi at

dlnp(a;x) da

1 dp(a;x) p(a;x) da

som derivert en gang til med hensyn på a og litt ordning av uttrykkene gir d2lnp(a;x)

—^2------ p(a-,x)dx

/ dp(a;x) \ da

=

d2p(a;x)

1 Dette resultat er selvfølgelig bare gyldig dersom minimumproblemet (287), (288) har en løsning.

111

som ved bruk av (299) til slutt gir d2lnp(a;x) da2

/'/dlnp(a;x)V . - / ----- -------J \ da J

, ( dinp(a;x) \ " p(a;x}dx = - < ----- - -----\ da J

(300)

Ved hjelp av (297), (298) og (300) kan vi nå få et eksplisitt uttrykk for spredningen av parame­ teren a gitt av (282)

(301)

I praktiske anvendelser kjenner vi ikke den eksakte verdi av a. For å få brukbare uttrykk må vi derfor erstatte a med å. Dette kan vi gjøre ved å anta at d2lnp(a;x) då2

d2lnp(a;x) da2

(302)

eller ved å sette (se (298), (300), (236) og (296)) d2lnp(a;x) da2

o f' (dinp(a;x)\ G2(a) = / I ---- —----- ) p(cr,x}dx. ./ \ da )

(303)

Approksimasjonene i (302) og (303) kan trygt brukes siden det å erstatte a med a er det samme som å neglisjere høyere ordens ledd av samme type som vi tidligere har neglisjert for å utlede (301).

15.2

Prinsippet om “maksimum sannsynlighet”

Vi har nå funnet den “beste” metode for å estimere verdien av en parameter a. Ifølge(241) og (296) får vi den beste verdien å av a fra betingelsen

_

dlnp(a';x) da'

.

.

Spredningen av å, når vi ser bort fra høyere ordens ledd, er gitt av (301). Hvis vi benytter approksimasjonene (302) eller (303), kan vi uttrykke < (8a)2 > ved hjelp av de målte verdier av x. Vi får da (305)

< (8å)2 >« 1/G2(d) eller

/

(3061

da1

Da < (8a)2 > er en positiv størrelse, ser vi at metoden bare er brukbar hvis den annen logaritmiske deriverte av p(a;x) er negativ. Hvis dette er tilfelle, kan (304) også skrives som

p(a';x) = maksimum i a' 112

for

a' = å.

(307)

Den beste målte verdi å av en parameter a er den verdi som gir sannsynlighetsfunksjonen p(a';x) sin maksimalverdi. Denne metode for å bestemme parameterverdien kalles maksimum-sannsynlighetsmetoden. Maksimum-sannsynlighetsbetingelsen (307) virker rimelig ut fra generelle vurderinger, men det er samtidig tilfredsstillende at betingelsen også, som vi nå har vist, kan stilles opp som et resultat av enkle fysiske betraktninger.

113

Kapittel 16 En anvendelse av maksimum-sannsynlighetsmetoden For å undersøke viktigheten av approksimasjonene som ble introdusert for å komme frem til (305) eller(306), vil vi nå betrakte et spesielt tilfelle der p(a;x) tilfredsstiller en Gaussfordeling, altså p(a;x) = -7L=e-{x-a}2^2a\ (308)

V2no2 der o antas kjent. Vi har nå bare én variabel fysisk størrelse. Av (296) og (308) følger

, dlnp(n';x) x-a' F(a-,x)3a, .

(309)

Av (236), (308) og (309) følger

G2(a) = / (x — a')2p(a'-,x)dx/G4 — l/o2.

der siste likhetstegn følger ved å innføre ny variabel

(310)

= u og bruk av

2 / \/ue “du — VK Jo Bruk av (304) sammen med (309) gir

å = x.

og bruk av (305) med (310) eller (306) med (309) gir < (8d)2 > = O2.

F{a'\x) er lineær i a' og G(a') er uavhengig av a'. Av (308) og (309) ser vi at fordelingen av F(a;x) er gitt ved

(311) v2n Vi ser av (309), (310) og (311) at de forutsetninger som vi i kapittel 15 “Optimal metode for å estimere parametre” antok skulle holde tilnærmet, er eksakt oppfylt i det tilfelle der p(a;x) er Gaussfordelt som (308). F(a;x) vil også selv være Gaussfordelt. p(a;F) =

114

16.1

Det beste valg av funksjonene ¥(a.tr,x.y)

Vi vil nå som i kapittel 15 undersøke om det er mulig å finne det beste valg av funksjonene F. Kan det tenkes at området for a' og b' slik det er definert av (266) kan minimaliseres ved passende valg av funksjonene Fj og F2? Området for a' og b' definert av (266) framkom etter tilfredsstillelse av visse betingelser for alle lineære kombinasjoner av F\ og F?. Herav følger at nye lineære kombinasjoner

F-(a ,b'-,x.y) = ^SijFj(a .b'-,x,y) j

(j,j = 1.2),

(312)

der Sjj er koeffisienter slik at detS

0.

også vil lede til det område som de orginale funksjonene F\ og F2 ga, nemlig (266). Spesielt ser vi at når vi sammenlikner (267) og (312) vil systemet av likninger

F-(a'.b';x.y) = 0

for a’ — å og b’ = b.

lede til de samme målte verdier av å og b som det opprinnelige system (267). På grunn av denne mangel på entydig valg av funksjonene F\ og Fi vil vi pålegge funksjo­ nene Fi og F2 22 betingelser1 slik at vi får én spesiell lineær kombinasjon. Vi skal senere se at det er fruktbart med betingelser av formen

r i dFi(a'.b';x.y) , , / / ----------------- p(a .b ;x.y)dxdy = Qia., ./ Js oa

(313) /' /’ dFi(a'.b'-,x.y) , r / / ------- sr;------- P(a b;x.y)dxdy = Qib, J Js db' der i = 1.2 (se også (272)) og Qia og Qib er elementer i matrisen Q(a.b). Elementene Qia og Qih er tall bestemt av de sanne verdier av a og b, men som for (272) forutsetter vi at

og

detQ / 0.

Det følger av (267) at verdiene a' = å og b1 = b ligger godt innen området definert av (266). Vi vil nå undersøke hvilke valg av funksjonene Fi og F2 vi har samtidig med at betingelsen (266) er tilfredsstilt for verdiene a\ og b\ slik at

a\ = a

Åa.

og

(314)

b\ = b - Ab.

Vi vil altså undersøke hvordan funksjonene Fi og F2 oppfører seg i nærheten av de målte verdier å og b. Betrakt nå forskjellige funksjoner F(a'.F;x.y) som tilfredsstiller betingelsene (247) og (313). For hvert valg av F kan vi bestemme verdien av venstre side til (266) for verdiene a' = a\ og b' = bi og dermed bestemme numerisk verdien til

6(F;ai.bi) = ^G^ai-b^F^ai.b^x.y^Fj^.b^x.y) ij

(315)

1 Hvorfor skrivemåte 22? Forklaringen er at vi har 2 parametre a og b. Har vi generelt 5 parametre, vil vi pålegge komponentene F s2 betingelser.

115

for faste verdier a\ og b\ for forskjellige valg av F. Neste steg er nå å bestemme de funksjoner F der 0(F;ai.Z?i)= maksimum for faste verdier av Au og Ab.

Vi utvikler nå F^a'.b'-,x.y) i Taylorrekke omkring å og b, og setter Au = a' Sb = b' — b. Ved bruk av (267) får vi da ' iJ a a 3b](u.b;x.y) dF^å.b^x.y) Fi(a ,b ;x.y) — Sa------ ----------- 1-Ab——r=-------- 1- ledd av høyere orden. da db

(316) å og

(317)

Videre får vi av (313) at dFi(å.b-,x.y) ---- ----------- = < db da >

< da db > \ - (8fc)2 > J

1

/ G22

|G| \ -G21

-G12 \ G11 /

.

d2 lnp( d.bjcy)

/

% — G I

d2 In pl d. bye y) ddb

hvor vi har benyttet at for inverse matriser gjelder at ,

cofGh

= IgT’

der cof Gj, er kofaktor til elementet Gjt. 120

d2 In pi d bjc.y} ddb ^Inpld.bvc yl dd2

(348)

Kapittel 17 Eksempler fra evaluering av tellereksperiment Innen forskjellige områder av fysikken, og spesielt innen atomfysikk, er tellereksperiment av stor betydning. Vi skal nå belyse betraktninger foran med noen spesielle eksempler fra evalue­ ring av målinger som involverer tellere. Det enkleste eksempel som involverer tellere, er bestemmelser av stråleintensitet. Vi betrakter en teller som utsettes for stråling med konstant intensitet. I løpet av en tid t registrerer vi n tellingen Vi antar at fordelingen av tellingene tilfredsstiller en Poissonfordeling slik at den målte verdi Å for intensiteten A er gitt ved A = n/t.

(349)

a2 =< (5^)2 > = A/t.

(350)

og spredningen av A ved Vi får derfor at standardavviket kan approksimeres ved hjelp av målte verdier

(351) Hvis nå n 1 vil Poissonfordelingene og Gaussfordelingene i praksis være like, og som vi lærte i kapittel 6.3 er vi nesten sikker på at den sanne verdien av intensiteten A ikke avviker fra den målte verdi med mer enn 3 eller 4 standardavvik, altså at

A- ota < A A2. Hvis vi innfører notasjonen

Ai-A2 = b.

(355)

b =--------- . 0 t2

(356)

får vi den målte verdi, b, som

Hvis «1.J12 » 1, vil vi analogt med (350) få spredningen

gitt ved (se (135))

aj =< (8Åi)2 > + < (5A2)2 > = A\/t\ +A2/t2.

(357)

O/, kan analogt med (351) uttrykkes ved målte verdier, og ved hjelp av (354) får vi

(?£, ~ (Jf, —

^1 + Å2

(358)

t2

h

Analogt med (352) kan vi estimere b ved ulikheten

b - aCb < b < b+ aah.

(359)

Hvis nedre grense av estimatet (359) er positiv, dvs. hvis b > aob.

kan vi konkludere at b > 0 og det betyr at intensitetene faktisk er forskjellige.

17.2

Måling av store differenser mellom to intensiteter

Hvis differansen gitt av (355) er stor, vil det være nyttig å bruke forskjellige måletider for de to intensiteter (354). Hvis vi har en bestemt total måletid t til rådighet for å måle b, er den beste deling av tiden den som gir cb et minimum. Det betyr at de deriverte av G^ med hensyn på 0 og t2 begge må være null. Minimum av (357) med betingelsen t\ + t2 = t gir løsningen 0 : t2 = x/A\ '■ VA 2-

(360)

Vi får altså som resultat at når differansen A \ — A2 skal bestemmes, vil vi få det beste resultat når den største intensitet A] måles over lengre tid enn den minste intensitet A2. Tidene bør velges proporsjonale med kvadratroten av intensitetene. Av (357) og (360) følger det at det minste standardavviket vi kan få blir G/, = (VAi + v A2)/\/t\.

hvis tiden som er til disposisjon deles ifølge (360) på den mest økonomiske måten. 122

(361)

17.3

Den praktiske fremgangsmåte ved måling av differan­ sen mellom to intensiteter

For å dele den disponible tid til målingene ifølge (360), må vi i det minste ha en tilnærmet kjennskap til intensitetene. Hvis vi ikke på forhånd har kjennskap til hvilke intensiteter vi venter å finne, kan vi utføre noen foreløpige målinger ved å bruke relativt korte måletider. Disse foreløpige data gir oss tilnærmete verdier av A ] og Ai slik at den beste deling av tiden tilnærmet kan estimeres ifølge (360). Da