154 18 121MB
Norwegian Pages 292 Year 2000
JOSTEIN LILLESTØL
Statistiske metoder i revisjon 3. utgave
CAPPELEN AKADEMISK FORLAG
© J.W.Cappelens Forlag as, Oslo 2000 Det må ikke kopieres fra denne bok i strid med åndsverkloven eller avtaler om kopiering inngått med KOPINOR, Interesseorgan for rettighetshavere til åndsverk. Kopiering i strid med lov eller avtale medfører erstatningsansvar og inndragning, og kan straffes med bøter eller fengsel. ISBN 82-02-19910-7 3. utgave 2000
Omslag: Reidar Gjørven Trykking: Valdres Trykkeri Innbinding: Gjøvik Bokbinderi
Forord Statistiske metoder i revisjon dreier seg i hovedsak om: • Utvalgsbaserte metoder for systemtesting, substanstesting og estimering, bl.a. i forbindelse med verdivurdering.
• Analytiske metoder for avviksanalyse og prioritering av ressurser • Risikovurdering Denne boken tar opp teori og metode på disse områdene. I de senere år har analytiske metoder kommet mer i forgrunnen i revisjonspraksis, dels på bekostning av utvalgsmetoder basert på statistisk teori. Den nye utgaven av boken reflekterer dette ved at analytiske metoder er viet større plass. De fleste av metodene i boken har sitt utgangspunkt i generell statistisk teori og har anvendelse på andre områder enn revisjon. Problemstillingene, rammevilkårene og ønskemålene innen revisjon er imidlertid særegne, og en kan vanskelig støtte seg til generell statistisk litteratur alene ved anvendelser på dette felt. På den annen side vil en oppskriftsmessig beskrivelse av ”slik gjør vi det hos XX” heller ikke være nok. Derfor denne bok.
Boken er delt i to deler: Del I bestånde av kapitlene 1 til 6 er en elementær innføring i de nevnte tema, der framstillingen tar utgangspunkt i den eksterne revisors situasjon. Denne delen er nesten formelfri. Isteden brukes eksempler for å illustrere sentrale statistiske ideer. Del I bør derfor kunne leses med utbytte uten spesielle forkunnskaper i statistisk teori. Del II bestående av kapitlene 7 til 13 er mer ambisiøs. Her bygges teorien opp trinnvis forankret i statistiske modeller. Her finner vi begrunnelsene for metodene i del I. Imidlertid er del II mer prinsipiell, og gir det nødvndige grunnlag for å kunne tilegne seg og vurdere alternative metoder. Fagfeltet
iii
er i fortsatt utvikling, og med del II som bakgrunn har en bedre mulighet for å forstå og/eller delta i denne utviklingen. Del II er avgjort langt mer krevende enn del I, men forutsetter heller ikke omfattende forkunnskaper i statistikk, i og med at Kapittel 7 og 8 faktisk er en innføring i sannsynlighetsregning og stokastiske modeller i en revisjonskontekst. De etterfølgende kapitlene i del II har et perspektiv som er videre enn den eksterne revisors situasjon og omfatter flere emner. Dette er tredje utgave av boken, og det er kommet til en god del nytt stoff. I Kapittel 11 om analytiske metoder er det meste nytt. Her fins bl.a. multivariate dataintensive metoder som kan bidra til å avsløre mislighold. Vi kunne ønske å tatt med flere metoder relatert til moderne IT-teknologi. Vi omtaler riktignok en del data mining metoder, men mangfoldet av slike (til dels konkurrerende) metoder er i dag stort og sprenger rammen for denne boken. Boken inneholder et omfattende oppgavetilfang. I del I er det to sett av quiz-oppgaver i Kapittel 7. Del II har oppgaver integrert i teksten. Oppgaver gitt ved eksamen i Høyere Revisorstudium er samlet i Kapittel 13. Flere av disse oppgavene er hentet fra praksis, og jeg takker giverne for verdifulle bidrag. Mestedelen av det som skrives om statistiske metoder i revisjon er utviklet i amerikanske fagmiljøer og i noen grad preget av store amerikanske forhold. Jeg er interessert i kontakt med brukere av stoffet i denne boken, med sikte på forbedringer som bedre reflekterer norsk praksis og norske behov.
Bergen 27. oktober 2000 Jostein Lillestøl
V
I
INNFØRING - med vekt på eksternrevisjon
1
Statistisk perspektiv 1.1 Innledning..................................................................................... 1.2 Målsettinger og utfordringer....................................................... 1.3 Prosesser og variasjon............................................................... 1.4 Populasjoner : attributter og variable....................................... 1.5 Utvalgsbaserte metoder............................................................ 1.6 Usikkerhetsvurderinger............................................................... 1.7 Analytiske metoder.....................................................................
3 3 5 7 11 15 18 24
2 Systemrevisjon 2.1 Målsetting..................................................................................... 2.2 Utvalgsenheter og populasjon.................................................... 2.3 Utvalgsmetoden............................................................................ 2.4 Stikkprøvestørrelsen.................................................................. 2.5 Analyse av stikkprøven............................................................... 2.6 Konklusjoner og konsekvenser.................................................... 2.7 Kritiske merknader.....................................................................
27 27 28 30 32 37 39 40
3 Detalj revisjon 3.1 Målsetting..................................................................................... 3.2 Utvalgsenheter og populasjon.................................................... 3.3 Utvalgsmetoden............................................................................ 3.4 Stikkprøvestørrelsen .................................................................. 3.5 Analyse av stikkprøven............................................................... 3.6 Konklusjoner og konsekvenser.................................................... 3.7 Verdibasert systemrevisjon......................................................... 3.8 Kritiske merknader.....................................................................
43 43 44 46 50 52 57 59 62
4 Estimering og avviksanalyse 4.1 Verdivurdering............................................................................ 4.2 Avviksanalyse............................................................................... 4.3 Avvik fra forventning ............................................................... 4.4 Avvik fra lineær regresjon.........................................................
65 65 69 72 78
Sammenfattende vurderinger 5.1 Risikofordelingsmodeller............................................................ 5.2 Risikofastsetting ......................................................................... 5.3 Aposteriori risiko.........................................................................
87 87 90 92
5
1
vi 6 Oppgaver 6.1 Quiz 1........................................................................................... 6.2 Quiz 2...........................................................................................
II SPESIELLE EMNER OG FORDYPNING
95 95 98
101
7 Sannsynligheter og revisjon
7.1 7.2
7.3
103 Sannsynlighetsregning : Regneregler.......................................... 103 Tilfeldige variable og fordelinger ................................................ 113 7.2.1 Begreper ............................................................................113 7.2.2 Binomisk fordeling............................................................. 115 7.2.3 Poisson-fordeling................................................................ 116 7.2.4 Normalfordeling................................................................ 118 Systemrevisjon: Kontrolldiagrammer.......................................... 122
8 Utvalgsmodeller og revisjon 125 8.1 Tilfeldige utvalg ............................................................................125 8.2 Attributt-sampling : Hypergeometrisk modell........................... 130 8.3 Discovery-sampling........................................................................ 133 8.4 Variabel-sampling : Lotterimodellen.......................................... 136 9 Inferensteori og revisjon 141 9.1 Innledning........................................................................................ 141 9.2 Attributter: Estimering og konfidensutsagn .............................. 142 9.3 Variable : Estimering og konfidensutsagn.....................................155 9.3.1 Direkte-metoden................................................................ 155 9.3.2 Differens- og forholdsmetoden.......................................... 160 9.4 Variabel-sampling: Beslutninger.................................................. 170 9.5 Kommentarer om sikkerhet.......................................................... 185 9.6 Kommentarer om vesentlighet....................................................... 188 9.7 Kommentarer om revisorskjønn.................................................... 191 10 Spesielle utvalgsmetoder i revisjon 193 10.1 PPS-sampling og stratifisering...................................................... 193 10.2 Pengeenhetsstikkprøver................................................................ 197
11 Analytiske metoder 213 11.1 Flervariabel regresjon .................................................................. 213 11.2 Avviksvurderinger ved negativmetode ...................................... 219 11.3 Logistisk regresjon........................................................................ 221
vii 11.4 11.5 11.6 11.7
Prinsipalkomponentanalyse ......................................................... 224 Klassifikasjon: Diskriminantanalyse............................................. 227 Statistisk tre ................................................................................. 230 Regnskapsmanipulering: Benfordslov............................................233
12 Bayesianske metoder i revisjon 237 12.1 Grunnleggende idéer..................................................................... 237 13 Eksamensoppgaver HRS 13.1 Sannsynligheter - 1994 ................................................................ 13.2 Sannsynligheter - 1991 ................................................................ 13.3 Stikkprøver - 1986 ...................................................................... 13.4 Utvalgsmetoder - 1995 ................................................................ 13.5 Stikkprøver - 1997 ...................................................................... 13.6 Analytisk revisjon - 1996 ............................................................. 13.7 Analytisk revisjon - 1987 ............................................................. 13.8 Analytisk revisjon - 1993 ............................................................. 13.9 Analytisk revisjon - 1998 .............................................................
245 245 246 247 251 251 253 254 258 264
Litteraturliste
269
Tabeller
271
Stikkordregister
283
Del I
INNFØRING med vekt på ekstern revisjon
Kapittel 1
Statistisk perspektiv 1.1
Innledning
Statistiske metoder i revisjon omfatter i hovedsak: • Utvalgsbaserte metoder for - systemtesting, - substanskontroll,
- verdivurdering. • Analytiske metoder for å - bekrefte eller støtte, - avsløre eller veilede,
- søke. • Risikovurderingsmetoder
Slike metoder er aktuelle i de fleste typer revisjon: intern, ekstern eller offent lig revisjon, om enn i ulik grad. Utvalgsbaserte metoder er aktuelt ved revisors testing for å få bekreftet at foretakets ulike prosesser og systemer fungerer sin hensikt. Dette gjelder både ved intern og ekstern revisjon. Videre er utvalgsbaserte metoder aktuelt ved den eksterne revisors substanskontroll i forbindelse med årsoppgjøret (RS530) . Endelig er utvalgsbaserte metoder aktuelt ved estimering av verdier, f.eks. i forbindelse med overtakelser (RS540). 'Med referanse til Standarder for revisjon og beslektede tjenester.
3
4
KAPITTEL 1 : Statistisk perspektiv
Når det gjelder analytiske metoder, kan det dreie seg om å få bekreftet at sammenhengen mellom ulike økonomiske og ikke-økonomiske variable er rimelige (RS520). Slike metoder er aktuelt både ved analyser av hele popu lasjoner og analyser av stikkprøver fra populasjoner. Det kan også være at en ønsker metoder for å avsløre avvik, som i noen tilfeller kan være bedrag. Avsløring av bedrag (” fraud detection”) var tidligere ikke primært en opp gave for den eksterne revisor, men i dag forventes det som en integrert del av et revisjonsprogram (RS240). For både utvalgsbaserte meioder og analytiske metoder gjelder at de kan være støttende mht. å komme frem til en samlet konklusjon eller veiledende mht. å kunne prioritere det videre revisjonsarbeid. Dagens databasesystemer og dagens regneteknologi har muliggjort ana lyser av store tallmaterialer. Det kan være alle transaksjoner eller registrerin ger av en viss type, enten alle som er grunnlaget for et regnskap eller konti nuerlig overvåking av en aktivitet, ofte kalt "activity monitoring”. Endelig kan statistiske metoder komme til nytte i forbindelse med søken etter nyttig kunnskap i klientens database. Ved slutten av 1990-tallet ble 'data mining” markedsført som nytt begrep, med tilbud om en rekke analysemetoder som også revisor kan dra nytte av. Med dagens regnekraft er det fristende å analysere alle tilgjengelige og relevante data, men i mange situasjoner vil en kunne trekke de nødvendige konklusjoner med en stor nok stikkprøve. Dette medfører at en raskere kan stille nye spørsmål som kan styre jakten på spesielle ting i databasen. Risikoanalyse, det siste området som er trukket frem ovenfor, omfatter usikker hetsvurderinger av ulikt slag. Det kan være knyttet til risikoen for forekomst av feil hos klienten eller revisor i helhet, eller deler av oppdraget. Det kan også dreie seg om vurdering av foretakets evne til fortsatt drift (RS570). Her vil en kunne dra nytte av ferdigheter i sannsynlighetsregning. Denne boken tar opp statistisk teori og metode på de tre hovedområdene nevnt ovenfor. De fleste metodene er ålmenne, og har anvendelser også på an dre områder. Konteksten i revisjon er imidlertid spesiell, med målsetninger og betraktningsmåter som rettferdiggjør en egen fremstilling tilpasset dette formålet. For det første viser det seg at en del tradisjonelle statistiske metoder ikke fungerer spesielt godt, det gjelder f.eks. slike som bygger på normalfordelingsteori. For det andre vil revisor ofte knytte en forestilling om en maksi mal tolererbar feil til sitt revisjonsproblem, dvs. vesentlighet (RS320). Dette vil være avgjørende for hvordan revisor stiller seg til utfallet av stikkprøven, og griper også inn i selve planleggingen av denne. For det tredje har vi den eksterne revisors spesielle rolle i forbindelse med bekreftelse av klienters regnskapstall, som innebærer et noe annet perspektiv enn det en møter i
1.2 Målsettinger og utfordringer
5
andre fag der stikkprøver anvendes. Vi har i Del I: Elementær innføring valgt en vinkling på stoffet som tilgodeser den eksterne revisor, mens fremstillingen i Del II: Spesiell emner og fordypning har et videre perpektiv. I de ettterfølgende avsnitt i dette Kapit tel 1:1 gis et utsyn over skjæringsfeltet statistikk og revisjon med spesiell vekt på de eksterne revisors oppgaver. Vi vil ofte avgrense problemstillingene for å få fram de mer prinsipielle sider ved de ulike temaer. I Kapittel 1:2 og 1:3 lar vi rammen for diskusjonen være henholdsvis systemrevisjon og detaljrevisjon, men vi finner igjen tilsvarende problemstillinger også i andre typer revisjon enn den eksterne. Forhold som knytter seg til avveininger mellom ulike deler av et revisjonsprogram, er et vanskelig spørsmål som vi vil diskutere separat i Kapittel 1:4.
1.2
Målsettinger og utfordringer
En ekstern revisor skal utføre et arbeidsprogram med sikte på å kunne avgi en revisjonsberetning som bekrefter den økonomiske informasjon klienten gir i sitt årsregnskap. En mulig målsetting for dette arbeidet er:
Den eksterne revisor må skaffe seg relevant, pålitelig og tilstrekke lig dokumentasjon, slik at han/hun med akseptabel presisjon og sikkerhet kan uttale seg om klientens interne kontroll, selve års oppgjøret og andre sider ved virksomheten av betydning for brukere av klientens økonomiske informasjon.
I praksis setter tilgjengelighet, tid og kostnader en grense for arten og om fanget av den dokumentasjon revisor velger å legge til grunn for sin sam menfattende konklusjon. Når revisor skal sette sammen ulike typer revisjonshandlinger til et revisjonsprogram, vil han måtte avveie disse faktorene mot de tre faktorene i målsettingen ovenfor: relevans, pålitelighet og tilstrekkelighet. En nærmere presisering av disse termene er gitt i annen revisjonslitteratur, og vi skal ikke gå i detalj her. I målsettingen ovenfor er nevnt to andre begreper: presisjon og sikkerhet. De har med henholdsvis vesentlighet og risiko for feilkonklusjoner å gjøre. Presisjon er for en ekstern revisor et spørsmål om hvor nøyaktig en tar sikte på å være i de konklusjoner som underbygger revisjonsberetningen. I denne forbindelse må revisor ta stilling til hvor store unøyaktigheter eller feil som kan tolereres, uten at det får konsekvenser for beretningen. Dette gjelder både avvik fra de interne kontrollrutiner og konkrete beløpsmessige feil. En grense for når et avvik ikke kan tolereres, kalles gjerne en vesentlighetsgrense.
6
KAPITTEL 1 : Statistisk perspektiv
Jo romsligere grense, desto mindre presis kan revisor tillate seg å være på dette punkt, uten at det bør få konsekvenser. Revisor må forsøke å sette vesentlighetsgrenser for de enkelte deler av revi sjonsprogrammet, der per spektivet er revisjonsprogrammet som helhet. Dette er ingen lett oppgave, både fordi vesentlighet kan være nokså flytende, og det kan være uklart hvordan en total vesentlighet skal stykkes opp på de enkelte delkontroller. Til de konklusjoner som underbygger revisjonsberetningen, vil revisor også knytte et krav om sikkerhet. Revisor må vurdere egenskapene ved sine kontrollformer, og hvordan de leder fram til konklusjonene. Dersom feil forekommer, må kontrollformene ha akseptabelt lav risiko for feilkonklusjoner, slik at en i siste instans unngår å avgi en positiv beretning der dette var uberettiget. Akseptabel risiko kan også være noe flytende, og det kan være vanskelig å stykke opp total akseptabel risiko på de enkelte delkontroller som skal underbygge revisjonsberetningen. Det er klart at en ekstern revisor kun har interesse av å holde kontroll med risikoen for vesentlige feilkonklusjoner. De to begrepene presisjon og sikkerhet er derfor nært knyttet til hverandre. Det er vanskelig å gi fullt ut dekkende allmenne og operasjonelle definisjoner av de to begrepene, men vi skal se at det i forbindelse med stikkprøveproblematikk er mulig å etablere naturlige definisjoner, som kan tjene som holdepunkter ved bestemmelse av nødvendig stikkprøveomfang. I ekstern revisjon er det vanlig å skille mellom såkalt systemrevisjon ("compliance tests”) og substansrevisjon (”substantive tests”). Vi går ut fra at revisor gjennomgår og vurderer klientens interne kontrollsystemer og at disse er tilfredsstillende på papiret. Med systemrevisjon menes en un dersøkelse om i hvilken grad klienten i praksis gjennomfører de oppsatte kon trollrutinene. Med substansrevisjon menes konkrete regnskapsverifikasjoner som skal danne grunnlag for revisors oppfatning av regnskapenes formelle og beløpsmessige riktighet. Dette vil bl.a. omfatte transaksjoner, eiendeler og forpliktelser (gjeld). Revisor ønsker å vite om registrerte transaksjoner er reelle, om reelle transaksjoner er registrert, om transaksjonene er kor rekt verdsatt (beløp) og korrrekt klassifisert (konto). Videre ønsker revisor kunnskap om eksistens og fullstendighet, samt korrekt tilhørighet og verd setting av eiendeler og forpliktelser. Dette kan skje enten ved detalj revisjon eller ved analytiske metoder. Det perspektiv som kommer til uttrykk ovenfor er det vi finner i tradi sjonell revisjon, der en ser på klienten gjennom regnskapsanalytiske briller, og først og fremst retter oppmerksomheten mot konti, transaksjoner og andre regnskapsorienterte objekter. Dette kan være hemmende for den overordnede forståelse av klientens virksomhet og de utsagn som kommer til uttrykk i
1.3 Prosessr og variasjon
7
dennes rapporter. Avstanden til de verdiskapende aktiviteter som er grunn laget for foretakets eksistens og fortsatte suksess kan i mange tilfeller bli stor, spesielt innen virksomheter i rask endring. I de senere år har revi sorer i stigende grad begynt å betrakte klienten gjennom systemanalytiske briller, dvs. at oppmerksomheten rettes mot foretakets målsettinger og stra tegi, dets organisering av verdikjeden, internt og eksternt i forhold til kunder, leverandører, eiere og det offentlige. I denne sammenheng vurderes foretakets styrke og svakheter, eventuelle trusler og foretakets evne til å møte disse. De to typer briller supplerer hverandre, men revisjonbransjen har de senere år erkjent viktigheten av å også bruke systemanalytiske briller, og at dette er en forutsetning for planlegging av den regnskapsorienterte revisjonen med sikte på et kostnadseffektivt engasjement. Dette innebærer at revisor må de finere kjerneprosessene i organisasjonen, og kunne forstå hvordan de virker. Revisor vil typisk være interessert i avvik fra forventninger knyttet til kjerne prosessene. I mange engasjementer er det aktuelt med tradisjonell revisjon bare der slike avvik avdekkes. Revisor må derfor kunne måle og analysere nøkkeltall som karakteriserer kjerneprosessene, ikke bare enkeltvis, men også relasjoner mellom slike tall. Denne tilnærming faller sammen med bærende idéer for total kvalitetsledelse, se Lillestøl (1994). Denne boken tar for seg statistiske metoder som kan anvendes ikke bare i tradisjonell revisjon, men ogå i en slik videre kontekst.
1.3
Prosesser og variasjon
Det naturlig å innføre et begrepsmessig skille mellom prosess og populasjon. Dette er illustrert i Figur 1.1, der en prosess i flere trinn kontinuerlig pro duserer resultater. Eksempel på dette kan være bestillinger frem til det blir registrert i en database. Alle registreringer i løpet av en gitt tidsperiode, f.eks. et år, utgjør da en populasjon. I figuren illustreres også muligheten
Prosess
Resultat Populasjon
Stikkprøve
Figur 1.1: Prosess og resultat
Stikkprøve
KAPITTEL 1 : Statistisk perspektiv
8
for stikkprøver på ulike trinn i prosessen og stikkprøver fra populasjonen. Statistiske metoder i revisjon er nettopp tilrettelagt for - studier av ” prosesser” og - studier av endelige populasjoner.
Ved stikkprøve fra en prosess ønsker en å trekke konklusjoner om denne: fungerer den etter hensikten eller gjør den det ikke? Svaret har bl.a. kon sekvenser for revisors prioritering av sitt videre arbeid, f.eks. omfanget av detalj revisjon knyttet til resultatet fra prosesssen. Ved stikkprøve fra en populasjon som er et resultat av en prosess (f.eks. en bilagsbunke eller alle registreringer av en viss type for en gitt periode), ønsker en å trekke konklusjoner om den foreliggende populasjonen.
Studier av prosesser er aktuelt i - ekstern systemrevisjon, - intern systemrevisjon og avviksbehandling,
- kvalitetsforbedringsarbeid. Studier av endelige populasjoner er aktuelt i - detalj revisjon (ekstern)
- verdivurdering (f.eks lager), - partikvalitetskontroll (internt ved mottak og levering). Vi vil først ta for oss noen grunnleggende idéer knyttet til prosesser, mens populasjoner er tema for de etterfølgende avsnitt. Det er en nyttig erkjennelse at alt varierer, mer enn de fleste tror. Betrakt derfor en prosess som kan observeres regelmessig over tid i form av en prosessindikator eller nøkkeltall, som kan representere et attributt (f.eks. antall feil i en gitt periode) eller en numerisk målevariabel (f.eks. materialforbruk). Det er nyttig å skille mellom to typer variasjon
• iboende variasjon • spesiell variasjon
1.3 Prosessr og variasjon
9
En revisor vil som regel ønske å reagere på spesiell variasjon. Det er der for viktig å kjenne prosessens iboende variasjon, slik at en ikke feiltolker variasjonen og kaster bort tiden med å reagere på tilfeldigheter. Et mulig hjelpemiddel ved prosessanalyse for å klarlegge variasjonen er såkalte kontrolldiagrammer. I et kontrolldiagram plottes gjentatte obser vasjoner av prosessindikatoren i sin naturlige tidsrekkefølge, med statistisk beregnede øvre og nedre kontrollgrenser inntegnet på hver side av et bereg net prosessgjennomsnitt. Grensene er beregnet ut fra observasjonene under forutsetning av fravær av spesiell variasjon, og skal derfor utrykke prosessens iboende variasjon. Da sier vi at at prosessen er ”i statistisk kontroll”. En slik situasjon er illustrert i Figur 1.2. Kontrolldiagram: Forbruk
Figur 1.2: Kontrolldiagram uten spesiell variasjon Observasjoner utenfor kontrollgrensene og spesielle mønstre innenfor gren sene signaliserer variasjon av spesielle årsaker, som det kanskje er verdt å søke en forklaring på (ofte kalt "assignable cause”). Spesielle mønstre innen grensene som har interesse er bl.a. nivåskift, trend, økende variasjon. I Figur 1.3 er illustrert to situasjoner: en enkelt avviker og nivåskift. På den annen side bør variasjon innen kontrollgrensene uten spesielle mønstre ikke gi opphav til noen reaksjon. Det betyr ikke nødvendigvis at variasjonen ikke har en spesiell årsak. Poenget er at den er umulig å skille fra den iboende tilfeldige variasjon (”unassignable cause”), og at det er bortkastet tid å søke en forklaring på denne. Den vanligste måte å lage kontrollgrenser på, er ved den såkalte standardavviksmetoden, hvor en legger kontrollgrensene i avstand k x anslått standardavvik fra det beregnede gjennomsnittet. Anvendt i daglig drift er det vanlig å bruke k=3. Dette gir en risiko på mindre enn 0.5% for å klassi fisere en enkelt observasjon innenfor systemet som avviker. Dette er basert på at vurdering av risiko skjer ut fra normalfordelingen, noe som tilnærmet
10
KAPITTEL 1 : Statistisk perspektiv
Kontrolldiagram: Forbruk
Figur 1.3: To kontrolldiagrammer med spesiell variasjon
gjelder for de fleste aktuelle diagrammer. I revisjonssammenheng kan det være aktuelt å bruke k=2, som svarer til en risiko på ca. 5%. For detaljer om konstruksjon av de ulike typer kontrolldiagrammer se Wheeler (1993). Kontrolldiagrammer kan lages for nesten alle slags data observert over tid, og vi har to hovedtyper kontrolldiagrammer: • for målevariable (kontinuerlige varable) • for attributter (diskrete variable) Typiske situasjoner der målevariable brukes som prosessindikator er:
- fysiske størrelser (lengde, volum, vekt, temperatur osv.) i produksjon, - ressursforbruk (materialer, strøm osv.) i produksjon og service, - produktivitetsmål i produksjon og administrasjon, - økonomiske mål i salg og administrasjon. Attributter kan typisk studeres i forbindelse med
1.4 Populasjoner : attributter og variable
11
- defekter og feiltyper for artikler i produksjon, - gjentak, reparasjon og reklamasjon i produksjon/service,
- avvik og merarbeid i administrative rutiner. Kontrolldiagrammer brukes til
• prosessanalyse (hvordan er variasjonen?) • prosesskontroll (finne og fjerne avvik) • prosessforbedring (redusere variasjon) En revisor vil ofte tolke nye data i lys av tidligere data om det samme, og bite seg merke i forskjeller. Det er bra, men rammen for studier av forskjeller og variasjon noe snever for en del av de metoder som er i bruk idag. Et godt eksempel er når en revisor kun tar forrige års tall som grunnlag for å vurdere årets tall, et eksempel vi kommer tilbake til i Kapittel 1:5. Bruk av kontrolldiagrammer forutsetter i utgangspunktet stabil situa sjon, og en vurderer avvik i lys dette. I mange sammenhenger har det skjedd endringer i system, foretak eller marked som gjør at data fra to perioder ikke er direkte sammenlignbare. Det kan være endringer i aktivitetsnivå og volum eller trender i markedet. En mulighet er å forsøke å korrigere for dette, slik at tallene blir sammenlignbare. Da er det mulig å lage kontrolldiagrammer, der en plotter avvik fra (estimerte) forventninger. I mange sammenhenger er det ikke mulig å skaffe nok observasjoner til at en kan få inntrykk av variasjonsmønstret eller beregne kontrollgrenser. Vi skal se nærmere på avviksanalyse med få data i Kapittel 1:5.
1.4
Populasjoner : attributter og variable
En samling av ensartede enheter som er i revisors søkelys, vil vi kalle en revisjonspopulasjon, og enhetene selv kaller vi revisjons enheter. Eksempler på revisjonspopulasjoner er
- en bunke bilag, - postene i et regnskap,
- postene i en lageroversikt,
- alle transaksjoner av en viss type i et gitt tidsrom.
12
KAPITTEL 1 : Statistisk perspektiv
En variabel er egenskap som kan variere fra enhet til enhet i revisjons pop ulasjonen. Det kan være kategorivariable og/eller numeriske variable. I det første eksemplet vil hvorvidt bilaget er attestert eller ei være en kategori variabel, mens bilagets pålydende vil være en numerisk variabel. I det andre eksemplet vil hvorvidt posten er feilansatt eller ei (eventuelt innenfor visse toleranser) være et kategorivariabel, mens verdien av posten er en numerisk variabel. I det tredje eksemplet vil stock-out eller ikke på posten (varen) være en kategorivariabel, mens antall enheter av varen er en numerisk vari abel. Likeledes er verdien av posten en numerisk variabel. I noen tilfeller er det aktuelt å studere avviket fra bokført verdi som en numerisk variabel. En kategorivariabel henfører hver revisjonsenhet til en av to eller flere mulige kategorier. Kategorienes antall og beskrivelse vil kunne velges etter omstendighetene. For variablen ” feiltype” kan vi tenke oss tre kategorier: betydelig feil (som krever påtale) - ubetydelig feil - feilfri. Dersom kate goriene kan ordnes i en naturlig rekkefølge, som i dette eksemplet, kalles gjerne variablen ordinal. Ofte er det en av kategoriene som blir satt i fokus, f.eks. betydelig feil, og det er da nok å operere med to kategorier: betydelig feil - ingen betydelig feil (dvs. ubetydelig feil og feilfri slås sammen). En variabel med to kategorier kalles ofte dikotom. I revisjonslitteraturen brukes ofte ordet attributt når en bestemt kategori settes i fokus. Det er typisk for svært mange revisjonspopulasjoner at forholdsvis få revisjonsenheter har det aktuelle attributt (f.eks. betydelig feil). En revisjonspopulasjon kan karakteriseres med en eller flere variable, og en hensiktsmessig måte å oppsummere dette på er i form av hyppighetsfordelinger, dvs. en opplisting av de mulige kategorier, verdier evt. verdiintervaller og antall enheter i denne kategori, evt. med verdi i dette intervall.
Eksempel 1: Anta en revisjonspopulasjon på 10 000 bilag hvorav 9 850 er uten feil, 120 har en feil, 20 har to feil, mens 10 har tre feil og ingen har mer enn tre feil. Antall feil på bilaget kan oppfattes som en variabel med hyppighetsfordeling:
Antall feil Hyppighet Relativ hyppighet
0 9850 0.985
1 120 0.012
2 20 0.002
3 10 0.001
Dette kan illustreres i et søylediagram som i Figur 1.4. Vi har her måttet bruke en noe sammentrengt (logaritmisk) skala på den vertikale aksen for å få den venstre søylen med på arket. I dette eksemplet kan variablen kun anta verdier blant de hele tall. En slik variabel blir ofte kalt en heltallsvariabel
13
1.4 Populasjoner : attributter og variable
Figur 1.4: Søylediagram
eller diskret variabel.
Eksempel 2: Anta at vi har en revisjonspopulasjon bestående av 10 000 bi lag. Bilagenes pålydende kan vi oppfatte som en variabel. I den foreliggende populasjon finnes det bilag med pålydende som varierer fra null til i un derkant av 9 000 kroner. Det er derfor ikke hensiktsmessig å liste opp alle mulige verdier av pålydende og deres hyppigheter. Vi nøyer oss med å grup pere pålydende i passende intervaller, og telle opp antall bilag med pålydende som faller i de ulike intervaller. Anta at bilagene i populasjonen fordeler seg slik:
Pålydende 0.00 1000.00 2000.00 3000.00 4000.00 5000.00 -
i kroner 999.99 1999.99 2999.99 3999.99 4999.99 og opp
Antall bilag 5 410 2 470 1 230 690 110 90
Relativ hyppighet 0.541 0.247 0.123 0.069 0.011 0.009
Denne hyppighetsfordeling illustrerer vi med et histogram i Figur 1.5. Dette gir kun et summarisk bilde av den virkelige hyppighetsfordelingen i populasjonen, men ved vårt valg av intervallgrenser har vi sørget for at de
14
KAPITTEL 1 : Statistisk perspektiv
Figur 1.5: Histogram
vesentlige trekk ved den underliggende hyppighetsfordeling trer fram.
I dette eksemplet vil variablen ikke nødvendigvis anta bare heltallige verdier, og det er i enkelte sammenhenger hensiktsmessig å tenke seg et kon tinuerlig spektrum av mulige verdier (selv om deler av et øre ikke forekom mer). En slik variabel blir gjerne kalt en kontinuerlig variabel (i motsetning til diskret variabel). Hyppighetsfordelingene i disse to eksemplene hadde et trekk felles, nemlig stor skjevhet (her mot venstre). Undersøkelser fra re visjonspraksis tyder på at dette ikke er noe særsyn. I enkelte situasjoner vil en nok finne mer symmetriske hyppighetsfordelinger, men asymmetri er det mest vanlige, og enkelte ganger er populasjonene ekstremt skjeve. Mange revisjonspopulasjoner har også andre særtrekk, vi nevner ”toppethet” og "tunghale”. Stor toppethet betyr at mange revisjons enheter faller i et sne vert intervall, mens forholdsvis færre faller utenfor. Stor hale betyr at det finnes enheter som er svært avvikende. Et viktig eksempel der alle tre nevnte trekk kan tenkes å forekomme, har vi for variablen feilansatt beløp, dvs. differensen mellom bokført verdi og revidert verdi. Denne variabelen måles med fortegn. For de fleste postene vil den ha verdi null eller nær null. Feilposteringer vil, når de forekommer, ofte være enten overvurderinger (venstreskjev fordeling) eller undervurderinger (høyreskjev fordeling), alt etter omstendighetene. Merk også asymmetrien som ligger i at en post aldri kan overvurderes mer enn bokført verdi, mens det ikke er noen grense andre veien. De særdrag ved revisjonspopulasjoner som er nevnt ovenfor, er en av
1.5 Utvalgsbaserte metoder
15
grunnene til at en del stikkprøvemetoder som anvendes i andre sammen henger, som ofte er basert på antakelsen om normalfordeling, ikke er så velegnet i revisjon. En revisor vil ofte måtte undersøke en mer eller mindre veldefinert re visjonspopulasjon mht. forekomsten av et bestemt attributt, eller forhold som knytter seg til en bestemt variabel. Vi har derfor i hovedsak to prob lemstillinger, kalt henholdsvis attributtsampling og variabelsampling. Attributtsampling: Revisor ønsker kunnskap om antall (eventuelt ande len) revisjonsenheter i populasjonen som har et bestemt attributt, eksem pelvis
- andelen attesterte bilag i en bilagsbunke, - antall feilansatte poster i et regnskap, - antall lagerposter med stock-out. Variabelsampling: Revisor ønsker kunnskap om summen (eventuelt gjen nomsnittet) av en bestemt variabel for alle revisjonsenhetene, eksempelvis
- gjennomsnittlig verdi av bilagene i en bilagsbunke, - summen av verdiene av postene i et regnskap, - summen av avvikene (med fortegn) fra bokført verdi for alle postene i et regnskap,
- den totale verdi av alle postene i en lageroversikt. I noen tilfeller vil det være aktuelt å studere flere attributter og/eller variable i forbindelse med samme revisjonspopulasjon, eksempelvis forekomsten av to typer feil på bilagene i en bilagsbunke, eller antall feil og total verdi av feil på bilagene. Slike attributter og/eller variable kan en tenke seg å studere i sammenheng. Vi vil i hovedsak begrense oss til å studere et attributt, evt. en variabel av gangen. Attributt-sampling er mest aktuelt ved systemrevisjon (Kapittel 1:2), mens variabel-sampling er mest aktuelt ved detaljrevisjon (Kapittel 1:3).
1.5
Utvalgsbaserte metoder
En revisor må i praksis ofte foreta vurderinger på grunnlag av stikkprøver. En stikkprøve består av et utvalg av enheter fra en mer eller mindre veldefi nert samling av enheter, det være seg transaksjoner, konti, bilag, ordresedler,
16
KAPITTEL 1 : Statistisk perspektiv
fakturaer, lagerposter etc. Det kan være ulike årsaker til dette: Tiden kan sette en grense for hvor mange enheter som revisoren rekker å vurdere. Det kan gi større sikkerhet å foreta en grundig revisjon av et utvalg enheter framfor en mindre grundig revisjon av alle enheter. Innsatsen bør også stå i forhold til de feil som kan oppstå og konsekvenser av slike feil. Samlingen av ensartede enheter som er i revisors søkelys har vi kalt vil en revisjonspopulasjon, og enhetene selv kaller vi revisjonsenheter. Der som revisor akter å trekke et utvalg (stikkprøve) fra populasjonen, blir revisjonsenhetene gjerne kalt utvalgsenheter. En stikkprøve fra en bestemt revisjonspopulasjon vil som regel bare være en revisjonshandling i et mer eller mindre omfattende revisjonsprogram, der flere revisjonspopulasjoner (konti, bilag etc.) etter tur kommer i fokus. Vi innrømmer at det ofte kan være nødvendig å foreta en fullstendig gransking av alle revisjonsenhetene i den aktuelle populasjon, og at det også ofte kan forsvares å granske alle re visjonsenheter som peker seg ut som kritiske, og la være å granske de øvrige. Det er imidlertid knapt mulig å gjennomføre et revisjonsprogram av noen størrelse uten å måtte ty til stikkprøver i deler av det, eller i det minste vurdere stikkprøver som et aktuelt alternativ. Et sentralt spørsmål for revisor vil være hvilken pålitelighet som kan til legges en vurdering basert på en stikkprøve. Svaret på spørsmålet vil avhenge av omstendighetene, dvs. den aktuelle problemstilling, hvordan stikkprøven er tatt, og i noen grad også av utfallet av stikkprøven. I denne forbindelse vil revisor dra nytte av sine tidligere erfaringer kombinert med et visst teori grunnlag. De krav som det er naturlig å stille til stikkprøver vil i betydelig grad avhenge av revisors målsetting med revisjonsprogrammet. Denne vil kunne være noe forskjellig alt ettersom det dreier seg om intern revisjon, ekstern revisjon eller offentlig revisjon. Den aktuelle revisjonshandling må sees i sammenheng med de andre handlingene i revisjonsprogrammet, som gjerne også omfatter ulike typer klientvurdering og regnskapsanalytiske vur deringer. Forut for bruk av stikkprøver i en konkret situasjon bør revisor ha tatt stilling til følgende spørsmål: 1. Hva er målsettingen med stikkprøven?
2. Hvordan er revisjonspopulasjonen definert? 3. Hvilke egenskaper ved utvalgsenhetene skal observeres?
4. Hvilken utvalgsmetode bør brukes? 5. Hvor stor bør stikkprøven være?
1.5 Utvalgsbaserte metoder
17
6. Hvordan vil en fortolke mulige utfall av stikkprøven? 7. Hvordan vil en gjøre bruk av resultatet, evt. koordinere det med annen informasjon?
De fire siste spørsmålene gjelder (ønsket) pålitelighet. Dersom revisor har et valg mellom stikkprøver og en eller flere alternative undersøkelsesmetoder, vil svarene på disse spørsmålene også kunne bidra til å avklare det mer grunnleggende spørsmålet:
0. Er stikkprøver formålstjenlig, evt. den mest tjenlige metode i den fore liggende situasjon? Svaret her vil selvfølgelig også avhenge av en del andre forhold, som for eksempel kostnadsvurderinger, tidsrammer og kompetansenivå. Det er imi dlertid klart at innsikt i problemstillingene 1 til 7 ovenfor er nødvendig dersom en skal kunne forsvare et revisjonsopplegg overfor klienten og andre interessegrupper. Vi tar sikte på å presentere metoder og synsmåter på stikkprøveproblemer i revisjon som har sin forankring i statistisk teori. Det er selvsagt mulig å gi seg i kast med problematikken uten slik forankring, og noen mener at det er nok å utvise sunt skjønn basert på opparbeidet erfaring. Det er imidler tid ofte vanskelig å vurdere påliteligheten av såkalte skjønnsmessige eller ” ikke-statistiske” stikkprøver, og mange revisjonshandlinger av denne art er ikke lette å begrunne rasjonelt. Selv om man sporadisk kan se enkelte høyst tvilsomme anbefalinger, er det i nyere litteratur knapt noe motset ningsforhold mellom ikke-statistiske og statistiske stikkprøver, det er mer tale om ulikt bevissthetsnivå. Fordelene ved en forankring i statistisk teori kan kort oppsummeres slik:
- det kan gi bedre forståelse av den rolle tilfeldigheter spiller i forbindelse med stikkprøver, - det gir bedre innsikt i hvilke elementer som påvirker påliteligheten av stikkprøver, både de som er innenfor som utenfor revisors kontroll,
- det gir bedre muligheter for å tilpasse stikkprøvemetoden til revi sors målsettinger ved at teorien tilbyr både et regneverktøy og egnede tabeller ved planlegging og analyse, - det gir et kvantitativt uttrykk for resultatet av revisjonshandlingene, og
KAPITTEL 1 : Statistisk perspektiv
18
- teorien tvinger revisor til å uttrykke sine målsettinger mer eksplisitt.
Det siste blir av enkelte revisorer ikke oppfattet bare som fordelaktig, idet man føler at referanserammen er mer krevende. Man må altså investere noe for å få noe igjen, og den eneste holdbare innvending mot statistiske stikkprøver ligger etter min oppfatning i kostnad-nytte aspektet.
1.6
Usikkerhetsvurderinger
Når revisor velger å begrense granskingen av en revisjonspopulasjon til en stikkprøve fra denne, er det i tro på at denne er tilstrekkelig for å få en vel begrunnet oppfatning av populasjonen som helhet, det være seg forekomsten av et bestemt attributt hos revisjonsenhetene eller totalverdien av en vari abel knyttet til revisjonsenhetene. Enhver vurdering eller beslutning basert på en stikkprøve medfører imidlertid en viss usikkerhet. Det er viktig at revisor gis muligheter til å vurdere denne usikkerhet og kanskje planlegge stikkprøven slik at visse målsettinger mht. akseptabel usikkerhet er oppfylt. Måten å uttrykke slike målsettinger på vil kunne avhenge av situasjonen, og igjen er det naturlig å tale om to hovedproblemstillinger:
(1) Anslå en størrelse som karakteriserer populasjonen med angivelse av feilmarginer. (2) Konkluder, hvis rimelig, at revisjonspopulasjonen oppfyller oppsatte kriterier. Det er lett å finne eksempler fra revisjon på (1) og (2), både når det gjelder attributter og variable. La oss f.eks. se på noen situasjoner i forbindelse med vurdering av et varelager ut fra stikkprøver. Eksempler på (1) er da
- anslå antall enheter av et vareslag som må kasseres, - anslå total verdi av alle postene i en lageroversikt,
mens eksempler på (2) er - konkludere at en kontrollrutine på lageret har virket, f.eks. at andelen uattesterte uttakssedler er høyst 1%, - konkludere at bokført verdi av lageret ikke representerer en vesentlig feilvurdering.
1.6 Usikkerhetsvurderinger
19
For en ekstern revisor som skal foreta undersøkelser av en rekke ulike sider ved klientens virksomhet i forbindelse med årsoppgjøret, vil det vel ofte være slik at dersom delkonklusjoner kan trekkes i henhold til (2), så er nærmere anslag (1) uten interesse i det videre arbeid. I statistisk teori faller (1) under betegnelsen estimering, mens (2) er beslektet med såkalt hypotesetesting. Imidlertid er det under (2) at forestill ingen om vesentlighet ofte kommer inn, noe som innbyr til andre betraktningsmåter av mer intrikat beslutningsteoretisk natur. Ut fra det som er sagt i dette og forrige avsnitt kan vi splitte vårt interessefelt i fire, nemlig
(a) Attributt (b) Variabel
(1) Estimering (al) (bl)
(2) Beslutning (a2) (b2)
Det er imidlertid mulig å knytte sammen (1) og (2) ved å ta utgangspunkt i estimeringsproblematikk (1) og bygge inn beslutningsbetraktninger (2). Det er også en del betraktninger angående attributt-sampling som kom mer oss til nytte ved variabel-sampling, i forbindelse med såkalte pengeenhetsstikkprøver. La oss sette estimeringsproblemet i fokus ved å ta utgangspunkt i to eksempler, ett med attributt-sampling og ett med variabelsampling:
Eksempel 1: Feil i bilag Fra en populasjon på N=1000 bilag, f.eks. uttakssedler fra et lager, trekker vi n=50 bilag som granskes. Antall funne bilag med feil ble 5, dvs. fehande len i stikkprøven var 5/50=0.10, dvs. 10%. Vårt beste anslag for fehandelen i hele bilagsbunken er derfor 0.10. Hvor pålitelig er dette anslaget? Anta at vi isteden fant 10 feil, slik at fehandelen blir anslått til 0.20. Er dette anslaget mer, mindre eller like pålitelig som det forrige? Enn om vi isteden trakk n=100 bilag og fant 10 feil, slik at fehandelen også nå blir anslått til 0.10. Er påliteligheten den samme som ovenfor? Enn om vi isteden hadde N=10 000 bilag og trakk n=100 bilag og fant 10 med feil slik at fehandelen også nå blir anslått til 0.10? Hvordan forholder det seg dersom vi i disse situasjonene observerte 20% feil, eller 5% feil? Hvor stor stikkprøve må vi ta for å oppnå en bestemt pålitelighet? Før vi kommer videre må det klargjøres hva som menes med påliteligheten av et anslag. Vi kan ønske oss feilmarginer til begge sider; f.eks. dersom vi har anslått andelen med feil i hele bilagsbunken til 10%, vil en feilmargin på ±2% kunne bety at vi anser 8% som en nedre grense og 12% som en
20
KAPITTEL 1 : Statistisk perspektiv
øvre grense for andelen med feil i hele bilagsbunken. Vi har her tenkt oss like stor feilmargin til begge sider uten annen grunn enn at det ser pent ut, men vil være åpne for at det ikke nødvendigvis må være slik. I noen situa sjoner vil det forøvrig bare være den øvre feilgrensen som er av interesse. I praksis er det sjelden mulig å angi feilmarginer slik at en er 100% sikker på at de ikke vil bli overskredet. Det beste en kan håpe på er en garanti i form av at feilmarginen holder med en viss sikkerhet. En slik garanti kan kanskje best uttrykkes ved et sannsynlighetsutsagn, eksempelvis at vi har vurdert sjansen for at feilmarginen ±2% ikke overskrides til å være 95%. In tuitivt synes det rimelig at en mer romslig feilmargin, f.eks. ±4%, vil kunne garanteres med en større sikkerhet, mens en mindre feilmargin, f.eks. ±1%, bare kan garanteres med lavere sikkerhet. Vi kan ikke få både i pose og sekk.
Eksempel 2: Lagervurdering I forbindelse med vurdering av verdien av et varelager har vi en liste med ialt 1000 nummererte vareslag, og som populasjon bruker vi de N=1000 varenumrene. Vi trekker et utvalg på n=50 numre, foretar en verdivurdering av disse, der det f.eks. inngår opptelling, vurdering av kurans og markedspris etc. La oss si at verdien av varene på de uttrukne varenumrene blir vurdert til kr. 370 800,-. Siden vi i gjennomsnitt har undersøkt hvert 20. vareslag, er det naturlig å anslå totalverdien av lageret til kr. 7 416 000,-. Også her er det ønskelig å kunne angi feilmarginer som det er knyttet en pålitelighetsgaranti til. Hvilken pålitelighet kan vi f.eks. tillegge utsagnet at totalverdien ligger i intervallet 7 416 000 ± 500 000? Et snevrere intervall, f.eks. 7 416 000 ± 200 000, vil opplagt måtte tillegges en mindre pålitelighet. Kan vi kan skje tallfeste påliteligheten og uttrykke den som et sannsynlighetsutsagn? Påliteligheten vil trolig øke med stikkprøvestørrelsen, men avhenger den også av populasjonsstørrelsen? Hvor stor stikkprøve trengs for å oppnå en ønsket feilmargin med en gitt pålitelighet?
De to eksemplene ovenfor indikerer at det kan være behov for en viss fortrolighet med sannsynligheter. For lesere som mangler eller ønsker å ut dype dette aspekt, har vi utarbeidet et eget avsnitt i del II: Kapittel 7. Sannsynligheter og revisjon. For å kunne foreta en mer detaljert vurdering av pålitelighet og risiko ved en stikkprøve, er vi nødt til å gjøre visse forutsetninger om den måten stikkprøven er fremkommet på. I denne forbindelse er det vanskelig å komme utenom begrepet sannsynlighetsutvalg. Det er stikkprøver (utvalg) trukket på en slik måte at det er mulig, eksakt eller tilnærmet, å beregne sammen-
1.6 Usikkerhetsvurderinger
21
hengen mellom de størrelsene som vi har diskutert ovenfor. I stikkprøveteorien er ulike typer sannsynlighetsutvalg gitt en presis definisjon. Den enkleste formen er et enkelt tilfeldig utvalg, dvs. en stikkprøve trukket på en slik måte at alle mulige stikkprøver av den ønskede størrelse har samme sannsynlighet for å bli trukket ut. For lesere som ønsker å utdype dette as pekt, er det et eget avsnitt i del II: Kapittel 8. Utvalgsmodeller og revisjon. For en ekstern revisor der stikkprøver er en del av grunnlaget for beretnin gen ved årsoppgjøret, vil beslutningsaspektet nok være det sentrale. I de to neste kapitlene vil vi derfor legge hovedvekten på dette, og søke å legge frem noen relativt enkle anbefalte løsninger. Vi tar opp både estimeringsproblemer og beslutningsproblemer til grundigere drøfting i del II: Kapittel 9. Inferensteori og revisjon. Dette bygger i stor utstrekning på kapitelene II: 7 og II: 8. Den eksterne revisors beslutningsproblem vil, som allerede antydet i (2) ovenfor, dreie seg om å avgjøre hvorvidt stikkprøven gir grunnlag for å bekrefte eller akseptere klientens kontrollsystemer (systemrevisjon) eller klientens bokførte tall (detalj re visjon). La oss ta utgangspunkt i de to ek semplene ovenfor:
Eksempel 1: Feil i bilag (fortsatt) Anta at vi observerte 3 bilag med feil i en stikkprøve på n=100 fra popu lasjonen, dvs. 3% bilag med feil. Gir dette grunnlag for, med tilstrekkelig grad av sikkerhet, å gå ut fra at feilandelen i populasjonen i hvert fall ikke er større enn 5%, som revisor har satt som en vesentlighetsgrense? Revisor ønsker ikke å komme i den situasjon at populasjonen aksepteres på tross av at feilandelen i denne er over vesentlighetsgrensen. For stikkprøven må man regne med en viss feilmargin. La oss si at 6% er en beregnet øvre grense for andelen bilag med feil i populasjonen. En kan da ikke utelukke at feilande len i populasjonen likevel er over vesentlighetsgrensen. Revisor ønsker heller ikke å komme i den situasjon at en populasjon ikke aksepteres på tross av at feilandelen i denne er under vesentlighetsgrensen. Beslutningsproblemet består i å trekke grenser for når populasjonen aksepteres eller "forkastes”. I denne sammenheng ønsker revisor å vurdere risikoen for feilaktig aksept (/?risiko), og risikoen for feilaktig forkasting (a-risiko). I praksis vil det måtte bli en avveining mellom de to typer risiki på bakgrunn av en vurdering av konsekvensene ved feilkonklusjoner. Teorien må kunne veilede oss her, samt fortelle oss hvor stor stikkprøve som trengs for at begge risiki er redusert til et akseptabelt nivå.
22
KAPITTEL 1 : Statistisk perspektiv
Eksempel 2: Lagervurdering (fortsatt) La oss si at bokført verdi av varelageret er kr. 7 750 000, mens estimert verdi basert på en stikkprøve på n=50 varenumre er kr. 7 416 000. Gir dette grunnlag for, med tilstrekkelig grad av sikkerhet, å påstå at varelageret er overvurdert? En viss feilmargin må tillates i estimatet, og revisor ønsker ikke å komme i den situasjon at overvurdering påstås når dette ikke er til felle eller er uvesentlig. På den annen side ønsker revisor ikke å komme i den situasjon at en vesentlig overvurdering forblir uoppdaget. Igjen består beslutningsproblemet i å trekke grenser mellom aksept eller ” forkastning”, og igjen har vi et problem der en må avveie to typer risiki (hvilke?).
I tilfellet med variabel-sampling vil det også være et spørsmål om valg mel lom ulike måter å trekke stikkprøven på. Såkalte pengeenhetsstikkprøver har fått stor anvendelse i revisjon, og en del av metodene i Kapittel 3 er basert på slike stikkprøver. En grundigere diskusjon er gitt i del II: Kapittel 10. Spesielle utvalgsmetoder i revisjon. I statistisk litteratur blir grenser for en ukjent størrelse som kan garan teres med en viss sikkerhet, gjerne kalt konfidensgrenser. Den tilhørende sannsynlighetsgaranti kalles konfidensnivået. Intervallet fra en nedre grense til en øvre konfidensgrense kalles et konfidensintervall. I revisjonslitteraturen er det tildels brukt andre betegnelser: Konfidensgrenser er kalt bl.a. presisjonsgrenser, pålitelighetsgrenser og sikkerhetsgrenser. Konfidensnivå er kalt pålitelighet (-snivå) eller sikkerhet (-snivå). Selv om dette begrepet er utviklet i forbindelse med estimeringsproblemer, er det mulighet for å bruke det også i forbindelse med beslutningsproblemer. Da vil en typisk bare være interessert i en ensidig konfidensgrense, som oftest den øvre, og det blir et spørsmål hvor denne ligger i forhold til en antatt vesentlighetsgrense. La oss kort se på en annen problemstilling kalt ”discovery sanplimg”, der sannsynlighetsregning kan gi verdifull innsikt i hva som er mulig å oppnå med en stikkprøve: Anta at revisor ikke utelukker at det kan være grove feil eller uregelmessigheter knyttet til enkelte av enhetene i en revisjonspopulasjon. Det kunne vært ønskelig å gjennomgå alle enhetene, men gransking av hver enhet med sikte på å avdekke grove feil eller uregelmessigheter (som kan være godt skjult), vil kreve så stor innsats fra revisors side at det ikke lar seg gjøre. En stikkprøve er derfor nødvendig. En stikkprøve som er et tilfeldig utvalg av revisjonsenheter har den fordel at klienten, evt. motparten ikke vet på forhånd hvilke enheter som blir gransket og hvilke som ikke blir gransket. Ved andre typer utvalg vil en på forhånd ofte kunne si hvilke en
1.6 Usikkerhetsvurderinger
23
heter som har liten sjanse for å bli revidert, og dette kan i så fall utnyttes til å skjule misligheter. Et tilfeldig utvalg gir oss også mulighet for sannsynlighetsbetraktninger. Revisor vil i første omgang være interessert i å avdekke minst ett slikt tilfelle av grove feil dersom slike finnes. Dersom de grove fei lene er knyttet til bare ett eller et fåtall enheter i revisjonspopulasjonen, vil det opplagt være en viss risiko for at disse enhetene ikke kommer med i stikkprøven, slik at forholdet ikke blir avslørt. Revisor kan for gitt populasjonsstørrelse og stikkprøvestørrelse beregne sannsynligheten for at minst en enhet med grov feil blir oppdaget når et gitt antall slike finnes i populasjonen. Revisor kan så finne ut hvor stor stikkprøve som trengs for å avsløre minst en grov feil under ulike forutsetninger om populasjonen. La derfor populasjonen bestå av N revisjonsenheter, hvorav M er antall enheter med grov feil. La videre Y være antall enheter med grov feil i en stikkprøve på n enheter. Under forutsetning av at stikkprøven er et tilfeldig utvalg, kan vi beregne sannsynligheten for minst en grov feil i stikkproven ved P(Y > 1) = 1 - P(Y = 0)
der P(Y — 0) er sannsynligheten for at stikkprøven er uten grove feil. Denne sannsynligheten avhenger av N, M og n. Den nødvendige teori for å foreta slike beregninger er gitt i Kapittel 8. Eksempel 3: Nåler i høystakken? La N = 1000. Beregning av P(Y > 1) for noen verdier av M og n gir da n 100 200 300
M=1 0.1000 0.2000 0.3000
2 0.1901 0.3602 0.5102
3 0.2712 0.4884 0.6574
4 0.3443 0.5910 0.7605
5 0.4102 0.6731 0.8327
I praksis vil selvsagt M være ukjent, men slike beregninger setter revisor i stand til å vurdere sjansen for minst en grov feil for ulike stikkprøvestørrelser under ulike omstendigheter. Dersom en ønsker at sjansen skal være minst 50% for å oppdage minst en grov feil i en populasjon med tre grove feil, ser vi at stikkprøven må omfatte et sted mellom 200 og 300 enheter, trolig i nærheten av 200. Ønsker vi at sjansen isteden skal være minst 75%, må stikkprøven omfatte noe mer enn 300. De eksakte tall er henholdsvis n — 207 og n = 370. Beregninger av dette slaget kan være nyttige ved vurderinger av hva som er mulig å oppnå ved stikkprøver, der situasjonen har karakter av å lete etter
KAPITTEL 1 : Statistisk perspektiv
24
”nåler i en høystakk”, der vi på forhånd ikke vet om det finnes noen nål eller om det er flere enn en.
1.7
Analytiske metoder
Analytiske metoder i revisjon kan defineres som Analyse av finansielle og ikke-finansielle data med sikte på å klar legge variasjonsmønstre og sammenhenger mellom variable, samt oppdage avvik fra etablerte og forventede variasjonsmønstre eller sammenhenger.
Det er ulike målsettinger ved analytisk revisjon: I noen situasjoner brukes analytiske metoder som det primære bevismateriale, dvs. som erstatning for dctalj/substansrevisjon med vanlige metoder (bekreftende) eller sam men med vanlige metoder (støttende). I andre situasjoner brukes analytiske metoder for å påkalle revisors oppmerksomhet mot områder som krever grundigere undersøkelser med andre metoder (søkende). I noen tilfeller er målet bare å skaffe seg innsikt i klientens virksomhet gjennom analyser, dels på måfå i klientens databaser (”data mining”). Endelig har vi situasjoner der analytiske metoder tar sikte på avviksanalyse (avslørende), herunder avsløring av bedrag (”fraud detection”). Det stilles ulike krav til pålitelighet av metoden, alt etter formålet. Der som analysen er bekreftende stilles det langt strengere krav enn når analysen bare er søkende. I statistisk litteratur beskrives ulike former for avviksanalyse basert på modeller som uttrykker forventningen til en variabel, og der avvikere vur deres ut fra standardavviksberegninger. Vi finner dette i forbindelse med: • kontrolldiagrammer • regresjonsmodeller: enkle og multiple • tidsrekkemodeller Istedenfor å studere en variabel av gangen kan en studere flere. Dette kan skje ved at en har forventninger om ulike forholdstall, eller ved å modellere relasjoner mellom variablene eller forholdstallene. I situasjoner med mange variable, og kanskje få observasjoner, foreligger muligheten for såkalt prinsipalkomponentanalyse. I de senere år har man utviklet gode plottemetoder for å avdekke avvikere, og slike er etterhvert implementert i statistisk pro gramvare.
1.7 Analytiske metoder
25
I løpet av 1990-årene er det utviklet en rekke andre metoder for avviks analyse basert på ulike generaliserte avstandsbegreper, men som ikke gir de samme sannsynlighetsgarantier som de klassiske metodene. En del multivariate statistiske metoder har fått en viss anvendelse innen revisjon, bl.a. for konkursprediksjon og til dels også ”fraud detection”. De mest sentrale er: • diskriminantanalyse
• logistisk regresjon • klassifikasjonsmetoder: klyngenalyse, statistisk tre etc.
Vi vil komme tilbake til noen av disse metodene i et senere Kapit tel 11. Det er også forsøkt en rekke andre metoder: ”neural nets”, ”fuzzy sets”, ”rough sets”, "genetic programming” osv. Dette er metoder som har ambisjoner om å lære mønstre under normal drift, og så varsle dersom påfallende endringer inntreffer, en slags kunstig intelligens (AI). En interes sant form for ”fraud detection” er studiet av forekomst av sifre, der manip ulerte data lett gir mønstre som ikke er som ” de burde være”. Bedrifter har i dag store mengder data liggende i sitt IT-system, ek sempelvis regnskapsdata over tid. Det dreier seg da om mange variable, men ikke nødvendigvis mange perioder. Det er da vanskelig å avsløre un ormale avvik i enkelttall. Med nyere IT-teknologi er mulighetene åpnet for å kunne manipulere mange variable med små beløp, men slik at det sam let utgjør et vesentlig beløp, som f.eks. er underslått. ”Data mining” er da en interessant mulighet. ”Fraud detection” blir ofte nevnt i sammenheng med ”data mining”, mens enkelte hevder det er en prinsipiell forskjell. Ved ”fraud detection” har på forhånd har en kontekst der en har definert hva som er uvanlig, mens ”data mining” mer har karakter av søk på måfå i store datamasser. Mange er nokså skeptiske til dette og hevder at rene fiskeekspedisjoner i et hav av data sjelden leder til kunnskap. Når ”data mining” skjer uten kontekst på en ad hoc og halvautomatisk måte, er det stor risiko for å avdekke mønstre og sammenhenger som er tilfeldige. Det kreves derfor betydelig innsikt for å unngå å kaste bort tid med å jage spøkelser. ”Data mining” er et ferskt område for forskning og anvendelser i revisjon, og er faringen er hittil begrenset. ”Data mining” vil i praksis måtte konkurrere med mer målrettede aktiviteter, der revisor fokuserer på områder med høy risiko. I løpet av 1990-tallet gjorde man også store fremskritt i å kombinere statistiske metoder med kunnskapsbaserte systemer. Dette innebærer at
26
KAPITTEL 1 : Statistisk perspektiv
metodene kan være meget kompliserte matematisk sett, med konvensjon er som tar seg av ulike tilfeller, dels på grunnlag av input fra revisor, og dels på grunnlag av særtrekk i data som avdekkes underveis. Alt dette er skjult for bruker, som kun behøver å forholde seg til termer i ”eget språk”.
Kapittel 2
Systemrevisjon 2.1
Målsetting
Ved systemrevisjon tar revisor sikte på å avklare i hvilken utstrekning klien tens interne kontrollsystemer er til å stole på. Vi går ut fra at revisor først vurderer disse systemene, og gjør seg opp en mening om de er tilfredsstillende på papiret. Den egentlige systemrevisjonen går ut på å granske hvorvidt klienten i praksis følger de oppsatte kontrollene i tilstrekkelig grad. Hva som er tilstrekkelig i denne sammenheng, avhenger av i hvilken utstrekning revisor akter å la kvaliteten av intern kontroll få betydning for omfanget av detaljrevisjon, dvs. de konkrete regnskapsmessige verifikasjonene. Revi sor vil også kunne være interessert i å teste klientens kontrollsystem i løpet av året som et forebyggende tiltak. Systemkontroller er som regel knyttet til bestemte veldefinerte registreringer eller handlinger, f.eks. i forbindelse med behandlingen av en transaksjon som skal etterlate et ”spor” hos klien ten. I noen tilfeller kan det dreie seg om hvorvidt en handling overhodet er registrert. De mest aktuelle stikkprøvemetoder i forbindelse med systemrevisjonen faller innenfor rammen av attributt-sampling. En søker å anslå andelen avvik fra en foreskrevet kontrollprosedyre i forhold til de tilfeller hvor kontrollen skal brukes. Anslagets størrelse vil kunne være bestemmende for den tiltro revisor tillegger denne kontrollen i det videre arbeid, f.eks. ved bestem melse av omfanget av substansrevisjon på de størrelser som kan påvirkes av eventuelle svikt i denne kontrollen. Det er ofte naturlig å anlegge et beslutningssynspunkt. Utgangspunktet er da at revisor på forhånd planleg ger detaljrevisjon av et bestemt omfang, knyttet til en viss tiltro til klientens kontrollsystem. Dersom andelen av kontrollavvik er tilstrekkelig lav, er re
27
28
KAPITTEL 2 : Systeinrevisjon
visors tiltro urokket, i motsatt fall må revisor redusere sin tiltro til denne kontrollen, og øke omfanget av detalj revisjon vedrørende størrelser som kan påvirkes av eventuell kontrollsvikt. Systemrevisjon basert på stikkprøver av en bestemt intern kontroll hos en klient vil vi kalle en systemtest, eller kor tere, en test. Planleggingen av en systemtest vil vanligvis omfatte følgende punkter: 1. Fastlegge målsettingen med systemtesten.
2. Fastlegge populasjonen og utvalgsenhetene, og definere hva som er kontrollavvik hos utvalgsenhetene. 3. Fastlegge utvalgsmetoden.
4. Fastlegge stikkprøvestørrelsen. 5. Fastlegge metoden for analyse av stikkprøven.
Vi har i dette avsnittet omtalt det første punktet i generelle vendinger, og vil i tur og orden ta for oss de øvrige.
2.2
Utvalgsenheter og populasjon
Forut for en test av en bestemt kontrollrutine må utvalgsenhetene defineres presist, og mest mulig hensiktsmessig i forhold til målsettingen for testen. Utvalgsenheter kan typisk være • et bilag eller dokument • enkeltposter i et bilag
• enkeltposter i en journal I noen tilfeller er det klart hva utvalgsenhetene bør være, i andre si tuasjoner står en overfor et valg. Eksempel 1: Dersom en har som målsetting å teste kontrollen med ut betalinger, og hver utbetaling skjer etter anvisning med attestasjon av en bestemt person (signatur), vil de enkelte anvisningsbilag kunne være ut valgsenhetene. Dersom det er mulighet for at et anvisningsbilag betaler flere regninger, og det kreves at hver av disse attesteres, vil de enkelte postene i slike bilag kunne være utvalgsenhetene.
2.2 Utvalgsenheter og populasjon
29
Eksempel 2: Dersom en har som målsetting å teste prissettingen på ut sendte regninger, har en valget mellom å la hver regning eller de enkelte poster på regningen være utvalgsenheter. Det første krever at alle postene på en utvalgt regning kontrolleres. I situasjoner der en feilprising gjerne et terfølges av flere på samme regning, mens andre regninger er feilfrie, vil en kunne spare arbeid ved å la de enkelte postene være utvalgsenheter. Revisor må ofte ta omsyn til oppbyggingen av klientens bokføring og arkivsystem når utvalgsenhetene skal defineres. Det gjelder spesielt i forbin delse med transaksjoner som etterlater et spor i systemet, med referanser bare i en retning, som kan ”stoppe opp”.
Eksempel 3: Ved en test av forhold knyttet til innkjøp, vil kjøpsordre og betalingsanvisning være hver sin ende av et spor i systemet, og aktuelle som utvalgsenheter. Hva som er mest hensiktsmessig, avhenger av i hvilken ret ning det er enklest (eller mulig) å følge transaksjonen.
Eksempel 4: Dersom en ønsker å teste kontrollen med utsendelse av reg ninger på leveringer, vil de enkelte regninger ikke være velegnet som utvalgs enheter, idet mulige leveringer der det ikke er sendt ut regning vil falle utenom. Hvis mulig bør spesifikke dokumenter knyttet til leveringen være utvalgsenhetene. Mengden av utvalgsenheter som settes i fokus vil utgjøre en populasjon. Ved definisjon av utvalgsenheter og populasjon må en også se på muligheten for at en registrering er fjernet, midlertidig eller permanent, dvs. faren for at populasjonen ikke er fullstendig. Eksempel 5: En står overfor valget mellom å benytte en bilagsbunke, en journal eller en datafil der de enkelte bilag er registrert. Hvis det er fare for at bilag er fjernet eller linjer slettet i datafilen, kan det hende at postene i journalen er å foretrekke som utvalgsenheter.
Utvalgsenhetene vil som regel være knyttet til et tidspunkt eller en tidsperiode. Ved definisjon av populasjonen må en derfor angi presist hvilken tidsperiode som bestemmer om en utvalgsenhet er med i populasjonen eller ikke. Trekkes en stikkprøve bestående av et visst antall utvalgsenheter fra populasjonen, vil de konklusjoner som trekkes på statistisk grunnlag bare gjelde denne populasjonen, med mindre revisor er villig til å gjøre antakelser som kan knytte resultatet til tilsvarende populasjoner, f.eks. utenom den
KAPITTEL 2 : Systemrevisjon
30
tidsperioden som er testet. En ekstern revisor ønsker vanligvis å trekke konklusjoner om hele året, men det vil ofte være hensiktsmessig å utføre foreløpige (interim) tester for en avgrenset tidsperiode, f.eks. første eller annet kvartal. Det kan da hende at revisor oppdager at klientens kontroller ikke kan stoles på i tilstrekkelig grad, slik at en omfattende detaljrevisjon er nødvendig i alle fall, og gjør videre systemtesting unødvendig. Revisor vil ofte måtte tenke seg populasjonen før den konkret foreligger og dens størrelse er kjent. Ønsker en å starte en systemtest som angår hele året før årsoppgjøret foreligger, vil en kanskje måtte anslå antall utvalgsenheter, f.eks. transaksjoner, som dukker opp senere, og som innlemmes i populasjo nen. Et kontrollavvik, slik revisor definerer det, vil være et avvik fra den planlagte interne kontroll som klienten utfører i forbindelse med de utval gsenheter som er satt i fokus. Kontrollavvik bør defineres mest mulig hen siktsmessig i forhold til målsettingen med systemtesten. Det er da mulig at revisor ikke lar ethvert avvik fra den interne kontroll inngå i sin definisjon. Eksempelvis dersom en kjøpsordre internt krever to signaturer, mens en er nok i forhold til den vekt som revisor vil legge på kontrollen i sitt videre arbeid, så vil kun manglende signatur bli definert som kontrollavvik. Kon trollavvik må defineres presist.
2.3
Utvalgsmetoden
Eksakte beregninger av usikkerheten ved bruk av stikkprøver til å trekke konklusjoner om forekomsten av kontrollavvik i populasjonen, forutsetter at stikkprøven trekkes som et sannsynlighetsutvalg, dvs. i samsvar med velde finerte sannsynlighetsprinsipper. Den mest aktuelle (og enkleste) form for sannsynlighetsutvalg ved systemrevisjon er et såkalt enkelt tilfeldig utvalg, definert ved at alle mulige utvalg av den ønskede størrelse fra populasjonen er like sannsynlige. Dette innebærer ikke bare at alle utvalgsenheter i popu lasjonen har samme sjanse for å komme med i stikk prøven, men også at enhver kombinasjon med et gitt antall utvalgsenheter har samme sjanse for å bli trukket ut. Et interessant alternativ til enkelt tilfeldig utvalg er et så kalt to- trinnsutvalg. En trekker da først et tilfeldig utvalg av begrenset omfang. Er en heldig, vil konklusjonen allerede være klar. I motsatt fall utvides utvalget for å få et bedre grunnlag for å trekke en endelig konklusjon. På dette vis kan en redusere det totale stikkprøveomfang noe. Vi vil føre denne diskusjo nen videre i slutten av dette kapitlet. I det følgende forutsettes imidlertid,
2.3 Utvalgsmetoden
31
med mindre annet sies, at stikk prøven er et enkelt tilfeldig utvalg. Et enkelt tilfeldig utvalg kan realiseres ved hjelp av lommeregner eller PC med innlagt generator for tilfeldige tall. Enkelte programpakker (som f.eks. Minitab) har spesiallagede kommandoer for formålet.
Eksempel 1: Anta at alle utvalgsenhetene i populasjonen er gitt hvert sitt (entydige) nummer, og at disse er lagret i en kolonnevektor Cl. Minitabkommandoen "SAMPLE 100 Cl C2” trekker et enkelt tilfeldig utvalg på 100 numre fra Cl og putter disse i C2. Dersom en velger å nummerere en hetene i populasjonen i rekkefølge, vil kommandoen "GENERATE 1 5000 Cl” lage en "populasjon” med 5000 enheter nummerert fra 1 til 5000. Det er også publisert tabeller over såkalte tilfeldige tall. Disse er kon struert slik at en kan begynne hvor som helst, og lese det nødvendige antall sifre i en hvilken som helst retning.
Eksempel 2: La oss si at vi ønsker å trekke et enkelt tilfeldig utvalg på 5 bilag fra en populasjon på 74 bilag. Vi kan da nummerere bilagene 01, 02, ..., 74, slik at det blir tale om å trekke tosifrede tall. La oss si at vi har slått opp på en tilfeldig side i tabellen, og valgt en tilfeldig linje på denne siden (for oversiktens skyld er tallene ofte gruppert): 17382
39463
85120
02023
41381
72824
81201
Vi har dermed fått trukket ut følgende tosifrede tall
17
38
23
94
63
85
12
00
20
...
Her ser vi at tallene 94, 85 og 00 ikke svarer til noe bilag, og disse negli sjeres. Vi får da trukket ut bilag nr. 17, 38, 23, 63 og 12.
Revisor kan føle seg fristet til å gjennomføre en noe enklere prosedyre, som ofte kalles et systematisk utvalg. Eksempelvis dersom en ønsker et utvalg på 100 enheter fra en populasjon på 5000 nummerert fra 1 til 5000, så vil et utvalg bestående av hver 50de enhet være et systematisk utvalg. Hvis en velger et tilfeldig startpunkt blant de 50 første numre, vil enhver utvalgsenhet ha samme sjanse for å komme med, mens dette ikke er tilfellet for kombinasjoner av utvalgenheter. En bør derfor unngå bruk av slike former for utvalg, med mindre det er klart at det ikke kan være noen systematikk i den rekkefølge enhetene opptrer i hos klienten, som muligens sammenfaller med det valgte utvalgsintervall. Bare da kan det sies at vi har et tilnærmet tilfeldig utvalg.
32
KAPITTEL 2 : Systemrevisjon
I noen situasjoner kan det synes hensiktsmessig å trekke et såkalt klyngeutvalg. Eksempel: Revisor undersøker populasjonen av alle årets transak sjoner, og trekker først tilfeldig et bestemt antall datoer, hvoretter et tilfel dig utvalg (eller alle) transaksjoner på de utvalgte datoer undersøkes. En slik trekningsmåte vil ikke gi et enkelt tilfeldig utvalg, og er ikke dekket av teorien nedenfor. Teori for denne type utvalg fins i statistisk litteratur, men metoden er ikke anbefalt i revisjonslitteraturen.
2.4
Stikkprøvestørrelsen
Ved planlegging av hensiktsmessig stikkprøvestørrelse ved en bestemt systemtest, må revisor ta utgangspunkt i målsettingen med testen. Vi vil her anta at det dreier seg om å klarlegge i hvilken utstrekning klientens interne kontroller er å stole på, slik at planlagt omfang av den etterfølgende detaljrevisjon kan rettferdiggjøres eller må justeres opp. Revisor ønsker ikke å utføre en mer omfattende systemtest enn nødvendig for å oppnå denne målsettingen, men må i denne sammenheng vurdere følgende risiki: • faren for overvurdering av intern kontroll (/Trisiko) • faren for undervurdering av intern kontroll (ct-risiko) Overvurdering inntreffer når stikkprøven tilfeldigvis inneholder så få tilfeller av kontrollavvik at revisor går videre som planlagt, på tross av at det fins uavdekkede kontrollavvik i populasjonen i et omfang som skulle ha betinget redusert tiltro til klientens interne kontroll. Undervurdering inntreffer når stikkprøven tilfeldigvis inneholder såpass mange tilfeller av kontrollavvik at revisor velger å redusere sin tiltro til klientens interne kontroll, på tross av at hyppigheten av kontrollavvik i populasjonen er på et akseptabelt nivå. En undervurdering vil primært angå revisor (unødige korrektiver og unødig økt detaljrevisjon) og klienten (som må forsvare seg og betale), men i liten grad angå brukeren av revisors beretning. På den annen side vil overvurdering kunne innebære at nødvendige korrektiver ikke gis, at om fanget av detaljrevisjon er utilstrekkelig, med økt mulighet for at vesentlige forhold av betydning for brukerne av revisors informasjon ikke avdekkes. Ut fra den eksterne revisors hovedoppgave synes mulig overvurdering å være det mest alvorlige, og denne risiko bør derfor stå sentralt i planleggingen av stikkprøvestørrelsen. Følgende faktorer er bestemmende for nødvendig stikkprøvestørrelse:
populasjonsstørrelsen
2.4 Stikkprøvestørrelsen
33
• høyeste tolererbare andel av kontrollavvik i populasjonen • forventet andel kontrollavvik • tolererbar risiko for overvurdering (/3) • tolererbar risiko for undervurdering (et)
For å illustrere de fem faktorenes betydning skal vi se på noen eksempler. Tilsynelatende inngår ikke risikoen for undervurdering i de fire første ek semplene, et forhold som tas opp avslutningsvis. Eksempel 1: Anta at høyeste tolererbare hyppighet og forventet hyppighet av kontrollavvik er henholdsvis 5% og 1%, og at tolererbar risiko for overvur dering er 5%. Da blir
n
100 64
Populasjonsstørrelse 500 1 000 5 000 100 000 87 90 93 93
Dette resultatet indikerer at for moderate og store populasjonsstørrelser, vil nødvendig stikkprøvestørrelse (n) bare være ubetydelig mindre enn når populasjonen er uendelig stor. Så lenge populasjonen ikke er altfor liten, vil populasjonsstørrelsen ha liten betydning ved planlegging og analyse av stikkprøven. I praksis foretas derfor ofte den forenklende antakelsen at popu lasjonen er (uendelig) stor.
La oss så illustrere den rolle de tre neste faktorene har for stikkprøve størrelsen, med eksempler der vi holder to av faktorene fast og varierer den tredje. I alle eksemplene forutsettes stor (uendelig) populasjon. Eksempel 2: Anta at høyeste tolererbare hyppighet og forventet hyppighet av kontrollavvik er henholdsvis 5% og 1%. Da blir
Risiko for overvurdering (/3) 1% 2.5% 5% 10% 15% 20% 165 142 93 77 67 32
Som ventet blir nødvendig stikkprøvestørrelse (n) mindre jo større risiko en er villig til å godta. Eksempel 3: Anta at tolererbar risiko for overvurdering er 5% og at for ventet hyppighet av kontrollavvik er 1%. Da blir
KAPITTEL 2 : Systemrevisjon
34
Tolererbar hyppighet av kontrollavvik 2% 3% 4% 5% 6% 8% 10% 78 58 46 313 208 156 93
n
Vi ser at nødvendig stikkprøvestørrelse (n) er større jo mindre den høyeste tolererbare hyppighet av kontrollavvik i populasjonen er. Eksempel 4: Anta at høyeste tolererbare hyppighet av kontrollavvik i popu lasjonen og tolererbar risiko for overvurdering begge er 5%. Da blir
n
Forventet hyppighet av kontrollavvik 0.0% 1.0% 1.5% 2.0% 2.5% 3.0% 234 361 59 93 124 181
Vi ser at nødvendig stikkprøvestørrelse (n) blir større jo større hyppighet av kontrollavvik (innenfor den tolererbare grense) vi forventer. En bør derfor ikke ansette den forventede hyppighet for lavt.
I eksemplene ovenfor er forventet hyppighet av kontrollavvik brukt som beregningsgrunnlag for å sikre at risikoen for undervurdering (o) ikke over skrider 30%. Denne risiko vil variere noe fra tilfelle til tilfelle (typisk fra 20% til 30%). Ønsker en å redusere denne risikoen, må en øke stikkprøven ytterligere. Vi belyser dette med et nytt eksempel. Eksempel 5: Anta at høyeste tolererbare hyppighet av kontrollavvik i pop ulasjonen er 5%, mens forventet hyppighet er 1%, og at tolererbar risiko for overvurdering er 5%. Da er
n
Risiko for undervurdering (a ) høyst 50% 5% 10% 20% 30% 181 153 124 93 59
Når vi her angir risikoen a som en øvre skranke, er det fordi våre metoder ikke så lett lar seg eksakt tilpasse en bestemt a- risiko og /3-risiko samtidig. Eksempelvis er her o lik 7% for en stikkprøve på 153 enheter. Ønsker vi en lavere risiko for overvurdering (/3) enn 5%, er nødvendig stikkprøvestørrelse større over hele linjen, eksempelvis krever (3 lik 4% og a høyst lik 10% en stikkprøve på n = 160. Det er ikke like lett å tilpasse en ønsket o-risiko: Dersom en øker stikkprøven utover 153, vil /3 avta fra 5% og a øke (!) fra 7%. Først ved n = 181 faller a brått til 4%, mens /3 er tilbake på 5%. Ønsket om at både a og (3 skal være liten, vil være konkurrerende. Eksempelvis vil en med en stikkprøve på n = 153 kunne lage eksakte tester med følgende
2.4 Stikkprøvestørrelsen
35
kombinasjoner av (/?, a): (1.6%, 20%) (5%, 7%) (11.5%, 2%), alt beregnet under forutsetningen om akseptabel og forventet hyppighet av kontrollavvik gitt innledningsvis i eksemplet.
Beregning av nødvendig stikkprøvestørrelse for en gitt kombinasjon av de fem faktorene ovenfor, lar seg lett implementere i form av et interaktivt program på en PC. Den underliggende teori er beskrevet i del II. Denne forutsetter at stikkprøven er et tilfeldig utvalg, og at analysen utføres som i neste avsnitt. En kan ønske seg tabeller som gir den samme informasjon, men disse vil bli nokså omfangsrike dersom en skal dekke et noenlunde bredt spekter av kombinasjoner av alle fem faktorer. I Tabell 2.1 (se neste side) gir vi nødvendig stikkprøvestørrelse for noen utvalgte kombinasjoner av de fire viktigste faktorene, dvs. med unntak av populasjonsstørrelsen, som an tas å være (uendelig) stor. Merk at forventet hyppighet av kontrollavvik må oppgis i % av tolerert hyppighet av kontrollavvik.
Merknad. Tabellen bygger på såkalt Poissontilnærming, og forutsettes brukt i sammenheng med Tabell 2.2 i neste avsnitt. Den anviser stikkprøver som kan avvike noe fra mer eksakte tabeller basert på den binomiske fordeling.
Eksempel 6: Anta at tolerert hyppighet av kontrollavvik er 5% og forventet hyppighet er 1%, dvs. 20% av tolerert hyppighet. Anta videre at tolererbar risiko for overvurdering og under vurdering er henholdsvis 5% og 10%. Da er nødvendig stikkprøvestørrelse lik 156, med 3 som det høyeste tolererbare antall kontrollavvik i stikkprøven.
Revisors valg av /3-risiko ved en systemtest blir ofte sett i sammen heng med den vekt revisor ønsker å tillegge klientens kontrollsystem når omfanget av detaljrevisjonen skal bestemmes. Aktuelle verdier synes da å være i området fra 5% til 20%, og slik at stor risiko tolereres bare dersom en ved negativt utfall av systemtesten, velger liten risiko ved den etterfølgende detaljtest. Når det gjelder fastsettelsen av tolererbar andel kontrollavvik, ser en ofte 5% brukt. Dersom kontrollen ikke er kritisk mht. muligheten for at vesentlige beløpsmessige feil oppstår eller befordres videre, vil tolererbar andel kunne være noe høyere. I motsatt fall, dersom kontrollen er kritisk, vil en måtte kreve en lavere tolererbar andel, kanskje helt ned til 1%.
KAPITTEL 2 : Systemrevisjon
36
Tabell 2.1: Nødvendig stikkprøvestørrelse og høyeste tolererbare antall kon trollavvik i stikkprøven (i parentes).
Risiko /5/a
5/30
5/10
10/30
10/10
20/30
Tolerert andel kontroll avvik 1% 3% 5% 7% 10% 1% 3% 5% 7% 10% 1% 3% 5% 7% 10% 1% 3% 5% 7% 10% 1% 3% 5% 7% 10%
Forventet andel kontrollavvik (i % av tolerert andel)
0% 300(0) 100(0) 60(0) 43(0) 30(0) 300(0) 100(0) 60(0) 43(0) 30(0) 231(0) 77(0) 47(0) 33(0) 24(0) 231(0) 77(0) 47(0) 33(0) 24(0) 161(0) 54(0) 33(0) 23(0) 20(0)
10% 300(0) 100(0) 60(0) 43(0) 30(0) 475(1) 159(1) 95(1) 68(1) 48(1) 231(0) 77(0) 47(0) 33(0) 24(0) 389(1) 130(1) 78(1) 56(1) 39(1) 161(0) 54(0) 33(0) 23(0) 20(0)
20% 475(1) 159(1) 95(1) 68(1) 48(1) 776(3) 259(3) 156(3) 111(3) 78(3) 389(1) 130(1) 78(1) 56(1) 39(1) 533(2) 178(2) 107(2) 77(2) 54(2) 161(0) 54(0) 33(0) 23(0) 20(0)
30% 630(2) 210(2) 126(2) 90(2) 63(2) 395(6) 237(6) 170(6) 119(6) 533(2) 178(2) 107(2) 77(2) 54(2) 800(4) 267(4) 160(4) 115(4) 80(4) 300(1) 100(1) 60(1) 43(1) 30(1)
40% 351(5) 211(5) 151(5) 106(5) 556(10) 340(10) 243(10) 170(10) 699(3) 223(3) 134(3) 96(3) 67(3)
50% 524(9) 315(9) 225(9) 158(9) 850(17) 510(17) 365(17) 255(17) 352(6) 211(6) 151(6) 106(6)
434(8) 260(8) 186(8) 130(8) 428(2) 143(2) 86(2) 62(2) 43(2)
671(14) 403(14) 288(14) 202(14) 552(3) 184(3) 135(4) 97(4) 68(4)
2.5 Analyse av stikkprøven
2.5
37
Analyse av stikkprøven
Etterat de utvalgte enheter som utgjør stikkprøven er gransket for kon trollavvik, telles opp antall enheter med kontrollavvik, som ved divisjon med stikkprøvestørrelsen gir (den relative) hyppigheten av enheter med kon trollavvik i stikkprøven. Dette vil være revisors beste anslag for hyppigheten av enheter med kontrollavvik i den populasjon som stikkprøven er trukket fra. Selv om anslaget er lavere enn den høyeste tolererbare hyppighet av kontrollavvik, er revisor utsatt for en utvalgsrisiko. Det kan hende at hyp pigheten av kontrollavvik i populasjonen er over den høyest tolererbare, men at vi tilfeldigvis har fått en lavere hyppighet i stikkprøven. I så fall foreligger en fare for overvurdering av klientens kontrollsystem. En garderer seg mot dette på følgende vis:
Beregn en øvre grense for hyppigheten av kontrollavvik i popu lasjonen basert på stikkprøven. Konkluder at populasjonen er tolererbar bare når denne grensen faller blant de tolererbare hyppigheter. Dersom grensen er over høyest tolererbar hyppighet, bortfaller eller reduseres den vekt som revisor tillegger klientens kontroll. Slike grenser lar seg beregne på ulike måter, eksakt eller tilnærmet. Den nødvendige teori er beskrevet i del II, herunder spesielt i II: Kapittel 9.2. Eksakt beregning er relativt komplisert, men lar seg lett implementere i form av et interaktivt program på en PC. Dersom en ønsker å utføre beregningen for hånd eller legge tabeller til grunn, er det mer hensiktsmessig med en tilnærmet metode. Metoden beskrevet nedenfor bygger på såkalt Poissontilnærming og innebærer flere praktiske fordeler, bl.a. at vi greier oss med en eneste tabell, her kalt Tabell 2.2 på neste side. Beregning av øvre grenser for hyppigheten av kontrollavvik i populasjo nen skjer slik: Velg linje i Tabell 2.2 i henhold til det observerte antall enheter i stikkprøven med kontrollavvik, og avles tallet i den kolonne som svarer til den planlagte risiko for overvurdering. Den øvre grensen får en ved å dividere dette tallet med stikkprøvestørrelsen. Merk at i tillegg til det observerte resultat, er det kun risikoen for overvurdering som inngår i tabelloppslaget, mens stikkprøvestørrelsen inn går i etterregningen. De øvrige størrelser nevnt i forrige avsnitt inngår i planleggingen av stikkprøvestørrelsen, og dersom Tabell 2.2 brukes i sam menheng med Tabell 2.1, får vi også den nødvendige garanti mht. risiko for undervurdering. Merk imidlertid at Tabell 2.2 gir øvre grenser med en øns ket risiko for overvurdering (som jo er det primære for den eksterne revisor)
KAPITTEL 2 : Systemrevisjon
38
Tabell 2.2: Øvre grenser for n x avvikshyppighet Observert antall kontrollavvik 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Risiko overvurdering (/?) 1% 4.61 6.64 8.41 10.05 11.61 13.11 14.58 16.00 17.41 18.79 20.15 21.49 22.83 24.14 25.45 26.75 28.04 29.31 30.59 31.85 33.11
2.5% 3.69 5.58 7.23 8.77 10.25 11.67 13.06 14.43 15.77 17.09 18.40 19.68 20.97 22.24 23.49 24.75 25.99 27.22 28.45 29.68 30.89
5% 3.00 4.75 6.30 7.76 9.16 10.52 11.85 13.15 14.44 15.71 16.97 18.21 19.45 20.67 21.89 23.10 24.31 25.50 26.70 27.88 29.07
10% 2.31 3.89 5.33 6.69 8.00 9.28 10.54 11.78 13.00 14.21 15.41 16.60 17.79 18.96 20.13 21.30 22.46 23.61 24.76 25.91 27.05
15% 1.90 3.38 4.73 6.02 7.27 8.50 9.71 10.90 12.08 13.25 14.42 15.57 16.72 17.86 19.00 20.13 21.26 22.39 23.51 24.63 25.74
20% 1.61 3.00 4.28 5.52 6.73 7.91 9.08 10.24 11.38 12.52 13.66 14.78 15.90 17.02 18.13 19.24 20.34 21.44 22.54 23.64 24.73
2.6 Konklusjoner og konsekvenser
39
uansett hvordan revisor har fastlagt stikkprøvens størrelse. Eksempel 1: Anta at høyeste tolererbare hyppighet av kontrollavvik er 10%, og at stikkprøven er planlagt med 5% risiko for overvurdering. La oss si at i en stikkprøve på n=78 enheter (jfr. Tabell 2.2) observeres 2 enheter med kontrollavvik. Anslått hyppighet av kontrollavvik i populasjonen er dermed 2.6%, med øvre grense lik
78
= 0.081 dvs. 8.1%
som er nedenfor grensen for det høyest tolererbare. Observeres isteden 4 en heter med kontrollavvik er anslått hyppighet isteden 5.1%, med øvre grense lik 9 16 = 0.117 dvs. 11.7% 78 som er ovenfor grensen for det høyest tolererbare. Observeres 3 enheter er også populasjonen akseptabel, noe som allerede er antydet i Tabell 2.1. Merknad. Den beregnede øvre grense for hyppigheten av kontrollavvik i populasjonen er en såkalt konfidensgrense. Grensene i Tabell 2.2 er i virke ligheten øvre konfidensgrenser for en forventning til et observert antall, når dette antall antas å være Poissonfordelt. Sammenhengen med den fore liggende problemstilling er redegjort for i del II: Kapittel 9.2. Konfidens grenser fanger opp den ukjente med en viss sannsynlighet, kalt konfidensnivået. Her er vi bare interessert i en ensidig konfidensgaranti, og et (en sidig) konfidensnivå på 95% betyr at sjansen er 95% for at den øvre konfidensgrensen faller ovenfor den virkelige hyppighet av kontrollavvik, dvs. en risiko på 5% for at den faller nedenfor den virkelige hyppighet. Dersom vi har en populasjon der hyppigheten av kontrollavvik er over det høyest tolererbare, vil risikoen for at vi likevel aksepterer stikkprøven være høyst 5%. Slik vi benytter den øvre konfidensgrensen, vil derfor risikoen (3 for overvurdering være 1 — c, der c er (det ensidige) konfidensnivået.
2.6
Konklusjoner og konsekvenser
Utfallet av den analyse av stikkprøven som er beskrevet ovenfor, vil være at den beregnede øvre grensen for hyppigheten av kontrollavvik i populasjonen er: enten (1) blant de tolererbare hyppigheter
KAPITTEL 2 : Systemrevisjon
40
• eller (2) over den høyeste tolererbare hyppighet
Utfall (1) er uproblematisk, idet revisor da har fått bekreftet at klientens kontroll er til å stole på, slik at en kan gå videre som planlagt. Utfall (2) kan være problematisk, og krever en prinsipiell diskusjon. La oss illustrere med tre eksempler på utfall i en figur. Forventet
Høyest tolererbar
w
t t2
P
Anslag
| y
t T2
hyppighet kontrollavvik
F
Øvre grense
I alle tre eksemplene er anslaget på hyppigheten av kontrollavvik større enn forventet. Vi har et eksempel på (1) og to eksempler på (2), merket hen holdsvis 2 og 2’. I eksempel 2 er anslaget ikke langt fra forventet hyppighet og betydelig lavere enn høyest tolererbar hyppighet. I eksempel 2’ er anslaget betydelig over forventet hyppighet og ikke langt fra den høyest tolererbare. I eksempel 2 ligger det i luften at klientens kontroll er akseptabel, men at den (foreløpig) negative konklusjon bare skyldes at vi har for stor sikkerhetsmar gin. En noe større stikkprøve ville kunne gi mindre sikkerhetsmargin, slik at det er en betydelig sjanse for at den beregnede øvre konfidensgrensen for hyppigheten da ville ha falt nedenfor den høyest tolererbare. I eksempel 2’ fortoner situasjonen seg annerledes. Sjansen for å få en tolererbar øvre grense er liten, med mindre en utvider stikkprøven betydelig. Dette er ikke aktuelt med mindre fordelen med å få bekreftet denne kontrollen hos klienten står i forhold til ekstraarbeidet, noe det neppe gjør dersom hyppigheten av kon trollavvik likevel anslås til å være nær oppunder grensen for det tolererbare. I litteraturen finner en ulike anbefaleringer på dette punkt: • Utvid aldri stikkprøven, reduser heller avhengigheten av kontrollen ved detaljrevisjonen.
• Utvid stikkprøven dersom en kostnads-nyttevurdering tilsier det, for om mulig, å kunne bygge på kontrollen likevel. Tabellene ovenfor forutsetter at utvalgsplanen bare omfatter ett trinn.
2.7
Kritiske merknader
Selv om metoden beskrevet ovenfor er anbefalt av den amerikanske revi sororganisasjonen AICPA, kan det knyttes en del kritiske merknader til den.
2.7 Kritiske merknader
41
Metoden gir ingen direkte ryggdekning for evt. å kunne påstå med tyngde at klientens kontroll er dårlig. Dette kunne vi gjøre dersom vi også hadde en nedre konfidensgrense, og denne viser seg å være over den høyest tol ererbare hyppighet av kontrollavvik. Nå er muligens dette ikke noen vesentlig innvending her, idet metoden er ment å fungere i den (meget spesielle) situ asjon en ekstern revisor er i forut for en detaljrevisjon, med hovedvekt på å unngå å tillegge det interne kontrollsystemet kvaliteter det ikke har. Tabeller som ser bort fra risikoen for undervurdering er populære i prak sis, delvis fordi de anviser små stikkprøver. Bruken av slike tabeller inne bærer imidlertid en del problemer, og ved ukritisk bruk vil tabellgarantiene kunne være illusoriske. Tabellene er laget slik at forventet hyppighet av kontrollavvik bestemmer den minste stikkprøvestørrelse som gir øvre konfi densgrense akkurat i underkant av den høyest tolererbare, slik at vi kan få bekreftet klientens kontroll med minst mulig ressurser. Dersom hyppigheten av kontrollavvik i stikkprøven er som forventet eller mindre, er saken grei. Selv om hyppigheten i populasjonen er som forventet, er sjansen stor (ca. 50%) for at hyppigheten i stikkprøven er større, med betydelig risiko (opptil 50%) for at konfidensgrensen faller over den høyest tolererbare hyppighet. Dersom en syns det er ubehagelig å løpe såpass stor risiko for undervur dering av klientens kontroll, må en nok ta noen flere observasjoner enn det tabellene foreskriver, f.eks. ved at en planlegger en øvre konfidensgrense som ligger noe lavere enn grensen for det tolererbare, risikoberegnet under forut setningen om forventet hyppighet av kontrollavvik. Dette lar seg imidlertid gjennomføre på en systematisk og rasjonell måte ved eksplisitte beregninger også av risikoen for undervurdering (ct-risiko). Dersom revisors plan omfatter muligheten for å utvide stikkprøven, og vi bruker de samme beregningstabeller for øvre konfidensgrense i begge trinn, vil risikoen for overvurdering av den interne kontroll være noe høyere enn den tabellgarantien gir (en dårlig populasjon får en ny sjanse til å bli erklært akseptabel). På den annen side vil risikoen for undervurdering av den interne kontroll bli lavere (som vel var hensikten med utvidelsen). Utvalgsplaner med to eller flere trinn krever egne tabeller utarbeidet for dette formålet (se Arkin (1982)). Dersom en systemtest ikke tillater positiv konklusjon angående klientens utførelse av en etablert kontrollrutine, vil ikke dette nødvendigvis bety at vesentlige feil finnes i klientens tallmessige oppgaver. En ekstern revisor vil naturlig nok være interessert i i hvilken utstrekning en svak intern kontroll virkelig medfører vesentlige beløpsmessige feil, og helst få tallfestet denne risikoen. Da vil revisor kunne foreta en mer presis vurdering av den risiko som kan tolereres ved detaljrevisjon og eventuell annen supplerende revisjon,
42
KAPITTEL 2 : Systemrevisjon
se Kapittel 5. Selv om risikoen for feilkonklusjoner ved systemtesten er tallfestet ved a- og /3-risiko, er det ingen entydig overgang herfra til risikoen for vesentlig feil. Dette koordineringsproblemet er avgjort en ulempe ved denne form for systemtesting, og alternative angrepsmåter kan komme på tale. En mulighet er knyttet direkte til den evaluering av beløpsmessige feil som tas opp i neste kapittel. En annen mulighet er å gjøre bruk av Bayesiansk tankegang, se del II : Kapittel 12.
Kapittel 3
Detaljrevisjon 3.1
Målsetting
Med detalj revisjonen tar den eksterne revisor sikte på å utføre konkrete regnskapsmessige verifikasjoner hos klienten av et omfang som gir tilstrekke lig grunnlag for en oppfatning av regnskapenes formelle og beløpsmessige riktighet. Det primære målet er å kunne bekrefte klientens regnskapsopp lysninger, med tilstrekkelig grad av sikkerhet, overfor brukere av klientens regnskaper, det være seg aksjonærer eller det offentlige. Slike verifikasjoner vil bl.a. omfatte transaksjoner, eiendeler og forpliktelser (gjeld). Revisor ønsker å vite om registrerte transaksjoner er reelle, om reelle transaksjoner er registrert, om transaksjonene er korrekt verdsatt (beløp) og korrekt klassi fisert (konto). Videre ønsker revisor å få verifisert eksistens og fullstendighet, samt korrekt tilhørighet av eiendeler og forpliktelser. Den eksterne revisors detaljrevisjon vil som regel bestå av et revisjons program der ulike aspekter og regnskapstall etter tur settes i fokus. Regn skapsverifikasjoner basert på stikkprøver kalles ofte detaljtester, eller substanstester. Planleggingen av hver enkelt detaljtest vil vanligvis omfatte følgende punkter: 1. Fastlegge målsettingen med detaljtesten. 2. Fastlegge populasjonen og utvalgsenhetene, og hvilke egenskaper ved disse som skal observeres.
3. Fastlegge utvalgsmetoden.
4. Fastlegge stikkprøveomfanget. 5. Fastlegge metoden for analyse av stikkprøven. 43
44
KAPITTEL 3 : Detaljrevisjon
Vi har ovenfor omtalt målsettingene i videste forstand, men vil i det etter følgende legge mest vekt på testing av regnskapstallenes beløpsmessige rik tighet. Mindre avvik, innen en vesentlighetsgrense, kan tolereres i de rap porterte tall. Disse vil som regel være aggregerte størrelser, og eventuelle feil og mangler i underlagsmaterialet (feilposteringer e.l.) har mindre inter esse, dersom disse ikke medfører at de rapporterte tall må justeres utover vesentlighetsgrensen. Når det gjelder å avdekke forhold som bryter med god regnskapsskikk, regner vi med at dette dels hører under målsettingen for systemtester, men det vil også være situasjoner der dette aspekt ivaretas som del av en detaljtest, isåfall kan vi tale om en flermålstest (”dual purpose test”). Når det gjelder beløpsmessige verifikasjoner, vil målet kunne være å bekrefte, hvis mulig, at den beløpsmessige feil i forbindelse med et bestemt regnskapstall ligger innenfor vesentlighetsgrensen, selv når en tar omsyn til den usikkerhet som ligger i at revisor anslår den beløpsmessige feil på grunnlag av stikkprøver. For enkelte regnskapstall er det bare feil i en bestemt retning som revisor trenger å vie oppmerksomhet. Dette skyldes at klien ten hverken har fordel av, eller at brukere av klientens informasjon kan bli vesentlig villedet dersom feilen går motsatt vei. Målsettingen kan da være å lage en test for å få bekreftet at overrapportering evt. underrapportering ut over en vesentlighetsgrense ikke er sannsynlig, selv når en tar omsyn til den usikkerhet som ligger i at revisor anslår den beløpsmessige feil på grunnlag av stikkprøver. I situasjoner der det er tale om skjønnsmessige verdifastsettelser (f.eks. varelager og eiendeler), vil overvurdering evt. undervurdering være mer tjenlige betegnelser.
3.2
Utvalgsenheter og populasjon
Forut for en test knyttet til et bestemt (aggregert) regnskapstall må ut valgsenhetene defineres presist, og mest mulig hensiktsmessig i forhold til målsettingen for testen. Utvalgsenheter kan typisk være:
• kontobalanser • fakturaer eller bilag • enkeltposter på fakturaer eller bilag • enkeltposter i journaler
I noen tilfeller er det klart hva utvalgsenhetene bør være, i andre situasjoner står en overfor et valg. Et eksempel: Dersom revisor undersøker utestående
3.2 Utvalgsenheter og populasjon
45
fordringer ved å be om bekreftelser fra kunder, vil kontobalanser ikke nød vendigvis være mest hen siktsmessig som utvalgsenhet. Ifall kunden ikke bekrefter balansen, vil revisor i neste omgang måtte gå inn på de enkelt fak turaer som inngår i balansen, og da kan det være mer hensiktsmessig å ha disse som utvalgsenheter fra starten av. Revisor bør i denne sammenheng også vurdere hva slags forepørsler som det er størst sjanse for at kundene besvarer, ut fra kjennskap til tilgjengelighet og vanlige arbeids rutiner. Klienters arbeidsrutiner og lagringsmåter vil også kunne spille en rolle for revisors valg. I enkelte sammenhenger er det mulighet for at kontobalanser er positive, negative og null. Eksempelvis kan man ha salg på kreditt, og forhånds betaling for senere leveringer. Målsettingen ved testing av debet og kredit balansene kan være ulik, slik at disse defineres som to separate populasjoner som testes hver for seg. Ved valg av utvalgsenheter og populasjon må revisor vurdere muligheten for at en transaksjon ikke er registrert, dvs. faren for at populasjonen ikke er fullstendig. Dette vil spesielt være aktuelt i situasjoner der revisor tester for underrapportering. Eksempelvis vil en kunne bruke forsendelsesdokumenter som utvalgsenheter ved testing av salg, dersom klienten kan ha unnlatt å bokføre salget. I noen situasjoner vil revisor ha en bestemt populasjon i tankene, f.eks. en klasse av transaksjoner, men av praktiske grunner trekkes stikkprøven fra en antatt fysisk representasjon av populasjonen, f.eks. en journal. Ifall det skulle vise seg at den fysiske representasjon ikke er full stendig, må enten populasjonen redefineres eller de utelatte transaksjoner undersøkes særskilt. I enkelte situasjoner ønsker revisor å granske spesielle utvalgsenheter som på forhånd er antatt å være risikofylte. Det gjelder f.eks. ved testing av overvurdering av bokførte verdier, der poster med bokført verdi større enn vesentlighetsgrensen bør undersøkes i alle fall. Det kan da være hensikts messig å holde disse utvalgsenhetene utenfor populasjonen, og la denne bare omfatte de utvalgsenhetene som det virkelig trekkes fra. Dette vil imidlertid i noen grad være avhengig av trekningsmåten. Også ved detaljrevisjon må revisor ofte tenke seg populasjonen før den foreligger, og dens størrelse er kjent. Ønsker revisor å ta fatt på revisjons arbeidet før fullstendige regnskapstall foreligger, vil enkelte utvalgsmetoder kreve antakelser om de manglende utvalgsenheter, f.eks. antall og omtrentlig størrelse på transaksjoner som dukker opp senere, og som skal være med. For andre utvalgsmetoder er dette ikke nødvendig. Vi vil i det følgende anta at det til hver utvalgsenhet i populasjonen er registrert et beløp, og at revisor er interessert i de beløpsmessige feil, som
46
KAPITTEL 3 : Detaljrevisjon
kan være enten null, positive eller negative, med den totale beløpsmessige feil som hovedinteresse.
3.3
Utvalgsmetoden
Eksakte beregninger av usikkerheten ved bruk av stikkprøver til å trekke konklusjoner om de beløpsmessige feil i populasjonen, forutsetter at stikk prøven trekkes som et sannsynlighetsutvalg, dvs. i samsvar med veldefinerte sannsynlighetsprinsipper. I denne forbindelse må en vurdere om alternativer til enkle tilfeldige utvalg kan være mer tjenlig. Vi vil diskutere dette tema under forutsetning av at det er mulig overrapportering (overvurdering) som er i revisors søkelys. Vi antar at en total overrapportering vil kunne tilbakeføres til én, et fåtall eller mange av utvalgsenhetene i populasjonen. Det er klart at utvalgs enheter med stor registrert verdi innebærer en større individuell risiko for revisor, enn de med liten registrert verdi. På den annen side kan en overrap portering i mange utvalgsenheter med små registrerte verdier samlet, kunne overskride vesentlighetsgrensen. En trenger derfor en utvalgsmetode som gir brukbar beskyttelse mot begge disse muligheter. Et aktuelt alternativ til enkle tilfeldige utvalg er å trekke ut utvalgsenheter fra populasjonen med sannsynligheter som øker med rapportert verdi, f.eks. proporsjonale med rapportert verdi. Det fins mange måter å gjøre dette på, og i revisjon har man spesielt fattet interesse for såkalte pengeenhetsstikkprøver (” Monetary Unit Sampling”). I litteraturen brukes en rekke andre navn, bl.a. ”DollarUnit Sampling (DUS)”, ”Cumulative Monetary Amount (CMA) sampling” og "Combined Attribute Variable (CAV) sampling”. Et fellestrekk for de utvalgsmetoder som går under betegnelsen pengeen hetsstikkprøver, er at en tenker seg utvalgsenhetene i populasjonen stykket opp i sine enkelte kroneenheter. Hver kroneenhet kan betraktes som et ”lodd” som er med i en trekning, dvs. at hver utvalgsenhet får et antall lodd lik dens rapporterte verdi, og det samlede antall lodd blir da lik total rapportert verdi for enhetene i populasjonen. Det foretas så en lodd trekning av et visst antall "vinnerlodd”, og de utvalgsenheter som ”eier” vinnerloddene utgjør stikkprøven. Spørsmålet er da hvordan en slik loddtrekning mest hensiktsmessig skal utføres. Flere muligheter foreligger, vi nevner her: a. Tilfeldig pengeenhetsutvalg.
b. Tilfeldig intervallutvalg. c. Fast intervallutvalg med tilfeldig start.
47
3.3 Utvalgsmetoden
d. Tilfeldig celleutvalg.
Før vi forklarer disse metodene i detalj, vil vi se på en nyttig betrakt ningsmåte: Vi tenker oss at utvalgsenhetene i populasjonen er ordnet i rekkefølge, hvor loddnumre tildeles i henhold til kumulativ rapportert verdi. I mange situasjoner er utvalgsenhetene i utgangspunktet ordnet slik, f.eks. fakturaer eller konti ordnet etter nummer, eller datafiler ordnet etter linjenummer eller record-nummer. La oss illustrere med et (noe urealistisk) eksempel: Eksempel 1: En journal omfatter 8 konti:
Kontonr. 1 2 3 4 5 6 7 8
Bokført verdi 280 120 50 520 140 100 120 170
Kumulativ verdi 280 400 450 970 1110 1210 1330 1500
Dette betyr at vi får en situasjon med ialt 1500 lodd hvor konto nr. 1 får loddnumrene fra 1 til 280, mens konto nr. 2 får loddnumrene fra 281 til 400 osv. Det kan også være instruktivt å illustrere utvalgsenhetene på tallinjen som linjestykker proporsjonale med rapporterte verdier: 1
2
3
4
5
6
7
8
|_______ I___ l_l_______ ________ I——I--1--- 1---- 1 0
1500
La oss nå ta for oss den første typen utvalg nevnt ovenfor: a. Tilfeldig pengeenhetsutvalg: Denne typen stikkprøver utføres ved å trekke det nødvendige antall vinnerlodd tilfeldig blant alle lodd. Dette kan gjøres på samme måte som beskrevet i avsnitt 2.3. Med denne trekningsmåten oppnår en bl.a. at hver utvalgsenhet blir trukket ut med sannsyn lighet proporsjonal med rapportert verdi. Utvalg med denne egenskapen blir gjerne kalt et PPS-utvalg (” Sampling with Probabilities Proportional to Size”, se del 11:5.1-2 for mer inngående drøfting.) La oss si at vi ønsker
48
KAPITTEL 3 : Detaljrevisjon
en stikkprøve med tre utvalgsenheter fra populasjonen i eksemplet ovenfor, og anta at de uttrukne vinnerlodd ble 247, 832 og 1215 (hvilken rekkefølge vinnerloddene kom ut i spiller ingen rolle). Dette betyr at konto nr.l, nr.4. og nr.7 er trukket ut for gransking. Det viser seg at det som betyr noe for planleggingen av stikkprøveomfanget ved de metodene vi har tatt for oss, er forholdet mellom rapportert verdi og stikkprøvestørrelsen, noe misvisende kalt utvalgsintervallet. Eksempelvis vil en total rapportert verdi på kr. 150 000.- med stikkprøvestørrelse på n=50, gi et utvalgsintervall lik kr. 30 000.. Dette betyr at i gjennomsnitt vil hver 30.000 kroneenhet (loddnummer) bli trukket ut. Dersom situasjonen skulle kreve et utvalgsintervall på kr. 20.000,-, betyr det at stikkprøven må økes til n=75. Utvalgsintervallet kan for de fleste aktuelle utvalgsmetoder oppfattes som forventet avstand mel lom etterfølgende vinnerlodd i loddtrekningen. En interessant mulighet er å bruke dette direkte i selve loddtrekningen, og de tre øvrige metodene vi skal ta for oss gjør nettopp det. b. Tilfeldig intervallutvalg: Denne typen utvalg realiseres ved å bestem me avstanden til neste vinnerlodd ved trekninger fra den eksponensielle fordeling med forventning lik utvalgsintervallet, se del II: 5.2. For at de siste kroneenhetene i populasjonen skal få samme sjanse som de tidlige, kan en ikke binde seg til et fast antall observasjoner, noen ganger må en ta noen flere for å ''uttømme” populasjonen, noen ganger kan en nøye seg med færre. Forventet antall utvalgsenheter i stikkprøven vil imidlertid være det samme som for et tilfeldig pengeenhetsutvalg, og teoretisk sett er det så godt som likeverdig med dette, med PPS-egenskapen i behold. Anta at vi i eksemplet ovenfor ønsker utvalgsintervall lik 500 (=1500/3), og at en serie trekninger fra den eksponensielle fordeling med forventning 500 ga i rekkefølge 158, 402, 52, 816, 713, ... . De uttrukne vinnerlodd blir da 158, 158 + 402 = 560, 560 + 52 = 612, 612 + 816 = 1428. Dette gir oss i rekkefølge kontiene nr. 1, nr. 4, nr. 4 og nr. 8. Legg merke til at vi tilfeldigvis fikk plass til fire vinnerlodd, mens forventet antall var tre. Merk også at tilfeldigvis hadde konto nr. 4 to av vinnerloddene, et forhold vi skal diskutere nærmere senere. Denne mulighet foreligger også ved enkle pengeenhetsstikkprøver.
c. Fast intervallutvalg med tilfeldig start (også kalt systematisk ut valg): Her velges første vinnerlodd tilfeldig blant numrene fra 1 til og med nummeret lik utvalgsintervallet, mens de øvrige vinnerlodd velges med faste avstander lik utvalgsintervallet. I eksemplet ovenfor med 500 som utvalgs intervall trekker vi først et tilfeldig lodd blant numrene 1 til og med 500. Anta at det uttrukne lodd var nr. 445. De øvrige vinnerlodd skal da være
49
3.3 Utvalgsmetoden
445 + 500 = 945 og 945 + 500 = 1445. Dette betyr at de utvalgte konti er nr. 3, 4 og 8. Trekningsmåten har sine betenkelige sider dersom det er periodisiteter som faller sammen med utvalgsintervallet både med hensyn til størrelse av rapporterte verdi og overrapporteringer. En regner imidlertid ikke at dette er noe stort problem i praksis. Utvalg av den beskrevne type oppfyller ikke kravet til et PPS-utvalg, eksempelvis vil alle utvalgsenheter med verdi større enn utvalgsintervallet ha samme sannsynlighet (nemlig 1) for å bli trukket ut uansett størrelse. En regner imidlertid med at risikoen for feilkonklusjoner ikke er vesensforskjellig fra et PPS-utvalg, så lenge en utviser omtanke ved evalueringen av resultatet.
d. Tilfeldig celleutvalg: Her deler en først alle loddnumrene fra lodd nr. 1 og oppover inn i grupper av lengde lik utvalgsintervallet, hvoretter et vinnerlodd velges tilfeldig fra hver gruppe. I eksemplet ovenfor med 500 som utvalgsintervall får vi: 1
2
3
4
5
6
7
8
I-------- 1—•-H----------------H—1—1----- 1 0
500
1000
1500
Anta at trekningen av et tilfeldig lodd i hver av gruppene 1-500, 501-1000 og 1001-1500 ga vinnernumre henholdsvis 376, 514 og 1105. Disse hører til konto nr. 2, 4 og nr. 6. Heller ikke denne typen utvalg oppfyller kravet til et PPS-utvalg, men også her regner en med at risikoen for feilkonklusjoner ikke er vesensforskjellig fra slike.
Selv om det fra et teoretisk synspunkt ville vært mest tilfredsstillende at utvalget blir trukket i samsvar med a eller b som et PPS-utvalg, blir ut valg av type c eller d nok oftere anvendt i praksis, dels fordi mange anser disse for å være enklere å gjennomføre, uten at risikoen for feilkonklusjoner er vesensforskjellig. Et moment til fordel for c kan også være at dersom utvalgsintervallet er mindre enn vesentlighetsgrensen, så vil alle utvalgsen heter større enn denne være sikret å komme med. Hva med d? Imidlertid vil en kunne hevde at slike utvalgsenheter bør tas ut av populasjonen på forhånd, og granskes uansett, slik at populasjonen kun består av enheter med rapportert verdi mindre enn vesentlighetsgrensen. Merk at dersom dette gjøres, vil en med utvalg av type c aldri oppleve at samme konto har mer enn ett vinnerlodd, noe som ville kreve spesiell omtanke ved evaluering av resultatet. Hva med d? For metodene beskrevet nedenfor vil stikkprøvestørrelsen avhenge av
50
KAPITTEL 3 : Detaljrevisjon
populasjonen bare via utvalgsintervallet. En utvalgsmetode som baserer seg på dette direkte (som b, c og d) åpner en interessant mulighet. Revisor kan starte sin detaljrevisjon før rapportert verdi av de siste utvalgsenhetene foreligger, ja endog før antall utvalgsenheter i populasjonen er kjent. En kan f.eks. ved utgangen av september ta for seg de transaksjoner som forelig ger i rekkefølge til da, og fortsette etter som nye foreligger. Den endelige stikkprøvestørrelsen vil da automatisk bli tilpasset en utvikling som ikke er kjent når detalj revisjonen startet.
3.4
Stikkprøvestørrelsen
Ved planlegging av hensiktsmessig stikkprøvestørrelse ved en bestemt detaljtest, må revisor ta utgangspunkt i målsettingen med testen. Vi vil fortsatt anta at målsettingen er å få bekreftet at overrapportering av et gitt regn skapstall ut over en vesentlighetsgrense ikke er sannsynlig. Revisor ønsker ikke å utføre en mer omfattende detalj test enn nødvendig for å oppfylle sin målsetting, men må i denne sammenheng vurdere:
• faren for å akseptere vesentlig overrapportering (/3-risiko) • faren for å reagere på uvesentlig overrapportering (o- risiko) Revisor risikerer feilaktig å akseptere det rapporterte regnskapstall, fordi stikkprøven tilfeldigvis kan inneholde få og små overvurderinger, på tross av at populasjonen inneholder overvurderinger i antall og/eller omfang som samlet overskrider vesentlighetsgrensen. På den annen side risikerer revi sor feilaktig å reagere på det rapporterte regnskapstall, fordi stikkprøven tilfeldigvis kan inneholde overvurderinger i antall og omfang som ikke er representative for populasjonen som helhet. Feilaktig reaksjon angår både klienten og revisor med unødig intern oppfølging og eventuelle korreksjoner. Det vil også kunne angå regnskapenes brukere, dersom revisor velger å avgi negative utsagn i sin beretning, uten intern oppfølging med sikte på korreksjon. En slik framgangsmåte synes imi dlertid lite aktuell i praksis. Feilaktig aksept vil i stor grad angå brukere av regnskapstallene. Ut fra revisors hovedoppgave, å stå som garantist for disse, vil kontroll med denne risiko måtte stå sentralt i revisors vurderinger med hensyn til stikkprøvestørrelser. Dersom analysen av stikkprøven utføres som i neste avsnitt, vil følgende fem faktorer kunne inngå i bestemmelsen av nødvendig stikkprøvestørrelse: total rapportert verdi (w)
3.4 Stikkprøvestørrelsen
51
• høyeste tolererbar total overrapportering (h) • tolererbar risiko for feilaktig aksept (/?) • tolererbar risiko for feilaktig (negativ) reaksjon (o) • ventet overrapportering De tre første faktorene er de mest sentrale, og det er relativt enkelt å bestemme en minste stikkprøvestørrelse for gitte verdier av disse faktorene (w,h,/3). Vi har nemlig w■L
der L er en risikofaktor, som for gitt /3 er bestemt ved
/3-risiko 1% L-faktor 4.61
2.5% 5% 3.69 3.0
10% 2.31
15% 1.90
20% 1.61
Merk at formelen innebærer at utvalgsintervallet (w/n) kan høyst være lik h/L.
Eksempel 1: Dersom høyeste tolererbare overrapportering er kr. 120 000 og tolererbar risiko for feilaktig aksept er 5%, blir utvalgsintervallet lik 120 000/3 = 40 000. Dersom total rapportert verdi er 4.0 mill, kr., må stikkprøvestørrelsen velges minst lik 4 000 000/40 000 = 100. Beregningen forutsetter at rapportert verdi aksepteres når stikkprøven er uten overrapporteringer, ellers ikke. Med feilfri stikkprøve er w • L/n en øvre (konfidens-) grense for overrapporteringen, og vi ser at n er bestemt slik at denne er høyst lik h, den høyeste tolererbare overrapportering. Med likhet oppnår en at populasjonen aksepteres med minst mulig bruk av ressurser. Dette innebærer imidlertid at man helt ser bort fra risikoen a for feilaktig (negativ) reaksjon, og stikkprøven bør nok økes noe ut over det beregnede minimum, som er nødvendig for å oppfylle de øvrige krav. Det er dessverre ikke enkelt å tilrettelegge formler eller tabeller som tar omsyn til o-risikoen, idet denne avhenger av feilstrukturen i populasjonen, som ikke lar seg uttrykke i enkle termer. En bekvem, men noe grov fram gangsmåte er å bruke Tabell 2.1 med tolererbar overrapportering i prosent av populasjonen og forventet overrapportering i prosent av den tolererbare som inngangsverdier til tabellen.
52
KAPITTEL 3 : Detaljrevisjon
Eksempel 2: Med tallene fra foregående eksempel får vi at tolererbar over rapportering er 3.0% av populasjonen (120 000/4 000 000). Dersom forventet overrapportering er 24 000, blir dette 20% av den tolererbare (24 000/120 000). Med /3-risiko lik 5%, gir Tabell 2.1 at stikkprøven må økes fra n=100 til n = 159 for å få redusert a- risikoen til 30%, mens en reduksjon til 10% vil kreve hele n — 259. Merk forøvrig at med forventet overrapportering lik 0% gir Tabell 1 en stikkprøve på n=100 uansett krav til o-risiko (når krav til /3-risiko er 5%).
Den tolererbare /3-risiko ved en detaljtest vil avhenge av revisors vur dering av risikoen for at vesentlige beløpsmessige feil foreligger, og om sup plerende revisjonshandlinger blir utført som også kan fange opp eventuelle feil, f.eks. analytisk revisjon. Det er klart at med et godt internt kontroll system, som ved en systemtest viser seg å ha fungert etter sin hensikt, vil en kunne tillate en høy /3-risiko, spesielt dersom også supplerende revisjons handlinger nyttes. Mange mener imidlertid at en aldri bør tolerere mer enn 25% /3-risiko, selv om noen åpenbart tolererer opptil 50% risiko i visse til feller. På den annen side er det sjelden aktuelt å kreve en lavere /3-risiko enn 1%. Sagt på en annen måte er aktuelle konfidensnivåer fra 75% til 99%.
3.5
Analyse av stikkprøven
Vi forutsetter at stikkprøven er trukket etter en av de metodene som er beskrevet ovenfor. Etterat de utvalgsenheter som utgjør stikkprøven er grans ket med hensyn til overrapportering, noteres overrapporteringen i % for hver av disse. Den gjennomsnittlige overrapportering multiplisert med totalt rap portert beløp, vil være et mulig anslag på overrapporteringen i det totale rapporterte beløp (se del II: Kapittel 10.1).
Eksempel 1: Fra en populasjon av konti med samlet bokført verdi lik kr. 800 000.-, trekkes en stikkprøve på 20 konti der det viste seg at tre konti var overrapporterte: Konto nr. 19 83 135
Bokført 8 000 5 000 12 000
Revidert 3 200 0 9 600
Overrapportert 4 800 5 000 2 400
Prosent 60% 100% 20%
For konto nr. 19 gjelder f.eks. at overrapporteringen i prosent av bokført beløp (ikke av revidert beløp!) er bestemt ved (8 000 - 3 200)/8 000 = 4 800/8
3.5 Analyse av stikkprøven
53
000 = 0.60, dvs. 60%. For de resterende 17 konti er overrapporteringen å regne for 0%. Gjennomsnittlig overrapportering i stikkprøven er 9% bestemt ved: • (0.60 + 1.00 + 0.20 + 0.00 + • + 0.00) = 0.09 Anslaget for den totale overrapportering blir derfor 9% av kr. 800 000.-, dvs. kr. 72 000.-.
Selv om revisors anslag for den totale overrapporteringen er mindre enn den høyest tolererbare, er revisor utsatt for en utvalgsrisiko. Det kan hende at den totale overrapportering i populasjonen er over den høyest tolererbare, men at vi tilfeldigvis har unngått å fange opp enkelte store overrapporteringer (eller flere små) i stikkprøven. En garderer seg mot dette på følgende vis: Beregn en øvre grense for den totale overrapportering i popu lasjonen, og konkluder at populasjonen er akseptabel bare når denne grensen er mindre enn eller lik vesentlighetsgrensen, dvs. grensen for den høyeste tolererbare overrapportering. Denne framgangsmåten er i tråd med den eksterne revisors hovedoppgave, å kunne bekrefte klientens tall, innenfor en viss toleranse, såfremt stikkprøven gjør det mulig med en viss sikkerhetsgaranti. Hvordan revisor skal forholde seg dersom den øvre grense for den totale overrapportering er over vesent lighetsgrensen, vil avhenge noe av omstendighetene, og vil bli tatt opp avs lutningsvis. Når det gjelder beregningen av øvre grense for overrapporteringen, kan en legge an to betraktningsmåter:
Øvre grense
=
Anslag
4-
Feilmargin (presisjon)
Øvre grense
—
Basismargin
+ +
Anslag overrapportering Tilleggsmargin
Den første betraktningsmåten er i samsvar med tankegangen i statistisk teori forøvrig for beregning av (øvre) konfidensgrense. Den andre betrakt ningsmåten har imidlertid visse fortrinn i revisjonssammenheng. Basismarginen betegner den feilmargin som kreves selv om stikkprøven er uten overrapporteringer. Disse uoppdagede overrapporteringer kan godt være 100% overrapporteringer. Dersom vi finner overrapporteringer, må vi først legge til det ut fra stikkprøven beregnede anslag for overrrapporteringen i hele populasjonen. Oppdagede overrapporteringer indikerer også en økt risiko
KAPITTEL 3 : Detaljrevisjon
54
Tabell 3.1: Faktorer ved beregning av feilmarginer
Margin Basis Tillegg 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Tolererbar risiko for feilaktig aksept /3 1% 2.5% 5% 10% 15% 20% 4.61 3.69 3.00 2.31 1.90 1.61 1.03 0.89 0.75 0.58 0.48 0.39 0.77 0.65 0.55 0.44 0.35 0.28 0.64 0.54 0.46 0.36 0.29 0.24 0.56 0.48 0.40 0.31 0.25 0.21 0.50 0.42 0.36 0.28 0.23 0.18 0.47 0.39 0.33 0.26 0.21 0.17 0.42 0.37 0.31 0.24 0.19 0.16 0.41 0.34 0.29 0.22 0.18 0.15 0.38 0.32 0.27 0.21 0.17 0.14 0.36 0.31 0.26 0.20 0.17 0.13 0.34 0.29 0.24 0.19 0.16 0.12 0.33 0.28 0.23 0.19 0.15 0.12 0.31 0.27 0.22 0.18 0.14 0.11 0.31 0.26 0.21 0.17 0.14 0.11 0.30 0.25 0.20 0.17 0.13 0.10 0.30 0.24 0.20 0.16 0.13 0.10 0.29 0.23 0.19 0.15 0.12 0.10 0.28 0.23 0.19 0.15 0.12 0.10 0.27 0.22 0.18 0.15 0.12 0.09
for uoppdagede overrapporteringer ut over dette anslaget. En legger derfor også til en tilleggsmargin som øker med antall funne overrapporteringer og deres størrelse. Vi ser derfor at vi kan skrive Feilmargin = Basismargin + Tilleggsmargin
Ulike måter for beregning av øvre grenser for overrapportering finnes i litter aturen. Vi skal her presentere en relativt enkel metode som gir en tilnærmet, men litt konservativ sannsynlighetsgaranti mht. risikoen for feilaktig aksept av populasjonen (/3-risiko). Beregningen foretas ved hjelp av Tabell 3.1, hvor en velger kolonne i samsvar med ønsket /3-risiko. Basismarginer fås ved å multiplisere faktoren i basislinjen i tabellen med utvalgsintervallet. Tilleggsmarginer får en ved å legge sammen et visst antall tilleggsledd, ett for hver ny funnen overrappor-
3.5 Analyse av stikkprøven
55
tering. Rekkefølgen av eventuelle tilleggsledd skal være etter fallende grad av overrapportering, hvor en henter tabellfaktorer fra linje 1 og nedover (merk at disse er avtagende). Hvert tilleggsledd er da bestemt ved
Overrapportering • Tabellfaktor ■ Utvalgsintervallet
Beregningen kan selvsagt utføres ved at man holder utvalgsintervallet uten for i alle ledd, og multipliserer summen av leddene med utvalgsintervallet til slutt. Merk at basislinjen er den samme som vi brukte ved planlegging av stikk prøvestørrelsen. Eksempel 2: La situasjonen være som i forrige eksempel, der vi tok en stikkprøve på 20 konti fra en populasjon med samlet n bokført verdi på 800 000.-. Anta at tolererbar risiko for feilaktig aksept er 5%. De tre funne overrapporteringer gir derfor følgende beregning: Margin Basis Tillegg 1 Tillegg 2 Tillegg 3 Sum
Overrapportering 1.00 1.00 0.60 0.20
• •
Faktor 3.00 0.75 0.55 0.46
-
= =
Ledd 3.00 0.75 0.33 0.09 4.17
Utvalgsintervallet var 800 000/20 = 40 000, slik at feilmarginen blir 4.17-40 000 = 166 800 Her er basismarginen 3.00 • 40 000 = 120 000. — , mens tilleggsmarginen som skyldes funne feil er 1.17-40 000 = 46 800. — . Vi husker at anslått overrapportering var 72 000.-. Den øvre grensen for overrapporteringen blir derfor 72 000 + 166 800 = 238 800.
Denne grensen kan også beregnes direkte ved en alternativ oppstilling der en legger tallet 1 til alle tilleggsfaktorene i tabellen: Basis Tillegg 1 Tillegg 2 Tillegg 3 Sum
Overrapportering 1.00 1.00 0.60 0.20
Faktor 3.00 1.75 1.55 1.46
= = = = =
Ledd 3.00 1.75 0.93 0.29 5.97
KAPITTEL 3 : Detaljrevisjon
56
Den øvre grensen for overrapporteringen fås da ved å multiplisere med utvalgsintervallet, dvs. 5.97 • 40 000 = 238 800. Begrunnelser for den beskrevne måte å beregne øvre grense på finnes i del II: Kapittel 10.2. Metoden ovenfor forutsetter at rapporterte verdier er positive eller null, slik at rapportert verdi samtidig er den største mulige overrapportering. Nå kan det tenkes situasjoner med mulige negative verdier i stikkprøven (f.eks. en forskuddsbetaling istedenfor et tilgodehavende). Slike vil da delvis kunne oppveie funne overrapporteringer i stikkprøven. En mulig måte å justere for dette er som følger: Beregn anslag og øvre konfidensgrense for overrappor teringen i populasjonen, idet en ser bort fra funne underrapporterte verdier. Beregn et anslag for underrapporteringen i populasjonen, idet en ser bort fra overrapporterte verdier. Anslag og øvre konfidensgrense for netto over rapportering i populasjonen fås så ved å trekke fra det beregnede anslag for underrapporteringen. Som regel undersøker revisor mulig overrapportering på flere områder hver for seg (utestående fordringer, lagerverdier, andre bokførte aktiva). I noen tilfeller kan revisor ønske seg en øvre grense for den samlede over rapportering. En kan da tenke seg de ulike typer bokførte verdier ”i for lengelsen” av hverandre, likegyldig hva slags aktiva beløpene representerer. Den øvre grensen blir da en (felles) basismargin pluss (summen av) anslåtte overrapporteringer pluss (summen av) tilleggsmarginer. Beregningen forut setter samme /3-risiko, og at samme utvalgsintervall brukes over det hele. En beregning der tilleggsmarginer fra separate undersøkelser legges sammen gir en noe høyere (konservativ) grense, idet en da starter fra toppen av Tabell 3.1 hver gang. I praksis er det liten forskjell.
Eksempel 3: Vi kombinerer overrapportering av utestående fordringer og lagerverdi tilnærmet slik:
Margin Fordringer Lager Samlet
Basis 120 000 120 000 120 000
Anslag 72 000 54 000 126 000
Tillegg 46 800 32 000 78 800
Øvre grense 238 800 206 000 324 800
En mer presis beregning forutsetter at vi også kjenner gradene av over rapportering, slik at de kan ordnes i rekkefølge (uansett om det er en for dring eller lagerpost). Å kombinere resultater fra undersøkelser der en har
3.6 Konklusjoner og konsekvenser
57
ulik basismargin, pga. ulikt valg av /3-risiko eller ulikt utvalgsintervall, er noe problematisk, og vi avstår fra å gi konkrete anbefalinger på dette punkt.
3.6
Konklusjoner og konsekvenser
Utfallet av den analyse av stikkprøven som er beskrevet ovenfor, vil være at den beregnede øvre grensen for overrapporteringen i populasjonen er enten (a) en tolererbar overrapportering, eller
(b) over den høyeste tolererbare overrapportering Utfall (a) er uproblematisk, idet revisor da har fått bekreftet at klientens tall ikke er feilrapportert ut over en vesentlighetsgrense. Utfall (b) er mer problematisk og krever en prinsipiell diskusjon: La oss illustrere fire tilfeller i en figur:
Anslag og øvre grenser
I alle eksemplene er anslaget for overrapporteringen høyere enn forventet (som godt kan være lik null). Vi har et eksempel fra (a), og tre eksempler på (b). De siste adskiller seg på følgende vis: I eksempel bl er anslaget for over rapportering nær forventet, og betydelig lavere enn den høyest tolererbare. I eksempel b2 er anslaget nær, men likevel lavere enn høyest tolererbar over rapportering. I eksempel b3 er anslaget over den høyest tolererbare overvur dering. Hvordan revisor vil forholde seg i de tre b-eksemplene vil avhenge noe av omstendighetene. I eksempel bl kan klientens overrapportering godt være tolererbar, og den (foreløpig) negative konklusjon kan skyldes at vi har for stor feilmargin (liten presisjon). Dette gjelder spesielt dersom en har forsøkt å bekrefte klientens tall med minst mulig ressurser, ved å se bort fra o-risikoen. En noe større stikkprøve (mindre utvalgsintervall) ville kunne gitt en mindre feilmargin, og dermed bedre sjanse for at den beregnede øvre grense for overrapportering er tolererbar. I eksempel b2 fortoner situasjonen seg annerledes. Selv om overrappor teringen i populasjonen likevel skulle være tolererbar, er sjansen for å få en
58
KAPITTEL 3 : Detaljrevisjon
øvre grense som er tolererbar liten, med mindre stikkprøven utvides bety delig. Avdekkede overrapporteringer, såvel som anslag for uavdekkede slike, vil kunne danne grunnlag for en oppfordring til klienten om å foreta visse korreksjoner. Dette gjelder forsåvidt både eksempel bl, der klienten ikke avkreves store justeringer, og eksempel b2 der revisor står noe sterkere. Imidlertid vil klienten kunne hevde at det bør være like store feilmarginer den andre veien, slik at en nedjustering av rapportert verdi helt opp til revisors anslag for overrapporteringen ikke kommer på tale. Dersom ingen eller utilstrekkelige korreksjoner blir foretatt, vil revisor ofte måtte foreta ytterligere gransking, i tilfelle b2 kanskje mest med sikte på å få bekreftet den mistanke til overrapportering som er sådd.
I eksempel b3, hvor anslaget for overrapporteringen er over det høyest tolererbare, står revisor langt sterkere overfor klienten mht. eventuelle kor reksjoner. Imidlertid skal en være klar over at en i b3 ikke har ” bevist” at klientens populasjon er uakseptabel. Dersom dette var målet, måtte revisor beregne en nedre grense for overrapporteringen, og kunne først når denne var over grensen for det tolererbare, våge påstanden at populasjonen var uakseptabel. Ifall klienten heller ikke nå er villig til å foreta korreksjoner, er det en viss dekning for at revisor kan uttrykke reservasjoner i sin beretning, uten ytterligere gransking. Når det gjelder situasjonen bl, der klientens verdi gjerne hadde blitt bekreftet med en større stikkprøve, er det ulike muligheter mht. oppfølging: En mulighet er å utvide stikkprøven. Dette er relativt enkelt når stikkprøven er et tilfeldig pengeenhetsutvalg (a). Utvalgsmetoder basert på utvalgsinter vallet krever noe mer omtanke. For det faste intervallutvalg med tilfeldig start (c) anbefales ofte en dobling av stikkprøven ved å halvere utvalgsinter vallet. I eksemplet i avsnitt 3.3 blir da utvalgsintervallet 250, som med den tilfeldige start på 445, gir vinnerloddene 195, 445, 695, 945, 1195, 1445. Her er de nye vinnerloddene understreket. En annen mulighet for oppfølging er å utføre en detaljtest på en alternativ klasse av revisjonsenheter, som oppfyller (helt eller delvis) den samme målsetting. En kan da kanskje redusere kravet til konfidens for hver av de to testene, med den følge at øvre konfidensgrense faller lavere. Ifall konfidensgrensen for begge testene ikke overskrider vesent lighetsgrensen, anses klientens tall akseptable. For begge framgangsmåter for utvidet detaljtesting gjelder at det er vanskelig å gi et presist uttrykk for den konfidensgaranti som knytter seg til en to- trinns testing. Risikoen for feilaktig aksept (/?) vil nok øke noe i forhold til tabellgarantien, idet en dårlig populasjon også får en ny sjanse til å bli akseptert.
3.7 Verdibasert systemrevisjon
3.7
59
Verdibasert systemrevisjon
Ved slutten av Kapittel 2 nevnte vi problemet med å knytte forbindelsen mellom observerte kontrollavvik og risikoen for at vesentlige beløpsmessige feil forekommer. Følgende tankegang kan ha noe for seg i situasjoner der rapporterte verdier er knyttet til utvalgsenhetene: Tenk deg summen av de rapporterte verdier for alle utvalgsenheter i populasjonen med kontrollavvik. Bare en viss andel av dette beløp er overrapportert. Dersom en er villig til å gjøre antakelser om denne andelen, f.eks. at 1/3 av dette beløpet er overrapportering, så kan en tenke seg følgende systemtest: Aksepter klientens system dersom beregnet øvre konfidensgrense for total rapportert verdi av utvalgsenhetene i populasjonen med kontrollavvik er mindre enn 3 ganger beløpsmessig vesentlighetsgrense. Dersom en ikke er fullt så pessimistisk, og antar at bare 1/5 av beløpet er overrapportering, aksepteres klientens system straks øvre konfidensgrense er mindre enn 5 ganger beløpsmessig vesentlighetsgrense. For å kunne beregne den øvre konfidensgrensen trengs antakelser om utvalgsmetoden. Vi vil her anta at vi trekker et tilfeldig pengeenhetsutvalg, eller et tilnærmet sådant. Vi teller så opp antall kroneenheter i stikkprøven som det hefter kontrollavvik ved. Divisjon med utvalgsstørrelsen gir andelen slike kroneenheter, som ved multiplikasjon med total rapportert verdi gir et anslag på total rapportert verdi av de utvalgsenheter som det hefter kon trollavvik ved. En øvre konfidensgrense for dette beløpet kan fås av Tabell 2.2 i Kapittel 2 på følgende vis: Velg linje i tabellen i henhold til det observerte antall kroneenheter med kontrollavvik, og les av tallet i den kolonne som svarer til den planlagte /3-risiko for feilaktig aksept av systemet. Den øvre konfidensgrensen fås ved divisjon med utvalgsstørrelsen og etterfølgende multiplikasjon med total rap portert verdi. Ved planlegging av nødvendig stikkprøvestørrelse inngår følgende:
• total rapportert verdi (w)
• høyeste tolererbare totale overrapportering (h) • tolererbar risiko for feilaktig aksept (/3)
• tolererbar risiko for feilaktig forkasting (o) • ventet andel av totalt rapportert beløp for enheter med kontrollavvik som er overrapportering (1/fc).
60
KAPITTEL 3 -.Detaljrevisjon • forventet antall kroner som det hefter kontrollavvik ved.
Disse størrelser kan benyttes i tilknytning til Tabell 2.1 i Kapittel 2 på følgende vis: Vi beregner først tolerert andel kroneenheter med kontrollavvik ved k-h/w. Deretter finner vi hvor stor den forventede andel er i prosent av dette. Tabellen gir så den nødvendige stikk prøvestørrelse for noen utvalgte kombinasjoner av a og /3, sammen med det høyeste tolererbare antall kro neenheter med kontrollavvik. Eksempel 4: Anta at total rapportert verdi er kr. 600 000.-, mens høyeste tolererbare overrapportering er kr. 10 000.-. La oss videre si at vi tror at det hefter kontrollavvik ved utvalgsenheter svarende til et samlet beløp på kr. 3 000.- . Dersom vi antar at k — 3, får vi tolerert andel kroneenheter med kontrollavvik lik 3 • 10 000 n dvs. 5% 600 000 “ ‘ ’ Den forventede andel kroneenheter med kontrollavvik er 3 000/600 000 — 0.005. I prosent av tolerert andel er dette
0.005 = 0.10: dvs. 10% 0.05
Krever vi at (3- og Q-risikoen er henholdsvis 10% og 30%, ser vi av Tabell 2.1 at nødvendig stikkprøvestørrelse er n = 47, og at systemet aksepteres bare dersom stikkprøven er uten kontrollavvik. Hos Anderson (1984) finner vi en minste stikkprøvestørrelse gitt ved (jfr. avsnitt 3.4) w•L n= kh der L er en faktor hentet fra Tabell 2.2, hvor en på forhånd har bestemt seg for hvor mange kroneenheter med kontrollavvik i stikkprøven som skal aksepteres (mest aktuelt er 0 eller 1). Dette betyr at a-risikoen ikke direk te tas omsyn til i vurderingen. Fremgangsmåten gir imidlertid besnærende enkle regler for stikkprøvestørrelse i enkelte tilfeller. Eksempel 5: La oss anta at tolererbar /3-risiko er 20%, som mange hevder er nok. Anta videre at k = 3, som mange anser for å være en rimelig verdi. Dersom vi tillater en enhet i utvalget med kontrollavvik, får vi:
w•3 3h
w h
61
3.7 Verdi basert systemrevisjon
Dersom vi isteden anser kontrollen for å være så god at ingen kontrollavvik er ventet i stikkprøven, og aksepterer systemet bare hvis så er tilfelle, får vi w ■ 1.6 3-h
1 w 2 h
72 = ------ ~ — • —
I denne forbindelse er det foreslått først å ta et utvalg basert på den siste antakelsen, og dersom ett (men bare ett) kontrollavvik oppdages, dobles stikkprøven i henhold til antakelsene ovenfor. Dette er relativt enkelt å gjennomføre i forbindelse med pengeenhetsstikkprøver, idet utvalgsintervallet i de to situasjonene blir henholdsvis 2h og h, slik at nye utvalgsenheter lett kan plukkes ut ved ”tilfeldige” halveringer av utvalgsintervallet. Med tallene i foregående eksempel blir stikkprøvestørrelsen i de to tilfellene henholdsvis n — 30 og n = 60. Merk at Tabell 2.1 med /3-risiko lik 20% og a- risiko lik 30% gir n = 33. Noen kritiske kommentarer til denne form for systemtesting: Metodens fordeler fremfor tradisjonell systemtesting ligger i dens nærmere tilknytning til beløpsmessige feil, som blant annet gir mulighet for bedre avveininger mellom omfanget av systemtesting og detaljtesting, se neste kapittel. Som oftest gir aktuelle valg av k en nødvendig stikkprøvestørrelse som ikke er altfor stor, og der granskingen som oftest kan gjennomføres langt raskere enn en tilsvarende detaljtest, idet det er tilstrekkelig å sjekke at kontrollen er fulgt, f.eks. attestering av person med fullmakt. På den annen side vil revisors fastsettelse av k være nokså subjektiv, og det er lett for at bestemte verdier, f.eks. k = 3, vinner innpass uten at det er særlig erfaringsgrunnlag for det. Tabellgarantiene mht. risiko vil da lett bli illusoriske. Videre må en være oppmerksom på at metoden bare er rettet mot kontrollavvik med fare for beløpsmessig overrapportering. Kun da kan en rettferdiggjøre pengeen hetsstikkprøver der store rapporterte enheter har størst sjanse for å bli valgt ut. Det kan også reises en innvending her: De store rapporterte verdier har ofte størst sjanse for å være attestert og/eller sjekket av den interne kon troll, slik at revisors systemrevisjon kan komme til å undervurdere omfanget av kontrollavvik, som kanskje er skjult i utvalgsenhetene med mindre rap portert verdi. Når vi så vet at den etterfølgende detaljrevisjon også favoris erer enheter med stor rapportert verdi, vil muligheten for feilkonklusjoner være til stede. Det trengs nok mer praktisk erfaring med denne typen sys temtesting før velbegrunnede anbefalinger om bruk kan gis. I situasjoner der mulig underrapportering er et problem, og der det ikke foreligger rap porterte verdier, er en likevel henvist til de mer tradisjonelle metodene som er beskrevet i Kapittel 2.
62
KAPITTEL 3 : Detaljrevisjon
3.8
Kritiske merknader
I ekstern revisjon vil detalj testing basert på pengeenhetsstikkprøver og evalu ering som beskrevet ovenfor, innebære klare fordeler framfor klassisk variabelsampling og evaluering basert på normaltilnærming, se del II: Kapittel 9.3. Disse er i hovedsak: • enkle tabeller og beregninger • tillater ekstremt skjeve populasjoner • passer godt med målsettinger i ekstern revisjon Enkelte forfattere 1 hevder at den beskrevne metode løser den eksterne revisors stikkprøveproblem i de fleste praktiske situasjoner. Det er kanskje riktig, men det er en rekke problemstillinger der metoden krever spesiell omtanke og/eller der andre angrepsmåter ville passe bedre. La oss her nevne to hovedproblemer:
• tabellgarantiene er konservative • metoden er bare rettet mot overrapportering
Det første punktet innebærer at beregnet øvre konfidensgrense er noe høyere enn det konfidensgarantien tilsier, eller med andre ord at konfidensgarantien til en beregnet øvre grense er noe høyere enn tabellert. Dette vil kunne medføre at en oftere enn nødvendig ikke aksepterer en tolererbar overvurdering, og dermed må gjøre ekstra revisjonsarbeid. Når beskreven metode ofte anviser en mindre stikkprøve enn andre metoder, som ofte er tilfellet for liten forventet overrapportering, kan dette tildels være illusorisk. Den første innvendingen anses imidlertid ikke for å være vesentlig i praksis. Det fins metoder for mer eksakt evaluering, bl.a. i forbindelse med tilfeldig celleutvalg (d). Det andre punktet er mer problematisk: Revisor ønsker ofte å teste en populasjon med sikte på å sette en grense for mulig underrapportering. Her er det imidlertid ikke noen naturlig grense som representerer den største tenkelige underrapportering. Dette vanskeliggjør evaluering av stikkprøven, og krever mer spesifikke antakelser fra revisors side enn tilfellet med testing av overrapportering. Problemer oppstår allerede ved valg av utvalgsmetode. Det er ikke lenger like meningsfylt å la utvalgsenheter med stor rapportert 1 Blant dem Leslie, Teitlebaum & Anderson (1980).
3.8 Kritiske merknader
63
verdi ha større sjanse for å bli valgt ut enn de med liten verdi. En ren pengeenhetsstikkprøve vil aldri omfatte enheter med rapportert verdi null, og disse kan jo godt tenkes å være underrapportert! I revisjonslitteraturen fins flere forslag til løsning av problemer knyttet til underrapportering. De fleste er neppe fullt ut tilfredsstillende, og dette er et felt der det arbeides videre. En må imidlertid være klar over de begrensninger som ligger i selve problemstillingen, som har karakter av ”nålen i høystakken”. En innvending mot flere av de stikkprøvemetoder som er gjennomgått, er at de ikke i tilstrekkelig grad tar omsyn til revisors kunnskaper om den revisjonspopulasjon som foreligger. Metodene er objektive, men konserva tive, ofte forankret i et ”worst case” scenario. Dette gir ofte stikkprøver av et omfang som praktikere instinktivt føler ikke er kostnadseffektive. For pengeenhetsstikkprøver kommer det til uttrykk ved at Stringer-grensen er konservativ, og at det er vanskelig å benytte revisors antakelse om feilstrukturen i populasjonen i planleggingen. Teoretikere tok opp dette på ulikt vis gjennom 1980-tallet: Noen arbeidet med å gi mer presise og mindre konservative garantier, andre har arbeidet med alternative måter å sette konfidensgrenser. Av spesiell interesse her er den såkalte moment metoden, som etterhvert flere av de ledende revisjonsforetak adopterte og tilpasset praktisk bruk. Blant de forbedringer som ble oppnådd nevnes:
• Størrelse, hyppighet og retning på feil kan tas omsyn til i planleggingen av stikkprøveomfanget på en brukervennlig måte, • mindre stikkprøver uten å ofre tidligere metoders pålitelighet, • virker brukbart i de fleste praktiske situasjoner, også der tidligere metoder fungerte dårlig. Dette skjer på bekostning av noe dårligere ytelse dersom populasjonen har en svært uvanlig feilstruktur som revisor har oversett muligheten av. De metoder som er implementert i praksis, krever typisk følgende input fra revisor:
• Total bokført verdi. • Konfidensnivå ønsket. • Tolererbar beløpsmessig feil. • Forventet netto overvurdering.
64
KAPITTEL 3 : Detaljrevisjon
• Hyppighet av feil. • Andelen feil som er overvurdering. • Andelen feil som er undervurdering. Metodene skiller typisk mellom to situasjoner, her kalt I og II. Vi har situa sjon I dersom følgende tre betingelser er oppfylt: 1. Total beløpsmessig feil er liten i forhold til bokført verdi.
2. Få revisjonsenheter har feil. 3. Det er ingen store overvurderinger (typisk ingen over 70%). Vi har situasjon II dersom en eller flere av disse betingelsene ikke er oppfylt. Ut fra revisors input beregnes først forholdet mellom forventet netto overvurdering og bokført verdi. Grensen for lite (tilfelle I) er bestemt av konfidensnivå og tolererbar beløpsmessig feil. Dersom input sannsynligjør situasjon I, brukes typisk Stringer-metoden eller en beslektet metode. Dersom input sannsynliggjør situasjon II brukes en alternativ metode. Hver metode vil typisk kombinere input med flere elementer av statistisk teori, og en del erfaringsbaserte tommelfingerregler vil typisk inngå. En mulighet er å beregne stikkprøvestørrelse etter begge metoder. Ettersom forventet feilomfang øker, vil nødvendig størrelse typisk øke raskere for metode I enn for II, og metode I foretrekkes inntil metode II gir lavest stikkprøvestørrelse. Den generelle teorien i del II: Kapittel 8,9 og 10 vil kunne være til hjelp for å vurdere ulike alternative metoder. Her diskuteres også metoder som ikke ensidig ser på beslutningsaspektet, men som også kan brukes når hov edformålet er revisors uavhengige anslag av størrelser knyttet til klientens virksomhet.
Kapittel 4
Estimering og avviksanalyse 4.1
Verdivurdering
I dette avsnittet vil vi se på analyse av stikkprøver ved verdivurdering. Dette kan bl.a. komme til nytte ved overtakelser, f.eks. av varelagre eller av gjeldskrav, der det uaktulelt å foreta en fullstendig gjennomgang av alle poster eller krav. Vi vil konsentere oss om temaet estimering med tilhørende feilmarginer. Dette kan selvsagt anvendes i andre sammenhenger. På den annen side vil verdivurdering også kunne omfatte andre analytiske metoder. Målsettingen kan variere: å avklare om overtagelse overhodet er aktuelt, å bestemme en rettferdig pris, å definere elementer i kontrakten som kan utløse prisjusteringer etterat kunnskap om populasjonen avdekkes. Denne innsikt vil derfor også ha relevans for selger. Det er to hovedproblemstillinger: attributt-sampling og variabel-sampling. Eksempel 1: Verdi av portefølje Et kredittforetak ønsker å kvitte seg med en større portefølje med vanskelige krav. En kjøper har sagt seg interessert i å overta porteføljen såfremt prisen i tilstrekkelig grad tar omsyn til muligheten for å inndrive kravene. Selger har opplysninger om hvert lån, men databasen er ikke oppdatert i den grad man kunne ønske. Kjøper vil derfor foreta en selvstendig vurdering, som i praksis må basere seg på stikkprøver. Kravene kan falle i flere kategorier, bl. om låntaker var konkurs, om mislighold, om betalingsplan foreligger og dennes profil. For enkelhets skyld antar vi at kjøper og selger er enige om å dele kravene i to: gode krav og dårlige krav. Det siste er krav som kjøper anser å være uten verdi, kostnadene ved inndriving tatt i betraktning. Hva som er hva går ikke klart fram av databasen. En ønsker derfor å anslå antall gode 65
66
KAPITTEL 4 : Estimering og avviksanalyse
krav. Kravenes størrelse er selvsagt også viktig. Disse behøver ikke fordele seg likt i de to gruppene, og en ønsker derfor å anslå den totale nominelle verdi av de gode kravene. Den prisen som kjøper ut fra sin erfaring med inndriving av krav er villig til å betale for porteføljen vil typisk være en viss andel av dette. I praksis kan denne bli bestemt av en rekke andre forhold, såsom profilen av betalingsstrømmene.
Vi vil først ta for oss estimering av antall gode krav, et eksempel på attributtsampling: I generelle vendinger har vi en populasjon på N elementer, hvorav M er spesielle (gode krav). Vi ønsker å anslå M med feilmargin ut fra en stikkprøve på n fra populasjonen. Vi tar da utgangspunkt i %-andelen spe sielle i stikkprøven som anslag for %-andelen spesielle i populasjonen. Sta tistisk teori gir da feilmarginer i % iht. Tabell 4.1. Anslag og feilmargin for antall spesielle i populasjonen fås da ved å multiplisere med populasjonsstørrelsen.
Utvalgsstørrelse 25 50 75 100 150 200 250 300 400 500 600 700 800 900 1000 1200 1400 1600
Tabell 4.1: Feilmarginer for %-andel i populasjon Prosentandel i stikkprøve 5% 10% 15% 20% 25% 30% 35% 40% 8.6 12.0 14.2 16.0 17.4 18.3 19.0 19.6 6.2 8.5 10.1 11.3 12.2 13.0 13.6 13.9 9.2 10.0 10.6 11.0 11.3 8.2 5.0 6.9 8.7 9.2 9.5 9.8 8.0 4.4 6.0 7.1 6.5 7.1 7.5 7.8 8.0 5.8 3.6 4.9 6.7 6.9 4.2 5.7 6.1 6.5 5.0 3.1 6.2 5.8 6.0 5.1 5.5 2.8 3.8 4.5 5.7 5.3 5.5 4.1 4.6 5.0 3.5 2.5 4.8 4.9 4.0 4.3 4.6 2.2 3.0 3.6 4.1 4.4 3.9 4.3 3.2 3.6 1-9 2.7 4.0 3.5 3.7 3.8 2.9 3.3 1.8 2.5 3.5 3.6 3.7 3.0 3.3 1.6 2.3 2.7 3.4 3.2 3.5 2.1 2.8 3.1 2.5 1.5 3.2 3.3 2.4 2.7 2.9 3.1 1.5 2.0 2.5 2.7 2.9 3.0 3.1 1.4 2.3 1.9 2.6 2.8 2.8 2.1 2.3 2.5 1.3 1.7 2.1 2.4 2.6 2.3 2.5 1.2 1.6 1.9 2.4 2.2 2.2 2.4 2.0 1.1 1.5 1.8 95% 90% 85% 80% 75% 70% 65% 60%
45% 19.9 14.1 11.5 9.9 8.1 7.0 6.3 5.7 5.0 4.4 4.1 3.8 3.5 3.3 3.1 2.9 2.7 2.5 55%
50% 20.0 14.1 11.5 10.0 8.2 7.1 6.3 5.8 5.0 4.5 4.1 3.8 3.5 3.3 3.2 2.9 2.7 2.5 50%
4.1 Verdivurdering
67
Tabellen forutsetter at stikkprøven er et tilfeldig utvalg fra en stor popu lasjon, og gir en tilnærmet 95% konfidensgaranti. Den teori som ligger til grunn kommer i Kapittel 9, som også tar for seg tilfellet at populasjonen er liten. Tabeller som dekker dette tilfellet er gitt bak i boken. Vi ser at feilmarginen avtar med økende stikkprøvestørrelse. For en gitt stikkprøvestørrelse øker feilmarginen med økende prosenttall inntil 50%, hvoretter feilmarginen avtar igjen, og merk symmetrien i tabellen. Tabellen kan også brukes til å planlegge nødvendig stikkprøvestørrelse. En må da stipulere %-andelen og så finne den stikkprøvestørrelse som gir ønsket feil margin. Eksempel 2: Antall gode krav Gitt en populasjon på N = 10000 krav. I en stikkprøve på n = 400 krav fant man 340 gode krav, dvs. 85%. Av tabellen finner vi feilmarginen 3.6%, slik at et anslag (med 95% konfidensgaranti) er 85% ± 3.6%, eller i antall 8500 ± 360. Dersom vi ønsket en mindre feilmargin måtte vi hatt en større stikkprøve. Eksempelvis vil n — 1600 og samme %-andel gode krav gi feil margin på 1.8%, dvs. at firedobling av stikkprøven er nødvendig for å halvere feilmarginen.
Vi vil så ta for oss variabel-sampling, dvs. anslag på totalverdien av enhetene i populasjonen. Utgangspunktet er en populasjon på N enheter og en stikkprøve på n enheter som verdivurderes enkeltvis av revisor. Den videre framgangsmåte avhenger av om bokførte verdier av enhetene forelig ger eller ikke. Det første tilfellet, som kanskje er det vanligste, gir mulighet for å benytte den totale bokførte verdi, og så korrigere med et anslag for den totale overvurdering basert på stikkprøven. Dette gir vanligvis bety delig mindre feilmarginer enn ved et helt uavhengig anslag. Vi vil nedenfor betrakte feilmarginer av typen 1 Anslag
± k ■ Standardfeil anslag
der k er en valgt sikkerhetsfaktor. Typisk brukes k = 2, som gir tilnærmet 95% pålitelighetsgaranti. Detaljer om den bakenforliggende teori er gitt i Kapittel 9, med formler og grundig diskusjon av forutsetningene for garantien (som ikke alltid er oppfylt i revisjon). Her nøyer vi oss med å bruke de termer som en vanligvis finner i statistisk programvare. 1 Feilmarginene for estimering av andeler i tabellen ovenfor er også av denne typen.
68
KAPITTEL 4 : Estimering og avviksanalyse
La oss først ta for oss tilfellet hvor vi ikke har eller velger å ikke gjøre bruk av de bokførte verdier. Framgangsmåten er da 1. Beregn anslag for totalverdien av populasjonen ved å multiplisere populasjonsstørrelsen med gjennomsnittlig verdi i stikkprøven (Mean) 2. Beregn standardfeilen til anslaget ved å multiplisere populasjons stør relsen med standardfeilen til gjennomsnittet (SeMean).
3. Skriv ned anslag for totalverdien med feilmarginer for valgt sikkerhets faktor, f.eks k = 2. Dersom en kan og vil gjøre bruk av bokførte verdier, tar en isteden fatt i overvurderinger. 1. Beregn overvurderinger i stikkprøven som differensen (med fortegn) mellom bokført verdi og revisors verdi.
2. Beregn anslag for total overvurdering i populasjonen ved å multiplisere populasjonsstørrelsen med gjennomsnittlig overvurdering i stikkprøven (Mean). 3. Beregn standardfeilen til anslaget ved å multiplisere med populasjons størrelsen med standardfeilen til gjennomsnittet (SeMean) multiplisert med populasjonsstørrelsen. 4. Skriv ned anslag for total overvurdering med feilmarginer for valgt sikkerhetsfaktor, f.eks k = 2. 5. Anslag for total verdi fås ved å addere anslaget for total overvurdering og total bokført verdi i populasjonen, men uten å endre feilmarginen.
De standardfeilene (SeMean) som er nevnt ovenfor beregnes med statistisk programvare ut fra formler gitt i Kapittel 9 (som bør være kjent for alle som har gjennomgått et elementærkurs i statistikk), og derfor gjengir vi ikke disse her. La oss heller betrakte et eksempel. Eksempel 3: Verdi av krav Fra en populasjon på N = 10000 krav med bokført verdi på 1 624 mill.kr. er det trukket en stikkprøve på n = 400 krav. Verdien av hvert av disse ble vudert av revisor. Nedenfor er beregnet beskrivende statistiske mål i stikkprøven for variablene bokført verdi, revisors verdi og overvurderingen.
69
4.2 A vviksanalyse Descriptive Statistics Variabel BokfortVerdi
400
RevisorVerdi Overvurdering
400 400
n
StDev
SeMean 5670
128216
113396 113622
Min 580
31709
74575
5881 3729
0 0
Mean 159925
Max
471499 471499 437690
Følger vi oppskriften ovefor ser vi at et anslag for overvurderingen i popu lasjonen blir 317 mill.kr. med feilmargin på ca. 74 mill. kr. Revisors anslag for totalverdien blir med dette 1 307 mill. kr. med feilmargin på ca. 74 mill. kr. Dersom det ikke forelå bokførte verdier, måtte vi isteden anslå to talverdien med 1 282 mill. kr. med feilmargin på ca. 117 mill.kr., dvs. en betydelig større feilmargin enn når vi utnytter de bokførte verdier. I mange situasjonerer er forbedringen langt mer dramatisk, se Kapittel 9. Problemet her er at det er mange store krav som er uten verdi. Dersom vi ønsker mindre feilmarginer må vi ta en større stikkprøve. Også her gjelder at firedobling av stikkprøven er nødvendig for å halvere feilmarginen. I praksis forekommer ulike kontekster som krever en viss omtanke for å unngå feil i anslag og usikkerhetsvurdering. La oss ta et eksempel: Anta at kjøper og selger er enige om kriteriene for verdiløse krav, og at en rettferdig pris skal settes på en populasjon med kravene uten verdi frasortert. Skal vi da skalere ned totalanslaget og feilmarginen med prosentandelen gode krav, i eksemplet ovenfor 85%. Nei! Anslagene ovefor er anslag for verdi en uansett. Et alternativ kunne vært å ta utgangspunkt gjennomsnitt og standardfeil for de gode kravene i stikkprøven (ikke gjengitt her), og bruke anslått antall gode krav i populasjonen 8 500 som multiplikator istedenfor 10 000. Problemet er da at vi ikke kjenner total bokført verdi av de gode kravene i populasjonen, men denne kunne anslås med 85% av total bokført verdi. Oppskriften gir da et anslag for totalverdien lik 1 301 mill. kr. med feilmargin 23 mill, kr., som er betydelig mindre enn ovenfor. Dette overser to ting: Usikkerheten i anslått antall gode krav og det faktum at bokførte verdier kan tenkes å ha ulik fordeling for de gode og de dårlige kravene.
4.2
Avviksanalyse
Avviksanalyse er knyttet til revisors forestillinger om en normalsituasjon som avvik kan måles ut fra. Analysen kan enten skje ved såkalt positiv tilnærming eller ved negativ tilnærming. Positiv tilnærming innebærer at en i utgangspunktet antar normal variasjon og leter etter avvik fra denne. Revi sor kan ønske seg en garanti for feilaktig å utpeke avvik. Negativ tilnærming
70
KAPITTEL 4 : Estimering og avviksanalyse
innebærer at revisor har fastlagt en grense for vesentlig avvik, og ønsker en beslutningsregel som gir en garanti for feilaktig å akseptere et avvik større enn vesentlighetsgrensen. Hvilken tilnærming som er mest aktuell avhenger av formålet med analysen, om denne er bekreftende, støttende, søkende eller avslørende. I statistiske lærebøker og i programvare er det i hovedsak posi tiv tilnærming som beskrives. Vi vil ta utgangspunkt i denne, men komme tilbake til negativ tilnærming senere. Revisor kjenner ofte sammenhenger mellom noen av de størrelsene som inngår i et revisjonsoppdrag. Det vil sjelden være tale om eksakte sam menhenger, det er snarere tale om grove sammenhenger som holder sålenge virksomheten i foretaket er ”normal”. For det første kan vi vente at revisor kjenner til sammenhenger som gjelder for all normal økonomisk virksomhet, både når det gjelder regnskapstallene og sider ved virksomheten som ikke kommer til syne i regnskapene. Revisor kan i dette støtte seg til regler for vanlig regnskapsskikk og generell bedriftsøkonomisk teori. For det andre kan vi vente at revisor kjenner til spesielle forhold som knytter seg til den bran sje som revisjonsoppdraget tilhører. Revisor kan sammenligne nøkkeltall i foretaket med det som er vanlig i bransjen, ta omsyn til utviklingstendenser i bransjen osv. Endelig er det mulig at revisor kan ta utgangspunkt i forhold som er spesifikke for foretaket selv, eksempelvis sammenligne nøkkeltall for ulike avdelinger. Nøkkeltall kan også sammenlignes over tid, fra år til år, eller måned til måned, ut fra en vurdering av hva som vil være en nor mal utvikling. Med utgangspunkt i slik kunnskap ønsker revisor å avdekke uventede resultater, f.eks. uventede endringer eller mangel på endring når dette var ventet. Dersom revisor på denne måten finner forhold som rimer dårlig med normal drift og utvikling, vil det være aktuelt å foreta en grundi gere analyse av årsaken. De analytiske revisjonsteknikker som er aktuelle for dette spenner over et bredt register, fra enkle sammenligninger av nøkkeltall til mer avanserte statistiske teknikker. La oss tenke oss at revisor har satt i fokus et bestemt kostnadstall hos et foretak. Det kan være totale tall for hele foretaket, for en avdeling, eller bare en kostnadskomponent i foretaket/avdelingen. Det er hensiktsmessig å skille mellom to problemstillinger:
Tidsrekkeanalyse: Kostnadstallet vurderes i lys av tilsvarende tall i samme foretak i tidligere tidsperioder. Tverrsnittsanalyse: Kostnadstallet vurderes i lys av tilsvarende tall i andre foretak (evt. avdelinger) i samme (eller sammenlignbare) tidsperioder.
4.2 Avviksanalyse
71
I det etterfølgende vil vi ta for oss ulike former for avviksanalyse. I Kapit tel 1.3 om prosesser og variasjon var budskapet at alt varierer, og at en må vokte seg for å trekke forhastede konklusjoner. Et avvik vurdert i en videre kontekst kan godt bare vise seg å være en tilfeldighet. La oss starte med et eksempel som illustrere dette. Eksempel 4: Månedsrapporten En internrevisor betrakter følgende utsnitt av en rapport for juni 1998: Denne måned
KOSTNAD 29
Ventet verdi
Forskjell i % fra ventet
21
38
Forskjell i % fra mnd i fjor + 16
Sum/snit t Ventet Forskjell hittil i sum/snit , i % fra år hittil i ventet år 23.3 21.3 + 10
Forskjell i % fra i fjor
+ 11
Her representerer de ulike kolonnene henholdsvis:
(1) Denne måneds tall. (2) Ventet verdi (budsjettert eller erfaringsmessig gjennomsnitt). (3) Forskjell i % mellom månedens og ventet. (4) Forskjell i % fra samme måned forrige år. (5) Samlet sum/gjennomsnitt hittil i år.
(6) Ventet sum/gjennomsnitt hittil i år. (7) Forskjell i % hittil fra ventet. (8) Forskjell i % hittil sammenlignet med forrige år. For variabelen KOSTNAD er den rapporterte verdien 29, som var 16% mer enn juli forrige år og 38% over budsjettert verdi. Hittil i år ligger man 11% over tilsvarende måned forrige år og 10% over ventet. Det er altså 4 dårlige tall. Isolert sett kan imidlertid ikke disse tallene fortelle om situasjo nen krever handling, og i så tilfelle hva slags. Var det spesielle omstendigheter denne måneden eller er tallet forenlig med den variasjon en kan vente seg ut fra produksjonsforholdene? En kan også spørre seg om de budsjetterte verdier var realistiske, eller om det var ønskemål satt uten kunnskap om egen evne til å styre egen produksjon. De fire sammenligningene (3) (4) (7) og (8) er ofte alt som brukes, og er et primitivt forsøk på å lage en kontekst for å tolke månedens resultat.
72
KAPITTEL 4 : Estimering og avviksanalyse
Å sammenligne ett tall med et annet har ofte begrenset verdi, fordi begge er underlagt tilfeldige variasjoner, og det vanskelig å avgjøre om forskjeller skyldes reelle endringer og ikke bare tilfeldige avvik. Oppsummerende rap porter av typen ovenfor skjuler et vesentlig element i foretakets virksomhet, nemlig variasjon, noe som er helt vesentlig for forståelsen av situasjonen.
Figur 4.1: Tidsplott og kontrolldiagram: Kostnad
Vi kan sette variablen ovenfor inn i en videre kontekst, der vi plotter verdiene for hver måned fra januar 1996 til juni 1998 i et tidsplott, se Figur 4.1. Vi ser ingen klar trend eller andre systematiske mønstre. Kostnaden et
4.3 Avvik fra forventning
73
ser ut til å variere tilfeldig rundt et nivå på omtrent 20, med realistisk nedre grense noe under 15 og øvre grense oppunder 30. Vi ser forøvrig at juni forrige år tilfeldigvis var over gjennomsnittet, og at det godt kunne opptre langt mer dramatiske forskjeller, uten at disse var annet enn tilfeldigheter. I det neste plottet i Figur 4.1 er tegnet kun de to punktene som går fram av månedsrapporten ovenfor, og vi ser nå klart hvilken begrensning som ligger i denne type sammenligninger. I det tredje plottet i Figur 4.1 har vi tegnet inn kontrollgrenser basert på 3 x standardavviket. Det er først når et punkt faller utenfor disse at et avvik virkelig er oppsiktsvekkende, se teori i neste avsmitt. Grenser basert på 2 x standardavviket gir heller ingen påfallende avvik her. Statistisk avviksanalyse dreier seg om å vurdere avvik fra forventninger i lys av den iboende variasjon. Dette krever at revisor har en realistisk forestil ling om forventning og variasjon. Dersom dette kommer til uttrykk i en sta tistisk modell, kan en avlede fornuftige metoder, samt knytte pålitelighetsgarantier til disse. En modell er en kombinasjon av revisors kunnskaper, erfaringer og relevante data. I eksemplet ovenfor antok vi at forventet kostnad er den samme i hver periode. I mange sammenhenger er dette ikke realistisk. Det kan være ulikt aktivitetsnivå, trend og/eller sesongvariasjon osv. Det er mulig å formulere modeller som tar omsyn til dette, eksempelvis benytte regresjonsmodeller med trend og sesong som forklarende variable. Da kan man beregne de såkalte residualene, dvs. avvikene fra forventningen, og benytte ideene oven for på disse. I mange tilfeller estimeres parametrene i disse modellene ut fra data, og vurdering av avvikene må ta omsyn til dette.
4.3
Avvik fra forventning
Skal en kostnad vurderes i lys av tilsvarende kostnader i andre tidsperioder eller andre deler av virksomheten, eller kostnader i andre foretak, må kost nadene være sammenlignbare, f.eks. ved at de svarer til noenlunde samme aktivitetsnivå, eller at en ser kostnaden i forhold til aktivitetsnivået. La oss først sammenligne kostnader ved et gitt aktivitetsnivå. Kostnader er sjelden entydig bestemt ved aktivitetsnivået, en viss tilfeldighet vil som regel alltid forekomme. Spørsmålet er da hvor stort avvik fra forventet kostnad en skal akseptere uten å anse situasjonen som unormal. La oss betrakte kostnadene ved et gitt aktivitetsnivå som en stokastisk variabel Y med en tenkt sannsynlighetsfordeling. Ulike fasonger på denne
74
KAPITTEL 4 : Estimering og avviksanalyse
er tenkelige, noen eksempler er vist i Figur 4.2:
Figuren viser først en symmetrisk fordeling omkring forventningsverdien (a), så en høyreskjev fordeling (b), og til sist en to-toppet fordeling (c). De to siste vil best reflektere en situasjon med kostnader som alltid er over en nedre grense, med en viss risiko for en uforutsett stor kostnad som ikke er bokført særskilt, f.eks. forårsaket av uhell. La /i og cr betegne forventningen og standardavvik i den tenkte fordelin gen. Vi ønsker å vurdere hvor stort avvik fra forventet kostnad en kan vente seg uten at det er påfallende. For tilfellet at fordelingen er normal, vil g og cr entydig bestemme fordelingen, og vi har at F(| Y — g\> k ■ cP) = 1 — A(k)
der A(k) er arealet under standardnormalkurven mellom —k og k, illustrert i Figur 4.3 med k = 1.
Figur 4.3: Areal under normalfordeling
Vi har følgende tabell
k 1 - A(k)
1 0.317
2 0.045
3 0.003
75
4.3 Avvik fra forventning
Dette betyr f.eks. at kostnadsawik fra det forventede på mer enn standard avviket vil inntreffe ganske ofte (ca. 32% sjanse), avvik mer enn to ganger standardavviket vil også kunne inntreffe sporadisk (ca. 5% sjanse), mens avvik på mer enn tre ganger standardavviket er påfallende (sjansen er bare ca. 0.3%). Dersom fordelingen ikke er normal, gjelder resultatene ovenfor i beste fall tilnærmet. For tilfellet at fordelingen er skjev og/eller har tunge haler, er tilnærmingen grov. Det kan imidlertid vises at uansett fordeling, så gjelder
P(| Y — g |> k • cr) < 1/fc2 slik at vi har en øvre skranke på sannsynligheten for at kostnaden avviker mer enn k ganger standardavviket fra sin forventning. Denne er gitt ved
k 1/k2
1 1.00
2 0.25
3 0.11
4 0.06
5 0.04
Dette betyr at sjanse for et avvik fra forventet kostnad på mer enn 3 ganger standardavviket i verste fall er ca. 11%. Dette er i praksis svært pessimistisk, og vi vil i fortsettelsen satse på at sannsynligheter basert på normalantakelser ikke er altfor urealistiske. Anta at revisor betrakter et kostnadstall som avvikende bare dersom
| Y — g |> k • a
for en passende valgt sikkerhetsfaktor k. Sannsynligheten for at en normal kostnad blir feilaktig utpekt er da gitt ved 1 — A(k). Valget av sikkerhetsfak tor k ved anvendelser revisjon avhenger av situasjonen, om analysen er veile dende for å påkalle oppmerksomhet eller er operasjonell, slik at en avviker alltid medfører oppfølging. Standard statistisk programvare flagger vanligvis avvikere ved k = 2, mens k = 3 brukes ofte i operasjonell sammenheng i industrien, der inngrep i 5% av tilfellene neppe er kostnadseffektivt. De samme tommelfingerregler kan gjerne brukes i revisjon, med mindre man stiller eksplisitte krav til sannsynligheten for feilaktig å utpeke en avviker (kalt feilaktig forkastning). Da har vi følgende tabell Risiko for feilaktig forkastning Sikkerhetsfaktor k
5% 1.96
10% 1.64
20% 1.28
30% 1.04
40% 0.84
Merk at dersom revisor kun ønsker garanti mot feilaktig å utpeke urimelig store kostnader, så er risikoen bare halvparten. Ønsker vi 5% ensidig risiko kan vi altså bruke tabellen med 10% tosidig risiko.
76
KAPITTEL 4 : Estimering og avviksanalyse
Eksempel 1: Anta at forventede drivstoffkostnader (i tusen kroner) i en periode av en viss lengde er 28.5, og at tilfeldige avvik fra det forvent ede kan uttrykkes ved et standardavvik på 1.5. Et observert forbruk på 34.5 påfallende høyt uansett sannsynlighetsfordeling, mens allerede 33.0 er påfallende høyt dersom en er villig til å anta at variasjonen følger en nor malfordeling. Dette er vurdert ut fra k — 3, men med en 5% ensidig garanti og antakelse om normalfordeling, svarende til k = 1.64, vil allerede Y > 31 være å oppfatte som avviker. Revisor har ofte oppfatninger om hva som er vesentlige avvik, og av prak tiske grunner fastlagt en grense (H) slik at alle avvik over denne betraktes som vesentlige. En beslutningsregel basert på denne grense alene vil overse variasjon og risiko. I noen situasjoner ønsker imidlertid revisor en garanti for feilaktig å akseptere et avvik minst lik denne grense, dvs. det vi har kalt negativ tilnærming. En aktuell beslutningsregel er da
\Y -g\> H -k-(j der k er valgt sikkerhetsfaktor som gir den ønskede garanti. Normalfordelt variasjon gir følgende sikkerhetsfaktorer som gjelder både i det ensidige og tosidige tilfellet:
Risiko for feilaktig aksept Sikkerhetsfaktor k
2.5% 1.96
5% 1.64
10% 1.28
15% 1.04
20% 0.84
Dette er de samme sikkerhetsfaktorene som for positiv metode i det ensidige tilfellet, mens der dobles risikoen i det tosidige tilfellet. Eksempel 2: Anta forsatt at forventede drivstoffkostnader (i tusen kroner) i en periode av en viss lengde er 28.5, og at tilfeldige avvik fra det forvent ede kan uttrykkes ved et standardavvik på 1.5. Anta videre at grensen for vesentlig avvik er satt til 4.0. Med 5% garanti for feilaktig aksept av vesentlig avvik blir 4.01.64 • 1.5 = 1.54 og beslutningsregelen blir da
| Y -28.5 |> 1.54
Som vi ser blir belutningsregelen nokså ulik ved positiv og negativ tilnærm ing. Anvendelse av teorien ovenfor krever at revisor kjenner forventningen og standardavviket i kostnadsfordelingen, samt hvorvidt denne er nær nor mal eller ekstremt skjev. Dette krever at revisor har bredt erfaringsgrunnlag
77
4.3 Avvik fra forventning
angående den variasjon i kostnader som skyldes tilfeldigheter. I noen til feller har revisor et begrenset erfaringsgrunnlag, f.eks. observerte kostnader ved normal virksomhet i n tidsperioder (eller n lokaliteter) med samme ak tivitetsnivå og prisnivå. Vi har derfor observasjonene
som vi oppfatter som uavhengige realisasjoner fra en kostnadsfordeling med forventet kostnad /z og tilhørende standardavvik cr. Gjennomsnittet Y kan brukes som et anslag på g, og det empiriske standardavvik S som anslag på er. Ved positiv metode er det nå aktuelt å betrakte et nytt kostnadstall Y som avvikende dersom \Y -Y\>k-S
der k velges for å oppnå en ønsket sannsynlighetsgaranti. De sannsynlighetsgarantier som er gitt ovenfor vil nå være noe optimistiske, selv i tilfellet med normalfordelte observasjoner. Dette henger sammen med at disse ikke tar omsyn til usikkerheten i anslagene av /i og cr. Denne usikkerheten er stor der som vi har få observasjoner, og avtar ettersom antall obsevasjoner øker. Med et stort antall observasjoner vil garantiene ovenfor tilnærmet gjelde. Det fins imidlertid en enkel modifikasjon av beslutningregelen ovenfor som tar omsyn til dette og kan gi oss eksakte garantier i tilfellet at observajonene er normal fordelte. Denne teori er knyttet til den såkalte t-fordelingen, og er beskrevet i Kapittel 11. Den tilsvareende beslutningsregel ved negativ metode lyder \Y -Y \> H-k- S
som kan modifiseres tilsvarende for å ta omsyn til usikkerheten i anslagene for // og cr. La oss illustrere den ekstra usikkerhet ved få observasjoner med et ek sempel: Eksempel 3: Vi har følgende tall for drivstoffkostnader for fire perioder (målt i tusen kroner):
27.4
29.5
26.7
30.4
Vi finner Y = 28.5, S = 1.74, som er forenlig med a = 1.5. Tommelfinger regelen k = 2 knyttet gir da beslutningsregelen
| Y - 28.5 |> 3.5
78
KAPITTEL 4 : Estimering og avviksanalyse
Det er altfor optimistisk å tro at denne gir ca. 5% garanti for feilaktig å utpeke en normal kostnad som urimelig høy. I virkeligheten er garantien bare ca. 17%! Tar en omsyn til usikkerheten i anslagene må avviksgrensen på 3.5 erstattes med et høyere tall, høyere jo færre observasjoner vi har. Med bare fire observasjoner viser det seg at beslutningsregelen med 5% garanti blir | Y - 28.5 |> 6.19
I dette eksemplet er det trolig bare overforbruk av drivstoff som har in teresse, dvs. vi såkalt ensidig situasjon. Dersom en ønsker en 5% ensidig garanti, vil en kunne eratatte 6.19 i regelen med 4.58. Dette betyr f.eks. at en kostnad på 32.0 i en ny periode ikke kan sies å være oppsiktsvekkende stor i lys av den erfaring vi sitter inne med fra før. En kostnad på 34.0 ville derimot være påfallende stor, og burde kreve nærmere gransking. En annen vri på avviksproblemet får vi dersom vi bare ser på de n observerte kostnadene, og spør hvorvidt en eller annen av disse, f.eks. for en av månedene siste år, avviker urimelig fra normal kostnad. I denne situasjon kan en utpeke som avviker dersom
l^-r \>k-s der k velges for å oppnå en ønsket sannsynlighetsgaranti. Igjen må tabellgarantien basert på normalfordelingen tas med en klype salt. Forskjellen fra situasjonen ovenfor er at de eventuelle avvikere vi studerer er med i beregningen av S, som dermed kan medføre at denne inflateres slik at de avvikende observasjonene ikke trer fram. Dette kan faktisk gi en redusert risiko for feilaktig å utpeke avviker. Det fins en enkel modifikasjon av beslut ningsregelen ovenfor som både tar omsyn til at forventning og standardavvik er anslått og at de eventuelt avvikende obsevasjonene er brukt i disse ansla gene. Dette er beskrevet i Kapittel 11. Den tilsvarende beslutningsreglen etter negativ metode \Y~Y |> H-kS
kan modifiseres på tilsvarende måte. I noen tilfeller er de tilgjengelige data kostnader i tidsperioder av ulik lengde, ulikt aktivitetsnivå og/eller ulikt prisnivå. Dersom en kan anta at forventet kostnad (såvel som standardavviket) er proposjonal med periodelengde (evt. aktivitetsnivå, prisnivå), kan en justere de observerte kostnader ved å dividere kostnadene med en faktor som representerer periodelengden (evt. aktivitetsnivået, prisnivået), og deretter nytte betraktningsmåten ovenfor på de justerte tallene.
4.4 Avvik fra lineær regresjon
79
For tidsrekkedata fra etterfølgende tidsperioder er en viktig forutsetning, i situasjonen med begrenset erfaringsgrunnlag ovenfor, at de etterfølgende observasjonene er uavhengige. I noen tilfeller kan det imidlertid tenkes at disse er korrelerte, eksempelvis dersom høye kostnader en periode gjerne etterfølges av lave den neste, såkalt negativ autokorrelasjon. Det fins metoder for analyse av tidsrekkedata som tar omsyn til eventuell autokorrelasjon, og som har potensiell anvendelse i revisjon. Når en vurderer kostnadstall over tid, er det ikke bare situasjoner der et enkelt tall avviker mye fra det øvrige som bør påkalle revisors interesse. Like påfallende er det at kostnadene er økt systematisk fra et visst tidspunkt av, eller viser en stigende trend. Slike systematiske endringer bør kunne oppdages, selv om hvert enkelt kostnadstall bare viser en moderat økning i hver periode, idet summen av økningen over flere perioder kan representere betydelige beløp. For å avsløre slike forhold kan revisor anvende metoder som bl.a. er beskrevet i litteraturen for industriell kvalitetskontroll, f.eks. knyttet til kontrolldiagram (Shewhart charts) og kumulativ sum metoder.
4.4
Avvik fra lineær regresjon
I en del situasjoner foreligger to eller flere variable som under normale drifts forhold bør stå i et visst forhold til hverandre over tid eller fra lokalitet til lokalitet. Et typisk eksempel er salgskostnader (V) som revisor kan ønske å se i sammenheng med salget (X). Det er ofte rimelig å anta at det påløper visse kostnader selv uten salg, og at variable kostnader øker med salget. Som en brukbar tilnærmelse antar vi at forventede salgskostnader er lineær funksjon av salget 2, dvs. lineær regresjon
EY = a + /3 • X slik at /3 er økningen i forventet kostnad ved å øke salget med en enhet. Vi kan da skrive
Y = a + /3 ■ X + U der U er et tilfeldig avvik fra de forventede kostnader. Risikoen for avvik kan uttrylkes ved standardavviket cr = cr(Uj. Revisor vil vanligvis ikke kjenne regresjonslinjen eksakt, og må da forsøke å etablere sammenhengen ut fra et begrenset antall observasjoner, f.eks. for et antall tidsperioder eller et antall 2Merk at foretaket gjerne ser det omvendt, dvs. forklarer salget ved salgskostnader (reklameinnsats).
80
KAPITTEL 4 : Estimering og avviksanalyse
lokaliteter (evt. personer). Revisor vil typisk være interessert i om tallene fra en av disse periodene (evt. lokaliteter, personer) harmonerer med de øvrige, eventuelt predikere en ny uavhengig observasjon. La oss si at revisor har sammenhørende verdier av salg (X) og salgskost nad (Y) for n tidsperioder (evt. lokaliteter, personer):
(Xi,^),^,^),.-.,^,^)
På grunnlag av disse kan en beregne den såkalte minste kvadraters regresjonslinjen
Y = å + 0-X Høyresiden kan oppfattes som et anslag på forventet Y for gitt X, og kan også brukes som en prediksjon for en ny Y for en gitt X. Beregningsformler for å og finnes i de fleste elementære lærebøker i statistikk og blir ikke gjentatt her, se f.eks. Lillestøl (1997). Forøvrig er regresjon lett tilgjengelig i programvare for PC-er. Vi skal isteden sette anvendelser i fokus. Eksempel 4: Anta at sammenhørende verdier av salg og salgskostnader for de 11 første månedene inneværende regnskapsår er gitt ved: Måned Januar Februar Mars April Mai Juni Juli August September Oktober November Desember
Salg (X) 403 000 728 000 721 000 664 000 809 000 767 000 604 000 410 000 491 000 446 000 572 000 -
Salgskostnad (Y) 12 000 16 000 14 000 16 800 16 400 15 600 12 800 9 600 12 000 11 600 13 200 -
Observasjonene og minste kvadraters linjen er tegnet inn i et spredningsdiagram i Figur 4.4, der tallene markerer nummeret på måneden. Linjen er her beregnet til Y = 5237 4- 0.0140 • X, som går fram av den etterfølgende utskrift utført med programvaren Minitab.
4.4 Avvik fra lineær regresjon
81
Figur 4.4: Salgskostnad vs. salg Regression analysis The regression equation is Kostnad = 5237 + 0,0140 Salg
Predictor
Constant Salg S = 1124
Coef 5237 0,013968
SE Coef 1487 0,002408
R-Sq = 78,97,
T
P
3,52 5,80
0,007 0,000
R-Sq(adj) = 76,57,
Unusual Observations Obs Salg Kostnad Fit SE Fit Residual St Resid 4 664000 16800 14511 371 2289 2,16R R denotes an observation with a large standardized residual
Det innsirklede punkt i figuren svarer til en måned (april) med relativt stor salgskostnad i forhold til salget, og vi ser at regresjonsanalysen selv har pekt ut denne observasjonen som uvanlig. Vurderinger av et avvik U kan i prinsippet foregå som i forrige avsnitt. Med positiv tilnærming og kjent standardavvik er beslutningsrgelen
| U |> k ■ der k er sikkerhetsfaktoren som skal gi den ønskede risiko for feilaktig å
82
KAPITTEL 4 : Estimering og avviksanalyse
utpeke en avviker. Ved normalfordelte avvik har vi de samme tabellverdier som i forrige avsnitt og de samme tommelfingerregler knyttet til k = 2 og k = 3. I praksis benyttes beslutningsregelen med beregnede residualer, dvs. avviket mellom observert Y2 og predikert Yz for den gitte X{ og med et anslag på standardavvikene til disse. For observasjon nr. i er dette Ui = Yr — Yt. Det mest nærliggende er å bruke beregnet standardavvik til residualene S som estimat for rr(Uj), som typisk gis i utskrifter fra regresjonsanalyse. I eksemplet ovenfor er residualen for april 2289, mens S = 1124. Residualen er altså noe mer enn 2 x S = 2248. Ifølge tommelfingerregelen svarende til 5% tosidig risiko og 2.5% ensidig risiko blir da april utpekt som mistenke ligDette ignorerer imidlertid den ekstra usikkerhet som ligger i at regresjonslinjen og standardavviket ikke er kjent, men anslått. Som i forrige avsnitt vil risikoen kunne være betydelig forskjellig fra tabellgarantien, spesielt dersom vi har få observasjoner. Den såkalte standardiserte residual (StResid) i regresjonsutskrifter tar imidlertid omsyn til dette. Denne er gitt ved Ul/S(Ui) der S(Ui) er et mer realistisk estimat for standardavviket til residualen (som er mindre enn S). Den standardiserte residual (StResid) i utskriften kan direkte sammen lignes med k, og avvik med StResid i tallverdi større enn 2 blir automatisk utpekt, i samsvar med at k = 2 gir 5% risiko for feilaktig å utpeke en avviker. Selv om observasjonene er normalfordelte, så er sannsynlighetsfordelingen til en standardisert residual relativt komplisert, og denne tabellgarantien må tas med en klype salt. I statistisk programvare fins ofte en opsjon der standardavviket til den potensielt avvikende observasjon beregnes ut fra en regresjon med denne observasjonen utelatt (ofte kalt t-residualer). Dette sikrer at anslaget for standardavviker til residualene ikke blir ”blåst opp”, slik at en stor residual forblir uoppdaget. Denne metoden kan også gi mer eksakte risikogarantier. I eksemplet ovenfor så det ut til at april hadde en unormalt høy salgs kostnad, men den naive standardiserte residual basert på S er bare 2.04, dvs. såvidt over 2. Programutskriftens standardiserte residual var 2.16, mens den t-standardiserte residualen blir 2.92. Denne gir her en klarere indikasjon på avviker. Vi skjønner at en forenklet analyse kan medføre at avvikere unnslipper vår oppmerksomhet. Pålitelighetsgarantien er knyttet til sjansen for feilaktig å utpeke en avviker for en bestemt måned. Sjansen for feilaktig å utpeke en avviker en eller annen måned blir selvsagt høyere. Ønskes denne på et bestemt nivå, f.eks. 5%, må k velges høyere. Under betegnelsen multiple sammenligninger
4.4 Avvik fra lineær regresjon
83
er det i statistisk litteratur beskrevet metoder og tabeller som gir slike simultane garantier.
I noen situasjoner har en fastlagt regresjonslinjen ut fra et observasjons materiale, men ønsker å fastslå hvorvidt en ny uavhengig observasjon Y for en gitt X er avvikende fra de øvrige. En kan da bruke regresjonsformelen til å predikere Y, og så bruke samme grove tommelfingerregel som ovenfor for å vurdere observert avvik fra predikert verdi. I eksemplet predikeres en salgskostnad på 16 551 for et salg på 810 000. En salgskostnad som overskrider 16 551 + 2-1124 = 18 799 blir da utpekt som mistenkelig. Enkelte regresjonsprogrammer gir mer detaljert informasjon, eksempelvis Values of Predictors for New Observations New Obs Salg 1 810000 Predicted Values for New Observations New Obs Fit SeFit 95.0% Cl 16551 606 ( 15179; 17922 ) 1
95.0% PI ( 13661; 19440 )
Her ser vi at prediksjonsintervallet (PI=”prediction interval”) med 95% garanti har 19 440 som øvre grense, slik at det bare er salgskostnader over dette som utpekes som avvikere, med 5% risiko for at dette var feil. Av dette kan det se ut som tommelfingerregelen peker ut avvikere feil mye of tere enn den omtrentlige 5% garantien knyttet til regelen. Dette henger sammen med at standardavviket S undervurderer risikoen for prediksjonsfeil, fordi den ikke tar omsyn til at regresjonslinjen er anslått. Programvaren (her Minitab) har tatt omsyn det. Forskjellen mellom vurderingen av residualer og avvik fra predikert verdi for en ny uavhengig observasjon kan illustreres ved følgende: Dersom salget i desember var like stort som i april, nemlig 664 000, vil anslått forventet salgs kostnad (”fit”) og usikkerheten i dette anslaget målt med sin standardfeil (SeFit) være det samme som i april, nemlig 14 511 og 371. Standardavviket til april-residualen og standardavviket til prediksjonsfeilen for desember blir imidlertid ulike, henholdsvis 1061 og 1184, og er bare tilnærmet lik S = 1124. En nærmere forklaring på dette gis i Kapittel 11. Dette betyr f.eks. at når salgskostnaden i desember foreligger, og det viser seg at den var like stor som i april, så gir dette ikke fullt så stor grunn til mistenksomhet, idet den standardiserte verdien blir 1.93 mot 2.16 for april.
84
KAPITTEL 4 : Estimering og avviksanalyse
Vi har ovenfor analysert avvik fra forventninger i en regresjonsmodell med en forklarende variabel etter den positive metode. Den negative metode er også aktuell i enkelte situasjoner. Dersom revisor har fastlagt H som grense for vesentlig avvik, er beslutningsregelen for å peke ut en residual eller ny observasjon som avviker gitt ved
| U |> H — k • S der sikkerhetsfaktorer for ønsket risiko er gitt i forrige avsnitt. Også her kan regelen modifiseres slik at den tar bedre omsyn til at forventningen er anslått, og samtidig få mer eksakte risikogarantier.
La oss kommentere noen av standardforutsetningene for regresjonsanalyse i lys av den aktuelle problemstilling: Konsekvensene ved brudd på normalitetsforutsetningene er kommentert i forrige avsnitt, og forbigås her. Teorien forutsetter at avvikene fra forventningen fra måned til måned er uavhengige av hverandre. I praksis behøver dette ikke alltid være tilfelle. Det kan f.eks. tenkes at en stor salgskostnad en måned omfatter en del ut gifter som skulle vært registrert i forrige måned, som derfor kanskje har fått registrert en liten salgskostnad i forhold til salget (sml. f.eks. mars-april i Figur 4.4, uten at noe slikt behøver å være tilfelle her). Det finnes måter å ta omsyn til seriekorrelasjon ved regresjonsanalyse av tidsrekkedata, men dette blir fort komplisert og upraktisk. En annen forutsetning er at standard avviket cr til de tilfeldige avvik U fra forventningen ikke avhenger av X. Det er vel naturlig å tro at risikoen for kostnadsavvik øker med salget, men dersom variasjonsområdet for X ikke er altfor stort, vil dette ha små kon sekvenser for resultatene av analysen. Selv om ulike brudd på forutsetninger kan medføre økt risiko for feilkonklusjoner, vil metodene likevel kunne være til hjelp dersom de brukes med en viss omtanke, og med den begrensede målsetting å isolere tall som krever oppfølging.
Vi har ovenfor sett på regresjon med en forklarende variabel. Det er ikke vanskelig å tenke seg situasjoner der flere variable kan bidra til å belyse eventuelle over kostnader. Spesielt kan såkalte indikatorvariable (0-1 vari able) være nyttige. I en situasjon der markedsforholdene har endret seg underveis, kan vi f.eks. innføre en variabel som er 0 i periodene før endrin gen og 1 i periodene etter. Den tilhørende regresjonskoeflfisienten måler da effekten av endringen. I en avviksanalyse av typen ovenfor blir det ekstra leddet en korreksjon som kan bidra til å hindre at et lite salg i forhold til
4.4 Avvik fra lineær regresjon
85
innsatsen (f.eks. på grunn av en ny konkurrent) blir feilaktig utpekt som en overkostnad. Samtidig kan korreksjonen bidra til at eventuelle virkelige overkostnader trer klarere frem. Det er også mulig å anvende indikatorvariable til å estimere størrelsen på en eventuell (konstant) overkostnad knyt tet til alle periodene i et fastlagt tidsrom, f.eks. for perioder med større risikopotensiale eller der en i ettertid fikk mistanke om uregelmessighet, se Kapittel 11.
Ulike former for regresjonsanalyse har også vist seg nyttige ved analyse av tverrsnittsdata i revisjon. Det gjelder bl.a. ved prioritering av ressurser, avdekking av underslag, manipulering av regnskapstall, klientvurderinger. Felles for mange av disse anvendelsene er et datagrunnlag bestående av et knippe nøkkeltall for flere avdelinger i samme konsern eller evt. flere sam menlignbare foretak.
Kapittel 5
Sammenfattende vurderinger 5.1
Risikofordelingsmodeller
Følgende modell er foreslått for å forhåndsvurdere risikoen for eksistens av vesentlige feil etter avsluttet revisjonsprogram: ER = IR- KR- DR- AR
Her er den såkalte endelige risiko (ER) uttrykt ved et produkt av fak torer der IR KR DR AR
= — = =
Iboende Risiko (risiko for at vesentlig feil oppstår) Kontroll Risiko (intern kontroll avslører ikke feilen) Detaljtest Risiko (detaljtest avslører ikke feilen) Annen Revisjonsrisiko (andre handlinger avslører ikke feilen)
Her representerer FR = IR ■ KR en før-revisjonsrisiko, som gir uttrykk for risikoen for at vesentlige feil oppstår, og forblir uoppdaget av klientens kontrollsystem (i litteraturen også kalt relativ risiko). Videre representerer RR = DR-AR revisjonsrisikoen, dvs. risikoen for at en eksisterende vesentlig feil ikke oppdages gjennom revisors handlinger (i litteraturen også kalt op pdagelsesrisiko). Vi har derfor
ER = FR ■ RR slik at et krav til ER sammen med revisors vurdering av FR, bestemmer den tolererbare revisjonsrisiko RR.
87
KAPITTEL 5 : Sammenfattende vurderinger
88 Merknader
1. I modellen ovenfor er alle risiki unntatt den iboende (IR) å oppfatte som betinget gitt at vesentlig feil forekommer. Riktigheten av å mul tiplisere sammen de øvrige risiki forutsetter enten uavhengighet mht. hvorvidt de ulike revisjonshandlinger oppdager feilen eller ikke, eller at det er en naturlig rekkefølge av handlingene, der hver ny risikofaktor er risikoen for at feilen forblir uoppdaget, gitt at den ikke er oppdaget ved de forutgående handlinger.
2. Enkelte foretrekker å ta utgangspunkt i en modell der en studerer risikoen for at en oppstått vesentlig feil ikke oppdages ved klientens interne kontroll eller av revisor. Dette innebærer at iboende risiko (IR) ikke er med i modellen. Her er det en nyanse, i forhold til å anta at iboende risiko er 100%, dvs. IR = 1. For en beregnet revisjonsrisiko blir det et spørsmål om hvordan denne skal fordeles på detaljtesting og annen revisjonsaktivitet som kan øke revi sors sikkerhet, i første rekke regnskapsanalytisk revisjon. I den utstrekning revisor foretar flere slike supplerende aktiviteter, vil en kunne tenke seg at AR er delt opp i flere faktorer, en for hver slik aktivitet.
Eksempel 1: Anta at revisor krever en endelig risiko (ER) på høyst 5%, og vurderer iboende risiko (IR) til 60%, kontrollrisikoen (KR) til 70%. I tillegg til vanlig detalj revisjon, vil revisor utføre regnskapsanalytisk revisjon med 20% sjanse for å oppdage en vesentlig feil. Så lenge annen revisjonsaktivitet er begrenset til dette, vurderes annen risiko (AR) til 80%. Vi får da
0.05 DR =------ —------ =-------- —------- = 0.14 IR-KR- AR 0.60 ■ 0.70 ■ 0.80 slik at kravet til detaljtestrisikoen blir høyst 14%.
Slik beregning er til hjelp ved planlegging av stikkprøvestørrelsen ved detaljrevisjonen, idet DR kan oppfattes som kravet til /3-risiko, slik det er de finert i Kapittel 3. I praksis vil det imidlertid kunne være betydelige vanskerforbundet med å tallfeste de størrelser som inngår i slike beregninger. Mange hevder at det er unødig å ta bryderiet med å vurdere iboende risiko og kontrollrisiko hver for seg, og at en like godt kan foreta en samlet vurdering av før-revisjonsrisikoen(FR).
89
5.1 Risikofordelingsmodeller
Tabell 5.1: Akseptabel detaljtestrisiko {DR) i %.
ER
1%
2%
5%
10%
FR 10 25 50 75 90 10 25 50 75 90 10 25 50 75 90 10 25 50 75 90
Annen 10 40 20 13 11 80 40 27 22 67 56 -
revisjonsrisiko {AR) 100 30 50 70 10 33 20 14 4 6 13 8 1 4 3 7 1 2 4 3 1 1 2 4 20 67 40 29 8 27 16 11 4 6 13 8 4 3 5 9 2 4 3 7 - 71 50 20 67 40 29 10 33 20 14 7 22 13 10 6 8 19 11 - 80 57 40 20 67 40 29 13 44 27 19 11 37 22 16
Formelen for detaljtestrisikoen lyder da
DR =
ER FR - AR
Tabell 5.1 gir DR for ulike kombinasjoner av ER, FR og AR. De situasjoner der akseptabel endelig risiko oppnås uten detalj testing er merket med strek. I praksis er slik testing heller ikke aktuell dersom den beregnede detaljtestrisiko er mer enn 50%. Mange setter denne grensen helt ned til 20- 25%, dvs. krever konfidensnivåer på minst 75-80% ved de talj testingen. I tabellen er trukket grenselinjer i henhold til dette. Merk at dersom revisjonen ikke omfatter analytiske elementer settes AR lik 100%, slik at det er kolonnen lengst til høyre som gjelder. Beregningen forutsetter at omfanget og risikoen ved annen revisjon allerede
90
KAPITTEL 5 : Sammenfattende vurderinger
er fastlagt, og at bestemmelsen av omfanget av detaljrevisjonen gjenstår. I andre situasjoner har man allerede bestemt seg for omfang og dermed risiko i forbindelse med detaljrevisjonen, og ønsker å bestemme krav til annen re visjon, slik at den endelige risiko blir tilstrekkelig lav. Da lyder formelen isteden
AR-
ER
FR - DR Merk at Tabell 5.1 også kan benyttes til å beregne AR for gitte verdier av ER, FR og DR, simpelthen ved å la DR og AR bytte rolle. I atter andre situasjoner planlegges omfanget av detaljrevisjon og annen revisjon samtidig, slik at det er naturlig først å beregne (den totale) revisjonsrisikoen ER RR = — = DR - AR FR
og så stille spørsmålet om hva som er den mest hensiktsmessige (og realis erbare) fordeling på faktorene DR og AR. Det skal imidlertid noteres at det er begrepsmessige problemer knyttet til risikofordelingsmodellen som i liten grad diskuteres i litteraturen.
5.2
Risikofastsetting
I praksis vil vurderingen av de faktorer som inngår i risikofordelingsmo dellen være preget av en viss subjektivitet, kall det revisorskjønn. I enkelte situ asjoner har en likevel objektive holdepunkter, f.eks. forankret i statistiske metoder. Nokså grove vurderinger vil i de fleste tilfeller være tilstrekkelig,og enkelte generelle anbefalinger kan derfor gis. Endelig risiko (ER): Den endelige risiko, slik den inngår i risikofordelingsmodellen, oppfatter vi som risikoen for at (en samlet) beløpsmessig feil ut over en vesentlighetsgrense er uoppdaget etter avsluttet revisjon på et av grenset område av revisors totale engasjement. Denne er revisors eget valg, men bør vel fastsettes på et nivå som man etter diskusjoner kan etablere som veiledende for bransjen, og som bør være kjent for brukere av revisors tjenester. I revisjonslitteraturen ser en i eksempler ofte brukt en endelig risiko lik 5%, men da gjerne sammen med en meget konservativ vurdering av iboende risiko (se nedenfor), slik at den endelige risiko egentlig er mye lavere. Med en realistisk vurdering av iboende risiko bør derfor kravet til endelig risiko kunne skjerpes noe, og 1% vil i mange tilfeller ikke være noe urimelig krav. I en situasjon der revisor ønsker en rimelig lav risiko for at
91
5.2 Risikofastsetting
ikke vesentlige beløpsmessige feil forekommer i revisors totale engasjement hos klienten, er det klart at den endelige risiko på hvert delområdemå settes lavt, se del II: Kapittel 9.1.
Før-revisjonsrisiko (FR) (også kalt relativ risiko): Denne består som nevnt av iboende risiko (IR) og kontrollrisiko (KR). Med et omfattende erfaringsgrunnlag vil en nok kunne fastsette noenlunde realistiske verdier tilpasset den enkelte klient. I mange tilfeller vil en måtte ta utgangspunkt i generelle revisorerfaringer, og eventuelt foreta justeringer alt ettersom risikoen vurderes som lav, moderat og høy i forhold til det generelle risikonivå. Følgende tabell er hentet fra CICA (1980), og er ment å representere revisorskjønn:
Risikofaktor Iboende risiko (IR) Kontrollrisiko (KR)
Revisors skjønn av risiko Lav Moderat Høy 40% 50% 60% 20% 50% 80%
Enkelte (bl.a. SAS 39) hevder at IR konservativt bør settes til 100% uansett. Tallene for kontrollrisiko gjelder typisk for amerikanske forhold. Det er hevdet at dette er noe lavt for norske forhold, og at verdiene 50%, 75% og 100% er mer realistiske. Det er klart at iboende risiko og kontrollrisiko ofte må sees i sammenheng, idet et pålitelig kontrollsystem gjerne kaller frem større årvåkenhet slik at feil oppstår sjeldnere, og omvendt med et dårlig kontroll system. Det kan derfor være gode grunner til å vurdere før-revisjonsrisikoen samlet. Følgende oppstilling sammenfatter i noen grad de skjønnsmessige vurderingene ovenfor:
Før-revisjons risiko (FR):
Lav 10%
Moderat 25%
Høy 50%
Ekstrem 90-100%
Merknad: Det er en utbredt misforståelse at kontrollrisikoen er det samme som den /3-risiko som revisor anvender i sin systemtest. KR er risikoen for at klientens kontrollsystem slipper gjennom en vesentlig beløpsmessig feil, mens /^-risikoen er sjansen for at revisor trekker feil konklusjon angående klientens system, der kontrollavvik ikke nødvendigvis betyr at vesentlige beløpsmessige feil foreligger. Det er derfor grunn til å hevde at en systemtest bare indirekte gir informasjon om kontrollrisikoen, og at en eventuell tallfest ing av denne krever mer omfattende innsikt.
92
KAPITTEL 5 : Sammenfattende vurderinger
Annen revisjonsrisiko (AR): Dette vil i første rekke omfatte ana lytisk risiko, som i de fleste tilfeller må fastsettes subjektivt. CICA (1980) gir følgende skjønnsmessige vurderinger: Lav Analytisk risiko: 0.3
Moderat 0.5
Høy 0.7
I enkelte situasjoner der statistiske inferensmetoder benyttes vil det være mulig å få til en mer objektiv vurdering av slik risiko, f.eks. styrkebetraktninger i forbindelse med varians ogregresjonsanalyse. Multiplikasjonen DR ■ AR i risikofordelingsmodellen kan rettferdiggjøres dersom aksept eller ikke av eksisterende vesentlig feil ved detalj revisjonen er uavhengig av aksept eller ikke ved annen revisjon. I enkelte situasjoner vil dette være en urimelig antakelse. I så fall må AR fastsettes som risikoen for feilaktig aksept ved annen revisjon gitt feilaktig aksept ved detalj revisjonen, eller alternativt DR fastsettes som risikoen for feilaktig aksept ved detaljrevisjonen gitt feilaktig akseptvved annen revisjon. Merknad. Den verdibaserte systemrevisjon som er beskrevet i Kapittel 3.8, blir av mange oppfattet som en supplerende revisjonsmetode med formål å redusere annen revisjonsrisiko, og dermed den endelige risiko.
5.3
Aposteriori risiko
Betraktningene ovenfor er i første rekke ment å være til hjelp for revisor ved fastsettelse av omfanget av revisjonsarbeidet. Brukere av revisors tjenester vil imidlertid kunne være interessert i risikoen for at vesentlige feil er til stede på et delområde, selv om revisor har avgitt en positiv beretning. En slik beregning tar utgangspunkt i før- revisjonsrisikoen (FR), som ofte om tales som apriori-risikoen for at vesentlig feil forekommer. Denne, sammen med revisjonsrisikoen (RR), bestemmer den såkalte aposteriori-risikoen ved formelen (Bayes lov, se del II):
Q
FR-RR ER ~ FR - RR + (1- FR) ~ ER+(1- FR)
QR uttrykker andelen av tilfeller der vesentlig feil forekommer, men for blir uoppdaget blant de tilfeller hvor revisor aksepterer populasjonen, som jo også omfatter tilfellet at ingen vesentlig feil forekommer. I Tabell 5.2 gir vi QR for en del ulike kombinasjoner av FR og RR, hvor kun den nordvestlige delen av tabellen har praktisk interesse.
93
5.3 Aposteriori risiko Tabell 5.2: Aposterioririsiko (QR) i %.
RR 1% 2% 5% 10% 20% 30% 50%
Før-revisjonsrisiko (FR) 10% 25% 50% 75% 90% 2.9 8.3 0.3 1.0 0.1 5.7 15.3 0.2 0.7 1.9 13.0 31.0 1.6 4.8 0.6 23.1 47.4 1.1 3.2 9.1 2.2 6.3 16.7 37.5 64.3 3.2 9.1 23.1 47.4 73.0 5.3 14.3 33.3 60.0 81.8
Tabell 5.3: Revisjonsrisiko (RR) i %.
QR 1% 2% 3% 4% 5%
Før-revisjonsrisiko (FR) 10% 25% 50% 75% 90% 0.3 0.1 1.0 9.1 3.0 0.2 0.7 18.4 6.1 2.0 1.0 0.3 3.1 27.8 9.3 1.4 0.5 37.5 12.5 4.2 1.8 0.6 47.4 15.7 5.3
Vi ser at selv om FR er høy, er det mulig å oppnå en lav aposterioririsiko ved å velge lav nok verdi av revisjonsrisikoen. Merk at denne tabellen også kan benyttes av klienten, med revisors valgte revisjonsrisiko kombinert med egen vurdering av før-revisjonsrisikoen i den foreliggende situasjon. Mange mener at revisor bør ta utgangspunkt i aposterioririsikoen QR ved planleggingen av revisjonsomfanget (dette kalles preposterioranalyse). Revisjonsrisikoen (RR) er bestemt av FR og QR ved formelen pp _ 1 — FR FR
QR 1- QR
Ut fra en ønsket aposterioririsiko (QR) kan en bruke Tabell 5.3 til å finne den akseptable revisjonsrisiko. Dette krever spesifikasjon av før- revisjons risikoen (FR). Ifall en ikke har et bredt erfaringsgrunnlag å bygge på, er det ofte aktuelt å bruke et konservativt anslag. I forrige avsnitt ble 50% angitt som en høy, men ikke ekstrem verdi. Vi ser at tilfellet FR = 0.5 gir
94
KAPITTEL 5 : Sammenfattende vurderinger
RR =
QR 1 -QR
QR
for liten QR
En moderat før-revisjonsrisiko er 25%, og FR = 0.25 gir (jfr. tabellen)
RR — 3 •
i
(^/ ll
~ 3 • QR
for liten QR
Resultatene ovenfor viser at dersom revisor anser aposterioririsikoen QR som et relevant kriterium, så vil et fast krav til størrelsen av revisjons risikoen RR (f.eks. 5% eller et fast krav til endelig risiko ER neppe kunne forsvares. Av formelen for QR ser vi at før-revisjonsrisikoen FR bør komme med i vurderingen i begge tilfeller. Vi ser at
ER = FRRR = (1 v - FR)' • V—Lirt ~ (1 — FR) • QR
for liten QR
Dette innebærer at en med økende før-revisjonsrisiko må redusere den endelige risiko (ved å redusere revisjonsrisikoen) for å oppnå samme aposterioririsiko. Eksempelvis vil en ønsket 5% aposterioririsiko kreve ca. 4% endelig risiko dersom FR er 20%, men 2.5% dersom FR er 50%. Sett i dette perspektiv vil en fast endelig risiko bare kunne forsvares dersom en opererer med konstant før-revisjonsrisiko, og i så fall er også revisjonsrisikoen fast. Det er betydelig uklarhet i litteraturen på dette felt, og selv anbefalinger fra organisasjoner som AICPA og CICA har vært løst fundert (for kritiske merknader se Dahlgaard (1990)). Teorien i dette avsnittet forutsetter at den interne kontroll fungerer slik at eksisterende vesentlige feil som oppdages av klienten blir fjernet, hvoretter revisjonsmaterialet kommer revisor i hende uten disse vesentlige feil. I deler av litteraturen (f.eks. Leslie, Teitlebaum & Anderson (1980)) er det gitt formler der aposterioririsikoen er beregnet under forutsetning av at feil opp daget i intern kontroll ikke blir rettet før revisjonen. Dette virker imidlertid lite rimelig.
Kapittel 6
Oppgaver 6.1
Quiz 1
Velg det beste svaret blant de fire svaralternativene (a), (b), (c) og (d) på hvert spørsmål.
1. En revisor ønsker å anslå total verdi av alle utbetalte tegninger ut fra en stikkprøve. Dette er (a) attributt-sampling
(b) variabel-sampling (c) pengeenhets-sampling (”dollar-unit sampling”)
(d) stratifisert sampling 2. Ved ett av følgende tilfeller er det tale om attributtsampling. Hvilket? (a) estimering av totalverdien av et varelager
(b) estimering av overvurderingen av et varelager (c) estimering av andelen lagerposter med verdi over 1000 kr.
(d) estimering av antall lagerposter i et varelager 3. Hva betyr mest for nødvendig stikkprøvestørrelse ved attributt-sampling i tillegg til ønsket sikkerhet (konfidensnivå) og ønsket presisjon (feilmargin)? (a) populasjonsstørrelsen
(b) revisors forhåndsantakelse om hyppigheten av attributtet 95
KAPITTEL 6 : Oppgaver
96
(c) revisors forhåndsantakelse om verdien av attributtet (d) attributt-koeflisienten 4. Dersom en for en gitt stikkprøveplan endrer ønsket sikkerhet fra 90% til 95%, vil da nødvendig stikkprøvestørrelse
(a) (b) (c) (d)
måtte økes kunne reduseres bli den samme være ubestemmelig
5. Dersom en for en gitt attributt-sampling plan endrer ønsket presisjon fra 2% til 4%, vil nødvendig stikkprøvestørrelse (a) (b) (c) (d)
måtte økes kunne reduseres bli den samme være ubestemmelig
6. Dersom en for en gitt attributt-sampling plan til nå har gått ut fra en ventet forekomst av attributtet på 2%, men ønsker å endre dette til 4%, vil nødvendig stikkprøvestørrelse (a) (b) (c) (d)
måtte økes kunne reduseres bli den samme være ubestemmelig
7. Når det viser seg at forekomsten av et attributt i stikkprøven var 4%, mens ventet forekomst som lå til grunn for stikkprøveplanen var bare 2%, vil feilmarginen (a) (b) (c) (d)
bli større enn planlagt bli mindre enn planlagt bli den samme være ubestemmelig
8. En revisor fastslår med konfidensnivå 90% at forekomsten av tvil somme transaksjoner i en populasjon av transaksjoner er høyst 8%. Han kan da slutte at forekomsten av tvilsomme transaksjoner er høyst 10% med konfidensnivå
97
6.1 Quiz 1 (a) fortsatt 90% (b) mer enn 90%
(c) mindre enn 90% (d) muligens mer, muligens mindre enn 90%
9. En revisor har med et tilfeldig utvalg på 100 transaksjoner estimert andelen tvilsomme transaksjoner til 2% med 4% som en øvre konfidensgrense svarende til konfidensnivå 95%. Dette betyr (a) 5% sjanse for at andelen tvilsomme er 4%
(b) 95% sjanse for at andelen tvilsomme er mellom 2% og 4% (c) 95% sjanse for at populasjonen inneholder høyst 4% tvilsomme
(d) at på forhånd var det 95% sjanse for at den beregnede øvre konfidensgrense ikke blir lavere enn den sanne andel tvilsomme. 10. Gitt en bunke på 2000 bilag der en ønsker å anslå andelen bilag med feil. En har satt 5% som en største tolererbar feilandel, men venter at fehandelen er bare 2%. Dersom en ønsker en øvre konfidensgrense lik ca. 4% med 90% konfidensnivå, så bør stikkprøvestørrelsen være ca. (a) 50 (b) 100 (c) 150 (d) 200
11. Den bokførte verdien av et varelager er kr. 2 100 000,-, men en har mistanke om at en del lagerposter er overvurdert. Det velges ut poster for gransking etter pengeenhetsmetoden (”dollar-unit sampling”)- lalt 100 kroneenheter ble valgt ut, og en fant at blant de tilhørende postene var tre overvurdert henholdsvis 100%, 60% og 40%. En øvre grense for overvurderingen i kroner svarende til 95% konfidensnivå er ca. (a) 30 000 (b) 60 000 (c) 130 000 (d) 190 000
12. Dersom du har 12 oppgaver hver med 4 svaralternativer, og velger ditt svar tilfeldig på alle oppgavene, er sannsynligheten for å få minst 8 rette svar tilnærmet lik (a) 0.104 (b) 0.026 (c) 0.009 (d) 0.003
Oppgaven ble gitt til eksamen i Høyere Revisorstudium 1983.
KAPITTEL 6 : Oppgaver
98
6.2
Quiz 2
1. Dersom en for en gitt stikkprøveplan endrer ønsket a- risiko fra 10% til 5%, vil nødvendig stikkprøvestørrelse (a) måtte økes
(b) kunne reduseres (c) bli den samme
(d) være ubestemmelig 2. Når det viser seg at forekomsten av et attributt i stikkprøven var 4%, mens ventet forekomst som lå til grunn for stikkprøvestørrelsen var bare 2%, vil /3-risikoen (a) bli større enn planlagt
(b) bli mindre enn planlagt (c) bli som planlagt
(d) være ubestemmelig 3. En revisor fastslår med /3-risiko 10% at forekomsten av tvilsomme transaksjoner i en populasjon av transaksjoner er høyst 8%. Han kan da slutte at forekomsten av tvilsomme transaksjoner er høyst 10% med /3-risiko
(a) fortsatt 10%
(b) mindre enn 10% (c) mer enn 10%
(d) muligens mer, muligens mindre enn 10%
4. Gitt en bunke på 2000 bilag der en ønsker å anslå andelen bilag med feil. En har satt 5% som en største tolererbar feilandel, men venter at feilandelen er bare 2%. Dersom en ønsker en /3-risiko på 5%, bør stikkprøvestørrelsen minst være
(a) 50 (b) 100 (c) 150 (d) 200 5. Hvor stor stikkprøve trengs når den høyeste tolererbare andel ukor rekte registreringer er 5%, mens ventet andel er 1%, og den ønskede 1) = 1 — 0.5116 = 0.4884. På samme måte kan vi beregne P(Y > 1) for andre verdier av M og n. Leseren kan selv forsøke å verifisere noen av sannsynlighetene i tabellen nedenfor, som ble omtalt i Kapittel 1.6 Eksempel 3: n 100 200 300
M=1 0.1000 0.2000 0.3000
2 0.1901 0.3602 0.5102
3 0.2712 0.4884 0.6574
4 0.3443 0.5910 0.7605
5 0.4102 0.6731 0.8327
I praksis vil selvsagt M være ukjent, men slike beregninger setter oss istand til å vurdere sjansen for minst en grov feil for ulike stikkprøvestørrelser under ulike omstendigheter. Dersom en ønsker at sjansen skal være minst 50% for å oppdage minst en grov feil i en populasjon med tre grove feil, ser vi at stikkprøven må omfatte et sted mellom 200 og 300 enheter, trolig i
8.3 Discovery-sampling
135
nærheten av 200. Ønsker vi at sjansen isteden skal være minst 75%, ser vi at stikkprøven må omfatte noe mer enn 300. De eksakte tall kan finnes ved prøving og feiling (de viser seg å være henholdsvis n = 207 og n = 370). Beregning på grunnlag av formelen ovenfor vil i praksis være noe tungvint. Det er ønskelig med en formel for tilnærmet beregning: Dersom M er liten (som vil være tilfelle i de fleste revisjonsanvendelser) blir
p(r = o)«(i For tilfellet N = 1000, M = 3 og n = 200 får vi (jfr. Eksempel 6) P(F = 0) « (1 - ^)3 = 0.5120 slik at P(Y > 1) ~ 0.4880, altså en ganske god tilnærmelse. Ønsker vi at sannsynligheten for å oppdage minst en grov feil skal være tilnærmet lik verdien s, må vi altså ha
Løser vi denne ligningen mhp. n får vi n = N- (1 - (1 -s)1/M) For tilfellet N = 1000, M = 3 og s = 0.75 får vi n = 1000 • (1 - 0.251/3) = 370
mens s = 0.50 gir n =■ 207. Dette er det samme som en finner ved prøving og feiling ut fra den eksakte formel (jfr. Eksempel 6).
Merknad. Når Y er hypergeometrisk fordelt (JV, Af, n) har vi sett at vi kan bruke binomisk tilnærming, dvs. at Y er tilnærmet binomisk fordelt med parametre (n, a = M/N}. Denne tilnærming er god når n er liten i forhold til N. Dette er ofte ikke tilfelle i discovery-sampling situasjoner. Imidlertid kan det vises at parametrene M og n kan byttes om i den hypergeometriske fordeling slik at Y kan betraktes som hypergeometrisk fordelt (N, n, M). Bruker vi binomisk tilnærming her, blir Y tilnærmet binomisk fordelt med parametre (M, a = n/N). Denne tilnærming er god når M er liten i forhold til N, som typisk er tilfellet for discovery-sampling situasjoner. Dette gir P(y = y)
Dette gir det tilnærmede uttrykk for P(Y = 0) som er angitt ovenfor.
KAPITTEL 8 : Utvalgsmodeller og revisjon
136
8.4
Variabel-sampling : Lotterimodellen
Anta at vi har en populasjon på N elementer, f.eks. bilag, der det til hvert element er knyttet en verdi på en variabel, f.eks. bilagets pålydende. Tenker vi oss elementene nummerert fra 1 til N (rekkefølgen er likegyldig) har vi
Element nr. 1 Verdi vi
2 v2
3
... ...
N
dvs. at til element nr. i er knyttet verdien V{. Disse verdiene er i utgangspunk tet ukjente for oss, og vi ønsker å trekke en stikkprøve med sikte på å skaffe oss informasjon. Anta at vi er interessert i gjennomsnittet av verdiene i populasjonen
v = — (vi + V2 H-------F w) Ifall vi er interessert i summen av verdiene i populasjonen v = vi + v2 + ... + v/v, nytter vi sammenhengen v = N • v. Vi trekker et tilfeldig utvalg på n elementer, og verdiene tilknyttet disse noteres. La oss si at de observerte verdier var
YuY2,...,Yn der altså Yj betegner verdien av det j’te element i utvalget (rekkefølgen er igjen likegyldig). Gjennomsnittsverdien av elementene i utvalget er
1 n
Det er da rimelig å bruke
Y som anslag for den ukjente v dvs. N ■ Y som anslag for den ukjente sum v = N • v. Verdien av elementene i utvalget Yi,Y2, ... ,Yn vil være bestemt av til feldigheter, dvs. av hvilket utvalg som tilfeldigvis blir trukket ut. Følgelig blir gjennomsnittsverdien Y i stikkprøven også bestemt av tilfeldigheter. For å kunne vurdere den rolle tilfeldighetene spiller i forbindelse med bruk av Y til å anslå populasjonskarakteristika, trenger vi kunnskap om sannsynlighetsfordelingen til Y.
8.4 Variabel-sampling: Lotterimodellen
137
Nå er vi ikke fullt så heldige som i tilfellet med attributtsampling, der forutsetningen om tilfeldig utvalg ledet til en relativt enkel sannsynlighetsfordeling beskrevet ved kun de tre parametrene populasjonsstørrelse, stikkprøvestørrelse og antall spesielle enheter. Her vil den eksakte sannsynlighetsfordelingen til størrelsene som angår stikkprøven være avhengig av alle de ukjente populasjonsverdiene. Det vil derfor være uoverkommelig å lage tabeller på samme måte som i situasjonen med attributt-sampling. Noe vet vi imidlertid om sannsynlighetsfordelingen til Y når utvalget er tilfeldig: Forventning og varians er gitt ved EY = v
N — n a2 varY = —---- - ■ — N- 1 n
der cr2 er den såkalte populasjonsvariansen 1 N YVl - ø 1=1
og er et mål for spredningene av verdiene i populasjonen. Et mer hensikts messig mål er populasjonsstandardavviket a = x/a2, som kan gis en spesiell fortolkning dersom fordelingen av verdier i populasjonen kan tilnærmes med normalfordelingen (Gauss-fordelingen). I dette tilfellet ligger ca. 68% av ver diene innenfor ±cr fra gjennomsnittsverdien u, mens ca. 95% av verdiene ligger innenfor ±2 • a, se figuren.
Figur 8.1: Normalfordelt populasjon Ifall fordelingen av verdier i populasjonen er tilnærmet normalfordelt, vil sannsynlighetsfordelingen til Y også være tilnærmet normal, se figuren. Denne fordelingen, ofte kalt sampling-fordeling en, har som angitt ovenfor forventning lik populasjonsgjennomsnittet v og standardavvik lik
138
KAPITTEL 8 : Utvalgsmodeller og revisjon
N—n N -I For n = 1 er samplingfordelingen identisk med populasjonsfordelingen. Siden cr(Y} avtar med n, blir sampling-fordelingen mer og mer konsentrert om v ettersom stikkprøvestørrelsen øker. Dette betyr at risikoen for å anslå v feil avtar med stikkprøvestørrelsen, og at vi i normaltilfellet kan beregne denne risikoen ut fra populasjonsstandardavviket. Generelt har vi
P{\YA{k)
der A(k) er arealet under (standard) normalkurven mellom —k og k. 1 Vi har følgende tabell k A®
1 0.683
2 0.954
3 0.997
'i praksis tabelleres ofte G(/c) som er realet under normalkurven til venstre for k. Da er 4(fc) gitt ved A(kj = 2G'(fc) — 1.
8.4 Variabel-sampling: Lotterimodellen
139
Eksempelvis er det ca. 95% sjanse for at Y avviker høyst to ganger sitt standardavvik fra v. Sammenhengen kan alternativt uttrykkes ved sannsyn ligheten for avvik høyst lik en gitt størrelse h (sett k ■ cr(Y) = h)
P{\Y -v\