Bevezetés a matematikai statisztikába [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Bevezetes a matematikai statisztikaba Dr. Ketskemety Laszlo, Pinter Marta Budapest, 1999. november 1.

Lektoralta: Dr. Gyor Laszlo Szerkesztette: Gy}ori Sandor

2

Tartalomjegyzek 1. A matematikai statisztika alapfogalmai 2. Becsleselmelet 2.1. 2.2. 2.3. 2.4. 2.5.

Torztatlan, konzisztens becsles Hatasos becslesek . . . . . . . . Elegsegesseg . . . . . . . . . . . Maximum-likelihood becsles . . Intervallumbecslesek . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

3. Hipotezisvizsgalat

3.1. Alapfogalmak . . . . . . . . . . . . . . 3.2. Neyman{Pearson- es Stein-lemma . . . 3.3. Parameteres probak . . . . . . . . . . 3.3.1. Egymintas u-proba . . . . . . . 3.3.2. A ketmintas u-proba . . . . . . 3.3.3. Az egymintas t-proba . . . . . 3.3.4. A ketmintas t-proba . . . . . . 3.3.5. Az F-proba . . . . . . . . . . . 3.3.6. A Welch-proba . . . . . . . . . 3.4. Nemparameteres probak . . . . . . . . 3.4.1. 2 -probak . . . . . . . . . . . . 3.4.2. Kolmogorov{Szmirnov-probak .

4. Regresszioanal zis

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

4.1. Veletlen meggyeles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1. Linearis regresszio ket valtozo kozott . . . . . . . . . . . . . . . . . . . . 4.1.2. Polinomialis regresszio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3. Linearisra visszvezethet}o ketparameteres regresszios osszefuggesek keresese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.4. A regresszios illeszkedes josaganak merese . . . . . . . . . . . . . . . . . 4.2. Tervezett (determinisztikus) meggyeles . . . . . . . . . . . . . . . . . . . . . . 4.3. Sztochasztikus approximacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1. Linearis regresszios feladat . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2. Negyzetes hiba minimalizalasa . . . . . . . . . . . . . . . . . . . . . . .

5. Eloszlasbecsles

5 9

9 16 24 28 36

43

43 44 49 49 51 51 52 53 54 54 54 59

61

61 61 63

64 65 66 70 73 74

77

5.1. Eloszlasfuggveny becslese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 5.2. Vapnik{Chervonenkis-elmelet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3

4

Tartalomjegyzek

6. S}ur}usegf uggveny becslese

87

7. Regressziobecsles

95

6.1. Az L1 hiba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 6.2. A hisztogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

7.1. A regresszios problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 7.2. Lokalis atlagolason alapulo becsl}ok . . . . . . . . . . . . . . . . . . . . . . . . . 96 7.3. Empirikus hibaminimalizalas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

8. Alakfelismeres

107

Ajanlott irodalom

115

8.1. A Bayes-dontes es kozeltese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.2. Lokalis tobbsegen alapulo dontesek . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.3. Empirikus hibaminimalizalas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

1. fejezet

A matematikai statisztika alapfogalmai A valoszn}usegszamtas elmeleteben az ( F P) Kolmogorov valoszn}usegi mez}on fogalmaztuk meg a teteleinket, azaz a P valoszn}usegi merteket vegig adottnak teteleztuk fel. A gyakorlati problemaknal azonban a valoszn}useg nem ismert, legfeljebb logikus el}ofeltetelezeseink vannak rola. A matematikai statisztika alapfeladata eppen az, hogy a veletlen kserletre, vagy a veletlen tomegjelensegre vonatkozo meggyelessorozat segtsegevel kovetkeztetni tudjunk a jelenseghez tartozo adekvat valoszn}usegi mertekre vagy annak egy jellemz}ojere, azt megfelel}o pontossaggal kozelteni tudjuk. Ilyen ertelemben a veletlen jelensegek matematikai modellezesenel a matematikai statisztika modszerei megel}ozik a valoszn}usegszamtas modszereit. A matematikai statisztika fogalomkore, modszertana viszont a valoszn}usegszamtas fogalmain es modszerein alapul, es ilyen szempontbol a matematikai statisztika koveti a valoszn}usegszamtast. Ugyanugy, mint a valoszn}usegszamtasnal, a veletlen kserlet (K) alapfogalmabol indulunk ki. Azt is feltesszuk, hogy ismert az elemi esemenyek  halmaza es az esemenyek F halmazrendszere. A P valoszn}useg pontosan nem ismert, csak azt tudjuk, hogy a K veletlen kserlethez tartozo valoszn}useg eleme egy P halmaznak. Tehat 8P 2 P eseten Kolmogorovfele valoszn}usegi mez}ot kapunk. A matematikai statisztika alapfeladata ezen P halmazbol kivalasztani azt a valoszn}usegi merteket, amely tenylegesen a kserlethez tartozik. A P valoszn}usegi mertekosztalyra esetenkent szokasos bizonyos megkotesekkel elni. Ilyen pl. az, amikor P-t dominaltnak tetelezzuk fel valamilyen adott  -veges mertekre nezve. Ezen azt ertjuk, hogy adott az ( F) merhet}o teren olyan  -veges mertek, amelyre 8P 2 P abszolut folytonos, azaz ha valamely A 2 F eseten  (A) = 0, akkor P (A) = 0 is 8P 2 P-re. A K veletlen kserlethez meggyelessorozatot szervezunk, azaz adatokat gy}ujtunk. Matematikailag ezt ugy fogalmazzuk meg, hogy adottnak tetelezunk fel egy X1  : : :  Xn Rd ertek}u fuggetlen, azonos eloszlasu valoszn}usegi vektorvaltozo sorozatot, amelyet statisztikai mintanak nevezunk. A P 2 P valoszn}useg eseten a minta kozos eloszlasa X (A) = P(X1 2 A) lesz, ahol A 2 Bd d-dimenzios Borel-halmaz. Tehat minden P 2 P eseten (Rd  Bd  X ) Kolmogorov-fele valoszn}usegi mez}o lesz. Jelolje QX ezen X eloszlasok osztalyat. Az (Rnd  Bnd  QX ) harmast statisztikai mez}onek nevezzuk. A statisztikai vizsgalatok celja ezutan az, hogy a QX eloszlascsaladbol valasszuk ki az X1  : : :  Xn mintahoz tartozo eloszlast. Statisztikai modellekben altalaban adott egy # : QX ! Rk funkcional, amelynek erte(2) keit akarjuk minel pontosabban megbecsulni. Ha teljesul, hogy #((1) X ) 6= #(X ) eseten (2) (1) X 6= X , a # funkcionalt parameternek (parametervektornak) nevezzuk. Ilyenkor a #-nak megfelel}o eloszlast # -val fogjuk jelolni: QX = f#  # 2 g, ahol  a parameterter, azaz a # 5

6

1. FEJEZET A matematikai statisztika alapfogalmai

lekepezes ertekkeszlete. Parameteres problema dominalt statisztikai mez}o eseten praktikusan azt jelenti, hogy a minta eloszlasa valamilyen parametert}ol fugg}o diszkret vagy folytonos eloszlascsaladbol szarmazhat csak. Peldaul, ha feltesszuk, hogy a mintank eloszlasa normalis, akkor a # = (m D) parametervektor egyertelm}uen meghatarozza a

8 Z < QX = :# : # (B ) = B

9 = dnmD (x)

ketparameteres eloszlasosztalyt, ahol

Yn Zxi 1 ; (t2;Dm2 ) n p e mD (x) = dt: i=1;1 2D

Abban az esetben viszont, ha ilyen # parameterfuggveny nem ismert, a statisztikai mez}o es a rajta megfogalmazott problemak nemparameteresek. Peldaul, ha feltesszuk, hogy R az X sta  tisztikai minta 8P 2P eseten veges varhato ertekkel rendelkezik, azaz jEP X1 j =  X1 dP <  1 8P 2P-re. Ilyenkor a # (P) = EP X1 funkcional nem feltetlenul parameter, # jo becslese nem jelenti meg jo valoszn}usegi mertek megvalasztasat. Adott tovabba egy t : Rn ! Rk merhet}o lekepezes, melyet statisztikai fuggvenynek nevezunk. A t(X1  X2  : : :  Xn ) osszetett fuggveny a statisztika. A statisztika tehat nem mas, mint 8P 2 P eseten egy valoszn}usegi vektorvaltozo az ( F P) Kolmogorov-fele valoszn}usegi mez}on.

1.1. den cio: Legyen ( F) merhet}o ter, es P valoszn}usegi mertekek egy halmaza, ahol P eseten ( F P) Kolmogorov-fele valoszn}usegi mez}o. Az X = (X1  X2  : : :  Xn )T

8P 2

statisztikai meggyelest statisztikai mintanak nevezzuk, ha Xi -k teljesen fuggetlen, azonos eloszlasu valoszn}usegi valtozok 8P 2 P eseten ( F P)-n, azaz 8P 2 P-re

P(Xi < x) = FP (x)

(i = 1 2 3 : : :  n)

es

P(Xi < xi  Xi < xi  : : :  Xik < xik ) = 1

1

2

2

Yk =1

FP (xi )

(82  k  n):

n a minta elemszama, FP (x) a minta eloszlasfuggvenye, Xi az i-edik mintaelem, P (A) =

P(Xi 2 A), A 2 Bd a minta eloszlasa. Egy ! 2  eseten az

X1 (!) = x1 X2 (!) = x2  : : :  Xn (!) = xn szam n-es a minta egy realizacioja. Megjegyzes :

1. Amikor egy statisztikai modszert alkalmazunk, mindig egy statisztikai minta realizaltja all a rendelkezesunkre. Ez a szam n-es azonban a veletlent}ol fugg, hiszen ha megismetelnenk a mintavetelezest, egeszen biztos, hogy mas adatokhoz jutnank. A modszerek elmeletenek targyalasakor ezert a mintat fuggetlen, azonos eloszlasu valoszn}usegi valtozok sorozatanak tekintjuk.

7 2. Ha az X statisztikai minta,  a Lebesgue-mertek, akkor a P eloszlasosztaly dominaltsaga most azt jelenti, hogy a minta abszolut folytonos, azaz 8P 2P eseten letezik a minta s}ur}usegfuggvenye, amelyet fP (x)-szel jelolunk. Ha viszont  a szamlalo mertek, vagyis  (B ) azt adja meg, hogy a B halmazban mennyi elem van a minta megszamlalhato ertekkeszleteb}ol, a P dominaltsaga -ra nezve azt jelenti, hogy a statisztikai minta eloszlasa diszkret.

8

1. FEJEZET A matematikai statisztika alapfogalmai

2. fejezet

Becsleselmelet 2.1. Torztatlan, konzisztens becsles Legyen P = fPg egy parameteres valoszn}usegi mertek-csalad. Feladat olyan tn(X1  X2  : : :  Xn ) 2 Rk (n = 1 2 : : :) statisztikasorozat megadasa, amely segtsegevel "jol" tudjuk becsulni a # parametervektort. Ha a parametert "pontosan" meg tudjuk becsulni, akkor ez egyben azt is jelenti, hogy az adekvat # eloszlast is kozelt}oleg megkapjuk. Az alabbiakban az elvarando "jo", "pontos" becslesi tulajdonsagokat denialjuk.

2.1.1. den cio: A tn(X1  X2  : : :  Xn ) 2 Rk statisztika a # 2 Rk parameter torztatlan becslese, ha 8P 2 P eseten a tn -nek mint valoszn}usegi vektorvaltozonak letezik varhatoertekvektora es EP tn = # (P) : Megjegyzes :

1. Az EP tn azt jeloli, hogy a varhatoertek-vektor fugg attol, hogy melyik P valoszn}usegi mertek alapjan szamoljuk az



(2) (k ) Ftn (x1  x2  : : :  xk ) = P t(1) n < x1  tn < x2  : : :  tn < xk



eloszlasfuggvenyt, majd abbol a varhato erteket. 2. Tudjuk, hogy egy valoszn}usegi valtozo ertekei a varhato erteke korul ingadoznak, tehat, hogy egy statisztika a parameter torztatlan becslese, azt az elvarhato tulajdonsagot fejezi ki, hogy a becslesi statisztika realizaltjai az ismeretlen parameter korul ingadoznak a parameterterben.

2.1.2. den cio: A tn(X1  X2  : : :  Xn) 2 Rk statisztikasorozat a # 2 Rk parameter aszimptotikusan torztatlan becslese, ha 8P 2 P eseten a tn -nek, mint valoszn}usegi vektorvaltozonak letezik varhatoertek-vektora es nlim !1 EP tn = # (P) : A torztatlansagbol nyilvanvaloan kovetkezik az aszimptotikusan torztatlansag, tehat ez utobbi a gyengebb tulajdonsag.

2.1.3. den cio: A tn(X1  X2  : : :  Xn ) 2 Rk statisztikasorozat a # 2 Rk parameter konst #, t zisztens becslese, ha 8P 2 P es 8" > 0 eseten nlim P ( ktn ; #k > ") = 0, azaz tn ;! n !1

sztochasztikusan konvergal a # parameterhez.

9

10

2. FEJEZET Becsleselmelet Megjegyzes :

1. A konzisztencia mas kovetelmenyt fejez ki, mint a torztatlansag. A konzisztencia tulajdonsaga azt a jogos elvarast fogalmazza meg, hogy a meggyelesek szamanak novekedtevel javuljon a becsles pontossaga.



2

Pk 

2



2

t(nj) ; #j   ezert a valo2. Mivel t(ni) ; #i   t(nj ) ; #j  = ktn ; #k2  k  1max  j  k j =1 szn}usegi vektorvaltozo sztochasztikus konvergenciaja ekvivalens a koordinantankenti sztochasztikus konvergenciaval. 2.1.4. den cio: A tn(X1  X2  : : :  Xn ) 2 Rk statisztikasorozat a # 2 Rk parameter negy2 zetes kozepben konzisztens becslese, ha nlim !1 EP jjtn ; #jj = 0. 2.1.1. tetel: Ha a tn (n = 1 2 : : :) statisztikasorozat negyzetes kozepben konzisztens becslese #-nak, akkor konzisztens becslese is. Bizonytas : A Markov-egyenl}otlensegb}ol:



P ktn ; #k2 > "2

E#jjtn ; #jj2 !0  "2

(n ! 1):

2.1.2. tetel: Ha a tn (n = 1 2 : : :) statisztikasorozat aszimptotikusan torztatlan becslese (i) #-nak es nlim !1  P tn = 0 (i = 1 2 : : :  k), akkor konzisztens becslese is. Bizonytas :

EP (t(ni) ; #i)2 = EP(t(ni) ; EPt(ni) + EPt(ni) ; #i)2 = h i = EP (t(ni) ; EP t(ni) )2 + (EP t(ni) ; #i )2 + 2EP (t(ni) ; EP t(ni) )(EP t(ni) ; #i) = =  2P (t(ni) ) + (EP t(ni) ; #i )2 ! 0 n ! 1:

Viszont a Markov-egyenl}otlenseg szerint:

(i)    2 P t(ni) ; #i > " = P (t(ni) ; #i)2 > "2  EP(tn"2; #i) ! 0

amib}ol mar kovetkezik az alltas.

Az

2.1.1. pelda: (Varhato ertek becslese) X n = n1

n X i=1

Xi

statisztikat az X1  X2  : : :  Xn statisztikai minta atlag- vagy empirikus kozep statisztikajanak nevezzuk. Legyen az X valoszn}usegi valtozo adott. Tegyuk fel, hogy 8P 2 P-re 9EPX . Legyen most a parameter # = #(P) = EP X . Legyen tovabba X1  X2  : : :  Xn  : : : statisztikai minta, amelynek eloszlasfuggvenye X -evel azonos 8P 2 P-re. Akkor

2.1

11

Torztatlan, konzisztens becsles

P (i) Az X n = n1 Xi empirikus kozep statisztika a # varhato ertek torztatlan becslese. n

i=1

(ii) Ha a feltetelekhez azt is hozzavesszuk, hogy 8P 2 P-re  2P X < 1 is, ugy X n negyzetes kozepben konzisztens becsles is. Bizonytas :





Pn Pn (i) EP X n = EP n1 Xi = n1 EP Xi = n1 n# = #: i=1 i=1

Pn ;

Pn 2 2 2   (ii) EP Xn ; # =  P Xn = P n1 Xi = n1  2P Xi = n1 n 2P X = PnX ! 0: 2

2

i=1

Az

i=1

2

2.1.2. pelda: (Szorasnegyzet becslese) s2n =

n 1X  2 n (Xi ; Xn) i=1

statisztikat az Xp1  X2  : : :  Xn statisztikai minta empirikus szorasnegyzet statisztikajanak nevezzuk. sn = + s2n az empirikus szoras statisztika. Az

sn2 = n ;1 1

n X i=1

(Xi ; X n )2

statisztikat az X1  X2  : :p :  Xn statisztikai minta korrigalt empirikus szorasnegyzet statisztika janak nevezzuk. sn = + sn2 a korrigalt empirikus szoras statisztika. Legyen az X valoszn}usegi valtozo adott. Tegyuk fel, hogy 8P 2 P-re  2P X < 1. Legyen most a parameter # = #(P) =  2P X . Legyen tovabba X1  X2  : : :  Xn  : : : statisztikai minta, amelynek eloszlasfuggvenye X -evel azonos 8P 2 P-re.

Pn

(i) Az s2n = n1 (Xi ; X n )2 empirikus szorasnegyzet statisztika a # szorasnegyzet aszimpi=1 Pn totikusan torztatlan becslese, az sn 2 = n;1 1 (Xi ; X n )2 korrigalt empirikus szorasi=1 negyzet statisztika pedig a # szorasnegyzet torztatlan becslese. (ii) Ha a feltetelekhez azt is hozzavesszuk, hogy 8P 2 P-re EP X 4 is, ugy s2n konzisztens, sn2 negyzetes kozepben konzisztens becsles is. Bizonytas : Fel fogjuk hasznalni a Steiner-tetelt: Segedtetel: (Steiner) Tetsz}oleges a x1  x2  : : :  xn valos szamokra n n n 1X 1X 1X 2 ( a ; xi )2 = (a ; xn )2 + ( x ; xi )2

n n n n (xn ; xi ) : i=1

Masreszt a = 0 valasztassal, atrendezes utan:

i=1

i=1

n n X 1X 1 2 2 2 n (xn ; xi ) = n xi ; xn: i=1

i=1

12

2. FEJEZET Becsleselmelet A segedtetel bizonytasa:

n n 1X 1X 2 ( a ; xi )2 = n n (a ; xn + xn ; xi ) = i=1

= (a ; xn )2 + 2(a ; xn ) n1

i=1 n X i=1

n X (xn ; xi ) + n1 (xn ; xi )2 : i=1

A kozeps}o tag nulla, gy az alltast igazoltuk. Az alltas bizonytasa: (i)

 X !  X ! X n ; n n

1 1 2 EP s2n = EP n Xi ; Xn = EP n Xi2 ; (Xn )2 = n1 EPXi2 ;EP(Xn )2 = i=1 i=1 i=1

;

# 1 n;1

= n  n  # + (EP X1 )2 ; n + (EP X1 )2 = n # ! # (n ! 1) Mivel sn 2 = n;n 1 s2n =) EP sn2 = n;n 1 EP s2n = #: (ii) Belathato, hogy 2 EP X 4 n n ;3 2 2 2 2 2  P sn = (n ; 1)2 n ; n(n ; 1) # ! 0 P sn ! 0: Hivatkozva a 2.1.2. tetelre s2n konzisztenciaja bizonytott.

2.1.3. pelda: (Kovariancia es korrelacios egyutthat o becslese) T

Legyen most az (X1  Y1 )T  (X2  Y2 )T  : : :  (Xn  Yn )T statisztikai meggyeles ketdimenzios statisztikai minta, ahol az (Xi  Yi )T parok azonos eloszlasu, teljesen fuggetlen valoszn}usegi vektorvaltozok. Ekkor a n ; X

;

1 cn = n ; 1 Xi ; X n Yi ; Yi i=1 T T 2  Y2 )  : : :  (Xn  Yn )

)T  (X

statisztika az (X1  Y1 minta empirikus kovarianciaja, n = sXcnsY pedig az empirikus korrelacios egyutthatoja, ahol pl.

v u u  sX = t

1

n ; X

n ; 1 i=1

Xi ; X n

2

az X1  X2  : : :  Xn statisztikai minta korrigalt empirikus szorasat jeloli. (i) A cn empirikus kovariancia az EP (X ; EP X )(Y ; EP Y ) kovariancia torztatlan becslese. Ha meg azt is feltehetjuk, hogy 9EP X 4  EP Y 4 is, akkor cn negyzetes kozepben konzisztens becsles is. (ii) Az n empirikus korrelacios egyutthato a korrelacios egyutthato aszimptotikusan torztatlan becslese. Ha meg azt is feltehetjuk, hogy 9EP X 4  EP Y 4 is, akkor n konzisztens becsles is.

2.1

13

Torztatlan, konzisztens becsles

Bizonytas :

(i) Jelolje cov (Xi  Yi ) = c EXi EYi = m: Ekkor  i = 1 (c + nm) = c + m EX Y = c + m: EXiYi = c + m EXi Y = EXY n n n Tehat (n ; 1) cn = azaz

n ; X

;

X ;X Y ; X Y ; Y X + X Y  Xi ; X Yi ; Y = i i i i n

i=1

i=1

E ((n ; 1) cn) = (nc + nm) ; (c + nm) ; (c + nm) + (c + nm) = (n ; 1) c: Megmutathato, hogy ahol



2 cn = m22 + s1 s2 + c  n n(n ; 1) n(n ; 1)



m22 = E (Xi ; EXi)2 (Yi ; EYi)2  s1 =  2 Xi  s2 =  2Yi : Mivel  2 cn ;! 0 gy a konzisztencia mar kovetkezik. (ii) Nem bizonytjuk. Bizonytasa megtalalhato Cramer: Mathematical statistics c. konyvben.

2.1.4. pelda: (Eloszlasfuggveny becslese) Tekintsuk azokat az ordk (x1  x2  : : :  xn ) skalar{vektor fuggvenyeket, melyek dencioja: xk = ord (x  x  : : :  xn ) = xj  k 1 2 ha xj a k-adik legnagyobb elem x1  x2  : : :  xn kozott. Az

Xk = ord (X1  X2  : : :  Xn ) (k = 1 2 : : :  n) k statisztikak a rendezett mintaelem-statisztikak. Megjegyzes : 1. A rendezett mintaelem-statisztikak kozott 8P 2P eseten 1 valoszn}useggel fennall, hogy X1  X2      Xn . Specialisan X1 = min fX1  X2  : : :  Xn g, es Xn = max fX1 X2  : : :  Xn g : 2. Ha a minta eloszlasfuggvenyet F (x)-szel jeloljuk, konny}u megmutatni, hogy a rendezett mintaelemek eloszlasfuggvenyeit es egyuttes eloszlasfuggvenyeit az alabbi modon lehet szamolni: n X n F (x)]i 1 ; F (x)]n;i   Fk (x) = P (Xk < x) = i i=k

Fkl (x y) = P (Xk < x Xl < y) =

14

2. FEJEZET Becsleselmelet n X i X

n! F (x)]j F (y) ; F (x)]i;j 1 ; F (y)]n;i  j !( i ; j )!( n ; i )! i=k j =l P (X1 < x1 X2 < x2 : : :  Xn < xn) = i in n X X X n! =  F (x1 )]i F (x2 ) ; F (x1 )]i ;i    1 ; F (xn )]n;in : i !( i ; i )!    ( n ; i )! n in =n in; =n;1 i =1 1 2 1 =

2

1

1

Az

2

1

1

8 0 < Fn (x) = : nk  1

ha x  X1 ha Xk < x  Xk+1 (k = 1 2 : : :  n ; 1) ha x > Xn veletlen fuggvenyt az X1  X2  : : :  Xn statisztikai minta empirikus eloszlasfuggvenyenek nevezzuk. Pn Hasznalatos az el}oz}ovel ekvivalens Fn (x) = IfXi 0 is es m 2 R is ismeretlen. Szerkesszunk D-re adott 0 < " < 1 mellett (1 ; ")-szint}u kondenciaintervallumot! A Lukacs-tetelre hivatkozva megint: (n;D1)sn 2 2n;1 . Az n ; 1 szabadsagfoku 2 -eloszlas tablazatbol megadhatok olyan 0 < c1 < c2 szamok, hogy 2

2



sn 2 < c 1 ; " = P c1 < (n ;D1) 2 2

!

teljesuljon. (A c1  c2 ertekek nyilvan kielegtik a P( 2n;1 > c1 ) = 1 ; 2" es P( 2n;1 > c2 ) = 2" felteteleket.) Egyszer}u atrendezessel kapjuk, hogy

0s 1 s 1 ; " = P @ (n ; 1) sn < D < (n ; 1) snA 

azaz a T1 = lesz D-re.

q (n;1) c2

sn

 T2 =

q (n;1) c1

c2

c1

sn statisztikapar (1 ; ")-szint}u kondenciaintervallum

2.5.4. pelda: (Kon denciaintervallum szerkesztese az ismeretlen parameterre exponenci-

alis eloszlas eseteben) Legyen X1  X2  : : :  Xn E () eloszlasbol szarmazo statisztikai minta, ahol  > 0 ismeretlen. Szerkesszunk -ra adott 0 < " < 1 mellett (1 ; ")-szint}u kondenciaintervallumot! A problema megoldasahoz felhasznaljuk az alabbi segedtetelt: Segedtetel: Legyen X1  X2  : : :  Xn E () eloszlasbol szarmazo statisztikai minta. Ekkor

a) Xi 2 E (1) b)

Pn X = nX 2 ;(n 1) azaz n 1 parameter}u gamma eloszlasu, j n

j =1

n;1 f;(x) = (nx; 1)! e;x (x > 0)

s}ur}usegfuggvennyel. A segedtetel bizonytasa:

a) P(Xj < x) = P(Xj < x ) = 1 ; e; x = 1 ; e;x =) Xj 2 E (1):

h

R1

b) 'Xj (t) = EeiXj t = eixt e;x dx = it;1 1 ex(it;1) 0

'nX n (t) = fuggvenye:

Z1 0

eixt

Yn

j =1

'X  (t) =

 1 n 1;it

i1 0

= 1;1it .

=) fnX n (x) = x(nn;;e1)!;x  mert a karakterisztikus 1

xn;1 e;x dx =  xn;1 1 ex(it;1) 1 ; 1 1 Z xn;2 ex(it;1) dx = (n ; 1)! (n ; 1)! it ; 1 (n ; 2)! it ; 1 0 1

0

2.5

41

Intervallumbecslesek

1

1

= 0 ; (n ; 2)! it ; 1 1



1



= (n ; 3)! it ; 1

xn;2

2 Z1 0



1 2 Z1 1 ex(it;1) 1 + 1 xn;3ex(it;1) dx = it ; 1 ( n ; 3)! it ; 1 0 xn;3 ex(it;1) dx =    = (;1)n



1

0 n



it ; 1



1

= 1 ; it

n

:

Az n 1 parameter}u gamma-eloszlashoz tartozo tablazatbol kiolvashatok olyan 0 < 1 < 2 szamok, amelyekkel 1 ; " = P(1 <  n X n < 2 ) = P( 1 <  < 2 ) n Xn n Xn

azaz a T1 = n X n  T2 = n X n statisztika par lesz (1 ; ")-szint}u kondenciaintervallum -ra. A 1  2 szamokat ugy kell meghatarozni, hogy P(0 < ;(n 1) < 1 ) = P(;(n 1) > 2 ) = 2" legyen. 1

2

42

2. FEJEZET Becsleselmelet

3. fejezet

Hipotezisvizsgalat 3.1. Alapfogalmak Tekintsuk a K veletlen kserletet es a hozzatartozo ( F) merhet}o teret, es a P valoszn}usegi mertekek osztalyat, ahol ( P P) Kolmogorov-fele valoszn}usegi mez}o 8P 2 P-re. Tegyuk fel, hogy P ket diszjunkt reszhalmazra bonthato: P = P0  P1 , es P0 \ P1 = : Statisztikai modszert (un. probat vagy tesztet) akarunk konstrualni annak eldontesere, hogy a veletlen kserlethez tartozo tenyleges P valoszn}usegi mertek melyik halmazhoz tartozik P0 es P1 kozul. Ehhez felalltunk egy H0 : P 2 P0 nullhipotezist, es egy H1 : P 2 P1 alternatv hipotezist. A nullhipotezis azt a feltevesunket fogalmazza meg, hogy az elmeleti P valoszn}useg a P0 reszhez tartozik, az alternatv hipotezisunk pedig azt, hogy ellenkez}oleg, pont a P1 reszhez. A kett}o felteves kozul az eljaras vegen egyertelm}uen kivalasztjuk es elfogadjuk majd az egyiket. A dontest az X1  X2  : : :  Xn  : : : statisztikai minta segtsegevel fogjuk meghozni. El}oszor is, el fogjuk keszteni a tn (X1  X2  : : :  Xn ) un. probastatisztikat, amely rendelkezni fog az alabbi tulajdonsaggal: adott 0 < " < 1 szamhoz megadhatok olyan K1 (") < K2 (") szamok, hogy P(K1 (")  tn  K2(")) 1 ; " 8P 2 P0 : A K1 (") K2 (") ertekeket kritikus ertekeknek, a segtsegukkel denialt Xe = fx : x 2 Rn  K1(")  tn(x)  K2 (")g n-dimenzios vektorhalmazt elfogadasi tartomanynak, a komplemens halmazat, Xk = Rn n Xe -t, pedig kritikus tartomanynak nevezzuk. Az " szam a proba terjedelme, az 1 ; " ertek pedig a proba szigni kancia szintje. A dontest ugy hajtjuk vegre, hogy ellen}orizzuk, hogy az X1  X2  : : :  Xn minta beleseik-e az Xe elfogadasi tartomanyba. Ha beleesik, akkor a H0 hipotezist, ellenkez}o esetben a H1 alternatv hipotezist fogjuk elfogadni. A hipotezis eldontese maskeppen alakulhat az egyes " terjedelmeken, ezert mindig jelezni kell, hogy milyen 1 ; " szint mellett fogadjuk el (vagy vetjuk el) a nullhipotezist. Termeszetesen szamolunk azzal is, hogy a dontesunk hibas. Azt mondjuk, hogy els}ofaju hibat kovetunk el, ha elvetjuk a nullhipotezist, holott valojaban az igaz. Masodfaju hibat akkor kovetunk el, ha elfogadjuk a nullhipotezist, holott az nem igaz. Minden mas esetben helyesen dontunk. A dontesi hibafajtakat az alabbi tablazatban mutatjuk: Dontes n Valosag H0 igaz H1 igaz H0 mellett jo dontes masodfaju hiba H1 mellett els}o faju hiba jo dontes

3.1.1. den cio: A p1 (" n P) = P((X1  X2  : : :  Xn)T 2 Xk ) P 2 P0  0 < " < 1 n 2 N 43

44

3. FEJEZET Hipotezisvizsgalat

fuggvenyt els}ofaju hibavaloszn}usegnek nevezzuk. A sup P((X1  X2  : : :  Xn )T 2 Xk )  "

8P2P0

relacio teljesulese eseten legfeljebb " terjedelm}u probarol beszelunk.

3.1.2. den cio: A p2 (" n P) = P((X1  X2  : : :  Xn )T 2 Xe ) P 2 P1  0 < " < 1 n 2 N fuggvenyt masodfaju hibavaloszn}usegnek nevezzuk.

3.1.3. den cio: Az E (" n P) = 1 ; p2(" n P) = P((X1  X2  : : :  Xn)T 2 Xk ) P 2 P1 0 < " < 1 n 2 N fuggvenyt a proba er}ofuggvenyenek nevezzuk. A sup P((X1  X2  : : :  Xn )T 2 Xk )

8P2P1

ertek a proba ereje.

3.1.4. den cio: Egy proba torztatlan, ha P ;(X1  X2  : : :  Xn )T 2 Xk  "

8P 2 P0 -bol

kovetkezik, hogy

P((X1 X2  : : :  Xn )T 2 Xk ) "

8 P 2 P1 

80 < " < 1:

Vagyis, ha H0 nem all fenn, nagyobb valoszn}useggel utastjuk el, mint amikor fennall.

3.1.5. den cio: Egy proba konzisztens, ha nlim !1 E (" n P) = 1 8P 2 P1 es 0 < " < 1. 3.1.6. den cio: Egy proba egyenletesen legjobb proba, ha adott els}ofaju hibaval rendelkez}o probak kozott a legkisebb a masodfaju hibaja.

3.2. Neyman{Pearson- es Stein-lemma

3.2.1. den cio: Egy veletlentett proba dontesfuggvenyen azt a  : Rn ! 0 1] fuggvenyt ertjuk, amely megadja, hogy ha a minta realizaltja eppen x akkor  (x) valoszn}useggel fogjuk a H0 hipotezist elutastani. Megjegyzes :

1. Egy (nem veletlentett) statisztikai proba dontesfuggvenye  (x) = I (x 2 Xk )  tehat a veletlentett probak a statisztikai probak kiterjeszteset adjak. 2. Veletlentett proba eseten a dontes ket lepesb}ol all. El}oszor az X minta alapjan kiszamoljuk a p =  (X) valoszn}useget, majd generalunk egy Y veletlen szamot a 0 1]-en egyenletes eloszlasbol. Ha p  Y , akkor elfogadjuk H0 -t, kulonben elvetjuk.

3.2

45

Neyman{Pearson- es Stein-lemma

3. Nyilvan EP (X) jelenti az els}ofaju hiba valoszn}useget, ha P 2 P0 es az er}ofuggvenyt, ha P 2 P1 . 4. Egy veletlentett proba terjedelmet a sup EP  (X) 

8P2P0

az erejet pedig a

sup EP  (X)

8P2P1

ertekek adjak.

3.2.1. tetel: (Neyman{Pearson fundamentalis lemma) Legyen a vizsgalt P valoszn}usegi mertekosztaly ketelem}u: P = fP0  P1 g : Letezzek az X = (X1  X2  : : :  Xn )T statisztikai minta s}ur}usegfuggvenye mindket valoszn}usegi mertekre nezve. Jelolje ezeket rendre f0 (x) es f1 (x). P nyilvan dominalt a  Lebesgue-mertekre nezve. A Qn Qn minta egyuttes s}ur}usegfuggvenyei gy L0 (x) = f0 (xi ) illetve L1 (x) = f1 (xi ) : Donteni i=1 i=1 szeretnenk a H0 : P = P0 hipotezisr}ol a H1 : P = P1 alternatv hipotezissel szemben. Ekkor (i) tetsz}oleges 0 < " < 1 szamhoz letezik olyan 0 < c0 es 0 <  < 1 szam, amivel a

8 1 <  (x) = :  0

ha L1 (x) > c0 L0 (x) ha L1 (x) = c0 L0 (x) ha L1 (x) < c0 L0 (x)

dontesfuggveny olyan veletlentett probahoz tartozik, aminek " a terjedelme, (ii) az (i)-ben denialt proba egyenletesen legjobb proba, (iii) ha  egy " terjedelm}u legjobb proba, akkor

P0 ( (X) =  (X)) = P1 ( (X) =  (X)) = 1: Bizonytas :

(i) Legyen 0 < " < 1 tetsz}oleges. Tekintsuk a G (c) = P0 (L1 (X) > cL0 (X))  c 2 R fuggvenyt. Mivel L0 (x) az X minta s}ur}usegf enye H0 mellett, ezert uLggv ( X) P0 (L0 (X) > 0) = 1 azaz G (c) = P0 L (X) > c : Mivel 1 ; G (c) jobbrol folytonos eloszlasfuggvenye az Y = LL ((XX)) valoszn}usegi valtozonak, G (c) egy monoton nem novekv}o, jobbrol folytonos fuggveny, melyre c!;1 lim G (c) = 1 clim !1 G (c) = 0: Ezert letezik olyan c0 szam, melyre G (c0 )  "  G (c0 ; 0) : Nyilvan G (c0 ; 0) ; G (c0) = P0 (L1 (X) = c0 L0 (X)) : Ha G folytonos c0 -ban, akkor  meghatarozasa erdektelen, hiszen ugyis egy 0-mertek}u halmazon veszi csak fel  ezt az erteket. Ilyenkor EP  (X) = P0 (L1 (X) > c0 L0 (X)) = G (c0 ) = " vagyis a proba terjedelme ": Ha viszont G nem folytonos c0 -ban, es (c0 )  = G (c ";;0)G ; G (c0 ) 0 1

0

1

0

0

46

3. FEJEZET Hipotezisvizsgalat akkor

EP  (X) = P0 (L1 (X) > c0L0 (X)) +  P0 (L1 (X) = cL0 (X)) = 0

= G (c0 ) +  (G (c0 ; 0) ; G (c0 )) = ":

c0 megvalasztasa lenyegeben egyertelm}u. Tegyuk fel ugyanis, hogy G(c) = " c 2 (c  c ) : Tekintsuk a   L ( x ) 1   T = x : p0 (x) > 0 \ c < L (x) < c 0 tartomanyt.

P0 (T ) = G (c) ; G (c ; 0) = " ; " = 0: x 2 T eseten cL0 (x) < L1 (x) < cL0 (x) miatt

Z

Z

T

T

0 = c L0 (x) d (x)
 (x)g es S ; = fx :  (x) <  (x)g : Konnyen lathato, hogy 8x 2 S = S +  S ; eseten ( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) 0 es 8x 2 S eseten  (x) =  (x) : Ezert Z ( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) d (x) = 0

Rn

= azaz

Z Rn

Z

( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) d (x) 0

S

Z

( (x) ;  (x)) L1 (x) d (x) c0

Rn

( (x) ;  (x)) L0 (x) d (x) =

= c0 (" ; EP  (X)) 0 azaz EP  (X) EP  (X)  vagyis  er}osebb, mint  : (iii) Legyen most  egy tetsz}oleges legfeljebb " terjedelm}u egyenletesen legjobb proba dontesfuggvenye. Legyen S = fx :  (x) 6=  (x) \ L1 (x) 6= c0 L0 (x)g : Ha x 2 S akkor 0

1

1

( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) > 0 lesz. Ezert, ha S nem nullmertek}u, vagy P0 vagy P1 szerint, akkor 0< =

Z S

Z

Rn

( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) d (x) = ( (x) ;  (x)) (L1 (x) ; c0 L0 (x)) d (x) :

3.2

47

Neyman{Pearson- es Stein-lemma

Ebb}ol kovetkezik, hogy

Z

Rn

Z

( (x) ;  (x)) L1 (x) d (x) > c0

Rn

( (x) ;  (x)) L0 (x) d (x) = c0 (" ; ") = 0

azaz EP  (X) > EP  (X)  ami ellentmondas azzal, hogy  egyenletesen legjobb proba dontesfuggvenye volt. Az ellentmondas abbol fakadt, hogy feltettuk, hogy S valamelyik valoszn}usegi mertek szerint nem nullmertek}u. Tehat,  es  mindket mertek szerint 1 valoszn}useggel egybeesik. 1

1

3.2.2. tetel: (Stein-lemma) Legyen a vizsgalt P valoszn}usegi mertekosztaly ketelem}u: P = fP0  P1 g : Letezzek az X s}ur}usegfuggvenye mindket valoszn}usegi mertekre nezve. Jelolje ezeket rendre f0 (x) es f1 (x). Az n X = (X1  X2  : : :  Xn )T statisztikai minta egyuttes s}ur}usegfuggvenyei gy L0 (x) = Q f0 (xi) i=1

Qn illetve L1 (x) = f1 (xi ) : Tegyuk fel, hogy i=1  jD (f0 k f1 )j = EP



0

1 )  < 1 log2 ff0 ((X 1 X1 ) 

vagyis, veges a ket eloszlas un. relatv entropiaja. Donteni szeretnenk a H0 : P = P0 hipotezisr}ol a H1 : P = P1 alternatv hipotezissel  szemben. Jelolje X(en)  Rn egy sta( n ) tisztikai proba elfogadasi tartomanyat, n = P0 X 2 Xk az els}ofaju hibavaloszn}useget,  n = P1 X 2 X(en) pedig a masodfaju hibavaloszn}useget. Legyen 0 < " < 21 tetsz}oleges terjedelem, amellyel n" = min n  azaz n" jeloli a legfeljebb " terjedelm}u probak eseten n X(e ) Rn n 0 tetsz}oleges volt. Megmutatjuk, hogy nincsen a fenti X(en) -nel jobb elfogadasi tartomanysorozat. Legyen ( n ) Y egy masik elfogadasi tartomanysorozat, melyhez az ny  ny els}ofaju- illetve masodfaju hibavaloszn}useg-sorozat tartozik.





ny = P1 X 2 Y(n) P1

Z



Xen

( )



X 2 Xe(n) \ Y(n)



=

Z

X(en) \Y(n)

Z

L0 (x) 2;n(D(f0 kf1 )+ ) d (x) 2;n(D(f0 kf1 )+ )

Xen

\Y(n)

L1 (x) d (x)

( )

L0 (x) d (x) :

\Y(n)

A De Morgan azonossagot, majd a Boole-egyenl}otlenseget hasznalva

Z

X(en) \Y(n)



1 ; P0

adodik, azaz





L0 (x) d (x) = P0 X 2 X(en) \ Y(n) = 1 ; P0 X 2 X(en)  Y(n)



X 2 X(en)



; P0









X 2 Y(n) = 1 ; n" ; ny

log2 (1 ; n" ; ny ) : 1 n log2 ny ;D (f0 k f1 ) +  + n 1 log  ;D (f0 k f1 ) : Tehat, Y(n) nem jobb X(en) -nel, Mivel  > 0 tetsz}oleges volt, nlim !1 n 2 ny ahol elertuk az also hatart. Ebb}ol az is kovetkezik, hogy n = n" .

3.3

49

Parameteres pro bak

3.3. Parameteres probak Ha adott egy P = fP#  # 2 g parameteres eloszlascsalad, akkor a

P = P0  P1  es P0 \ P1 =  felbontas helyett a  parameterter  = 0  1  0 \ 1 =  diszjunkt felbontasa segtsegevel is megfogalmazhatjuk a hipoteziseinket:

H0 : # 2 0 H1 : # 2 1 :

3.3.1. Egymintas u-proba

Most csak olyan P valoszn}usegi mertekeket tekintunk, ahol az X = (X1  X2  : : :  Xn )T minta adott D0 > 0 szorasu, ismeretlen m varhato ertek}u normalis eloszlasu lesz, a # parameter a varhato ertek (# = m): 0 = fm0 g  1 = fm 6= m0 g  azaz most a nullhipotezis H0 : EP X = m0  az alternatv hipotezis pedig H1 : EP X 6= m0 : Azt akarjuk tehat eldonteni, hogy lehet-e a minta varhato erteke egy adott m0 ertek, vagy attol szignikansan kulonboz}o lesz. Ha a H0 hipotezis igaz, akkor a mintaelemek N (m0  D0 ) eloszlasuak, amib}ol kovetkezik, hogy a mintaatlag statisztika szinten normalis eloszlasu: X n 2 N (m0  pDn ): Standardizalas p utan: u(X) = X nD;m n 2 N (0 1). A standard normalis eloszlashoz a (u") = 1 ; 2" osszefugges alapjan megadhatok olyan K1 (") = ;u" K2(") = u" kritikus ertekek, melyekre, ha a H0 hipotezis igaz, akkor fenn kell allnia, hogy n P(x ;nu;"m 0 lim P(Dnm < y) = 0 nm!1 y0 :

Bizonytas : A tetelt nem q nmbizonytjuk. q Megjegyzes : Dnm = n+m sup jFn (x) ; Gm (x)j = nnm max jFn (Zi ) ; Gm (Zi )j, + m i =1  2 :::n + m x2R ahol Z1  Z2      Zn+m a ket minta egyestesevel kapott minta rendezettje. A szupremum meghatarozasat, most is visszavezettuk maximum meghatarozasara. Ezt a probat homogenitasvizsgalatra hasznalhatjuk, azaz annak eldontesere, hogy a ket valtozo azonos eloszlasu-e. A nullhipotezisunk az, hogy a ket minta eloszlasfuggvenye azonos, az alternatv hipotezis ennek a tagadasa: H0 : F (x)  G(x) es H1 : F (x) 6 G(x): A hipotezis eldontese: tetsz}oleges 0 < " < 1 -hez adhato olyan x" kritikus ertek, hogy K (x" ) = 1 ; " legyen. Ha a Dnm < x" , akkor a nullhipotezist az adott szignikancia szinten elfogadjuk. Az alabbi tetel segtsegevel meg tovabb lehet a mintaelemszamot csokkenteni.

3.4.4. tetel: (Gnyegyenko{Koroljuk) Legyen a X1  X2  : : :  Xn  : : : statisztikai minta, melynek eloszlasfuggvenye F (x), es Y1  Y2  : : :  Yn  : : : az el}oz}ot}ol fuggetlen masik statisztikai minta, melynek eloszlasfuggvenye G(x). F es G abszolut folytonosak. Jelolje Fn (x) es Gn(x) a ket mintahoz tartozo empirikus eloszlasfuggvenyet. Tegyuk fel, hogy F (x)  G(x). Ekkor 8

r n > < 0 y 1 p12n p n p2n < y  2  P 2 sup jFn (x) ; Gn(x)j < y = > L(y) p x2R : 1 n 0 : E kf (c Z)k2 < K 1 + kc ; k2  ( ) n > 0 Akkor nlim !1

1 P 

n = 1

n=0 kCn ; k = 0

8c 2 Rk+1 

1 2 P  < 1:

n=0

n

1-valoszn}useggel.

Bizonytas : Szuksegunk lesz ket lemmara.

4.3.1. lemma: A 4.3.1. tetel feltetelei mellett teljesul, hogy letezik egy C valoszn}usegi valtozo, melyre nlim !1 kCn ; k = C 1-valoszn}useggel. Bizonytas : A rekurzv egyenlet mindket oldalabol vonjunk le -t, majd emeljuk negyzetre: kCn+1 ; k2 = kCn ; k2 ; 2n (Cn ; )T f (Cn Zn+1 ) + n2 kf (Cn Zn+1 )k2 :

Ezutan vegyuk mindket oldalnak a Z1  Z2  : : :  Zn valoszn}usegi valtozok altal generalt -algebrara vett felteteles varhato ertekeit:









E kCn+1 ; k2 j Z1 Z2  : : :  Zn = E kCn ; k2 j Z1  Z2 : : :  Zn







;



(Cn ; )T f (Cn Zn+1 ) j Z1  Z2  : : :  Zn + n2 E kf (Cn  Zn+1 )k2 j Z1  Z2  : : :  Zn : A fuggetlenseg miatt, es amiatt, hogy Cn csak Zn-t}ol fugg: ;2n E





E kCn ; k2 j Z1 Z2  : : :  Zn = kCn ; k2 

4.3

71

Sztochasztikus approximacio



es

E (Cn

; )T f (C

n  Zn+1 ) j Z1  Z2  : : :  Zn

= ( Cn ;  ) T es

E

Z RM

=

RM

(Cn ; )T f (Cn  y)  (dy) =

f (Cn y)  (dy) = (Cn ; )T r (Cn) 



kf (Cn Zn+1 )k2 j Z1  Z2  : : :  Zn

ahol  jeloli Z eloszlasat. Igy

Z

Z =

kf (Cn  y)k2  (dy)  K

RM



E kCn+1 ; k2 j Z1 Z2  : : :  Zn  kCn ; k2 ; 2n (Cn ; )T r (Cn) + n2 K

Mivel









1 + kCn ; k2 





1 + kCn ; k2 :

inf (c ; )T r (c) > 0

kc;k>"

ezert tovabb noveljuk a baloldalt, ha elhagyjuk a kozeps}o tagot:



E kCn+1 ; k2 j Z1 Z2  : : :  Zn



 kCn ; k2

;1 +  2 K +  2 K: n

n

Most tekintsuk azt a fVn gn=12::: valoszn}usegi valtozo sorozatot, melynek dencioja

Vn+1 = kCn+1

Q1 

; k2 

n+1 + K



1 X

j =n+1

j2 j +1

ahol k = 1 + j2 K : Megmutatjuk, hogy f(Vn  Fn)gn=12::: szupermartingal, ahol Fn = j =k  (Z1 Z2  : : :  Zn ) :

E Vn+1 j Fn]  kCn ; k2

;1 +  2 K  n

2 n+1 + n Kn+1 + K

= kCn ; k2 n + K

1 X j =n

1 X

j =n+1

j2j +1 =

j2j+1 = Vn:

Meg az is igaz, hogy az fE jVn jgn=12::: szamsorozat korlatos. Ugyanis Vn 0 ami a denciojabol latszik, es gy E jVn j = EVn : Masreszt a szupermartingal tulajdonsag miatt fE jVn jgn=12::: monoton fogyo. Vegul EV1 = E jV1 j < 1 miatt 9M : E jVn j  M < 1 n = 1 2 : : : : Alkalmazhato a szupermartingalok konvergenciatetele, miszerint letezik egy C valoszn}usegi valtozo, melyre nlim V = C 1 valoszn}useggel. Mivel megmutathato, hogy nlim  =1 !1 n !1 n 1 P

es nlim  2  = 0 ezert nyilvan az is teljesul, hogy nlim kC ; k2 = C 1 valoszn}useg!1 j =n j j +1 !1 n gel.

72

4. FEJEZET Regresszio analzis

4.3.2. lemma: A 4.3.1. tetel feltevesei mellett 1 X

n=1

1 valoszn}useggel.

n (Cn ; )T r (Cn) < 1

Bizonytas : A fCn gn=12::: rekurzv sorozatot denialo egyenlet mindket oldalabol levonva -t,h negyzetre emelunk, majd kiszamtjuk a varhato ertekeket. Az an = E kCn ; k2  bn = i 2E (Cn ; )T f (Cn  Zn+1 )  dn = E kf (Cn  Zn+1 )k2 jelolesekkel azt kapjuk, hogy an+1 = an ; nbn + n2 dn : Megmutathato, hogy 1 X

n=1

n bn = 2

1 X

n=1

h

i

nE (Cn ; )T f (Cn Zn+1 ) < 1

ahonnan a 4.3.1. lemma eredmenyet felhasznalva kovetkezik a monoton konvergencia tetelt alkalmazva, hogy 1 X

n=1

h

n E (Cn

; )T f (C

=E

"X 1

n=1

n  Zn+1 )

1 h i X

=

n=1

i

E n (Cn ; )T r (Cn) =

n (Cn ; )T r (Cn)

#

< 1:

Ezzel a lemmat bebizonytottuk hiszen, ha a varhato ertek mogotti sor 1 valoszn}useggel 1 lenne, akkor a varhato ertek nem lehetne veges. A 4.3.1. tetel bizonytasa: A 4.3.1. lemmaban bizonytottakbol kovetkezik, hogy letezik egy C valoszn}usegi vektorvaltozo es egy  1 valoszn}useg}u esemeny, hogy 8! 2  elemi  az 1 valoesemenynel fennall a nlim !1 Cn (!) = C (!) konvergencia. Masreszt jelolje  azt 1 P

szn}useg}u esemenyt, amelyen fennall n (Cn (!) ; )T r (Cn (!)) < 1: (Ilyen  a 4.3.2. n=1 lemma ertelmeben letezik.) Ekkor a (***) feltetel miatt megadhato olyan fmn gn=12::: indexT sorozat, hogy nlim ( ) feltetele miatt teljesul, !1 (Cmn (!) ; ) r (Cmn (!)) = 0: Ebb}ola tetel  hogy nlim kC (!) ; k = 0 8! 2  : Tehat, 8! 2  \  elemi esemenyre C (!) =  !1 mn  all, ami P ( \  ) = 1 miatt a tetel alltasat jelenti: nlim !1 kCn ; k = 0 1-valoszn}useggel. Megjegyzes : A 4.3.1. tetel segtsegevel igazolhato a nagy szamok torvenyenek alabbi er}os alakja: Ha fXn gn=12::: fuggetlen, azonos eloszlasu a varhato ertek}u, veges szorasu valoszn}usegi valtozo sorozat, melynek tagjai az RN terb}ol veszik fel az ertekeiket, akkor a Zn+1 = Zn ; n Zn ; Xn ] n = 0 1 : : : rekurzv valoszn}usegi vektorvaltozo sorozatra | ha Z0 = z0 2 RN tetsz}oleges es a n sorozat kielegti a 4.3.1. tetel ( ) felteteleit | teljesul, hogy lim kZ ; ak = 0 1 valoszn}useggel. n!1 n

Zn = an +

n X i=1

ci Xi 

4.3

73

Sztochasztikus approximacio

ahol

an = z0

nY ;1 i=0

(1 ; i ) es ci = i;1 (1 ; i )    (1 ; n;1 ) :

1  akkor Zn = X  n az atlagstatisztika. Ha z0 = 0 es n = n+1

4.3.1. Linearis regresszios feladat

Ebben a szakaszban az el}oz}o pont eredmenyeinek egy kulonlegesen fontos specialis alkalmazasat targyaljuk. Azzal az esettel foglalkozunk, amikor az r regresszios fuggveny r (c) = Ac ; m linearis fuggveny,; ahol A (k + 1)  (k + 1)-es kvadratikus matrix, m pedig Rk+1 -beli vektor. Legyen Z = *  melyre E* = A es E = m es f (c Z) = *c ; : Tegyuk fel, hogy az A matrix szimmetrikus, pozit ;

v denit es invertalhato. (Ekkor a regresszios fuggveny r (c) = Ef (c Z) = E *c ;  = Ac ; m.) 4.3.2. tetel: Jelolje * = (Vij )i=01:::k es  = (0  1  : : :  k ) es tegyuk fel, hogy j =01:::k

PN

es E i2 = M2 < 1: Jelolje Z1  Z2  : : :  Zn  : : : a i=1 Z-vel azonos eloszlasu, teljesen fuggetlen elemekb}ol a1llo sorozatot! Tegy uk fel tovabba, hogy 1 2 P P fn gn=12::: olyan pozitv tagu szamsorozat, melyre n = 1 es n < 1 teljesul.

9M1  M2

> 0, hogy

EVij2 

M1
0 : c ; A m Ac ; m K1 c ; A;1 m 8c 2 Rk+1 -re. Mivel A szimmetrikus es pozitv denit az A' = ' sajatertek egyenletnek letezik fn  'n gn=01:::k megoldasrendszere, ahol f'n gn=01:::k ortonormalt rendszer Rk+1 -ben, es i 0 i = 0 1 : : :  k. S}ot i > 0 i = 0 1 : : :  k is, mivel ellenkez}o esetben az A' = 0 egyenletnek lenne nem trivialis megoldasa, ami ellentmond annak, hogy A;1 letezik. Ekkor tehat Pk Pk Pk vehetjuk a kovetkez}o sorfejteseket: c = ci 'i  m = mi 'i . Ezekkel A;1 m.= 1i mi 'i : i=0 i=0 i=0 Ezt alkalmazva nyerjuk, hogy k

;c ; A;1m T ;Ac ; m = X c

A



i=0

X k

min  0ik i i=0





N X 1 i ci ; 1 mi i ;  mi (i ci ; mi ) = i

ci ; 1 mi i

2

i=1



=

  min i c ; A;1 m2 :

i

2



0ik

K1 = 0min  ik i



valasztassal igazoltuk a ( ) egyenl}otlenseget, ahonnan mar kovetkezik a 4.3.1. tetel ( ) feltetelenek teljesulese. A 4.3.2. tetel bizonytasat tehat befejezhetjuk, ha meg megmutatjuk, hogy 8c 2 Rk+1 -re



  ;

 E kf (c Z)k2 = E  *c ;  2  K 1 + c ; A;1m2



74

4. FEJEZET Regresszio analzis

valamely K > 0-ra. Ugyanis a fenti relacio eppen a 4.3.1. tetel ( ) feltetelenek teljesulesevel ekvivalens. El}oszor is

*c ; 2 = * ;c ; A;1 m+A;1m ; 2  2  2     *2 c ; A;1 m + A;1 m + kk2  0N N 1 X X 2 A  ;1 2  ;1 2 @ Vij c ; A m + A m + k  k2 : i=1 j =1

Innen

*c ; 2  (k + 1)2 M c ; A;1m2 + A;1 m2 + M  K 1 + c ; A;1m2 1 2 n

adodik, ahol



o



K = max (k + 1)2 M1  (k + 1)2 M1 A;1 m2 + M2 :

4.3.2. Negyzetes hiba minimalizalasa

A negyzetes hiba minimalizalasanak problemaja a linearis regresszios problemara vezethet}o vissza. A problema most az, hogy az X = (X0  X1  X2  : : :  XN )T  X0  1 valoszn}usegi vektorvaltozo komponenseinek milyen linearis kombinaciojaval kozelthet}o legjobban az Y celvaltozo, azaz milyen c = (c0 c1  : : :  ck )T 2 Rk+1 sulyok eseten lesz minim alis az m(c) =   2 2 k k E P ci Xi ; Y atlagos negyzetes hiba. Tekintsuk most az l (c y) = P ci yi ; yk+1 i=0 i=0 fuggvenyt! A minimalizalashoz szarmaztatnunk kell az l (c y) fuggveny c vektor szerinti gradiensvektorat:

f (c y) = grad l (c y) = =2

c

X ! X ! k k i=0

ciyi y0 

i=0

ci yi y1  : : : 

X ! !T k

= B c ; b ahol es

i=0

ci yi yk

0yy 0 0 B = 2B @ ...

yk y0

; 2 (yk+1 y0  yk+1 y1  : : :  yk+1 yk )T 

y0 yk



yk yk

...

.. .

1 C A

=

b = 2 (yk+1y0 yk+1y1 : : :  yk+1yk )T :

Masreszt a m negyzetes hiba gradiensere: grad m (c) = grad E c

c

"X k i=0

2k k 3 k X X X ci Xi ; Y = grad E 4 ci cj Xi Xj ; 2 ci Xi Y ; Y 2 5 = c #2

i=0 j =0

i=0

2k k 3 k X X X cicj EXi Xj ; 2 ci EXi Y ; EY 2 5 : = grad 4 c

i=0 j =0

i=0

4.3

75

Sztochasztikus approximacio

Innen, tekintettel arra, hogy k X k k X @ X c c E X X = 2 @cj i=0 j =0 i j i j i=0 ci EXi Xj

es

k @ X @cj i=0 ci EXi Y = EXj Y

eppen az adodik, hogy grad m (c) = 2

X k

c

0 EX X 0 0 B . . A=@ .

ahol

Vegul, ha

EXk X0

i=0

ci EXi X0 



EX0 Xk 1



EXk Xk

...

.. .

C A



X0 Xk



Xk Xk

...

Xk X0

i=0

ci EXi X1  : : : 

k X i=0

ci EXi Xk

!T ;

;2 (EX0 Y EX1 Y : : :  EXk Y ) = Ac ; m

0XX 0 0 B T * = XX = 2 @ ... ;

k X

es m = 2 (EX0 Y EX1 Y : : :  EXk Y )T :

.. .

1 C A

es  = (X0 Y X1 Y : : :  Xk Y )T 



akkor a Z = *  es f (c Z) = *c; jelolesekkel, r (c) = Ef (c Z) = E * c;E = Ac;m a regresszios fuggveny. Keresend}o az r (c) = 0 egyenlet gyoke, ahol a m (c) negyzetes hiba minimalis lesz.

4.3.3. tetel: Tegyuk fel, hogy A;1 letezik es E Xi4  < 1 i = 0 1 : : :  k EY 4 < 1 : Ha fZn gn=12::: Z-vel azonos eloszlasu valoszn}usegi vektorvaltozo sorozat (Zi = *i  i ),





akkor a

Cn+1 = Cn ; n *n+1Cn ; n+1  n = 0 1 2 : : :  C0 = c0 2 Rk+1 C ; A;1m = 0 1 rekurzv keplettel denialt valoszn}usegi vektorvaltozo sorozatra nlim !1 n valoszn}useggel, felteve, hogy

1 P 

n=0

n = 1 es

1 2 P  < 1 teljesul. n

n=0

Bizonytas : A denciojabol lathatoan szimmetrikus es pozitv szemidenit, hiszen tet; ;

; sz}oleges t 2Rk+1 -re tT At = E tT *t = E tT XXT t = E XT t 2 0: Megmutatjuk, hogy 9M1  M2

h

> 0 amivel E Xi2 Xj2

i



M1 es E kk2 =

Pk EX 2 Y 2  M : A Cauchy{Schwarzi

i=0

egyenl}otlenseget felhasznalva ez azonnal adodik, hiszen

r   h i   2 2 E X X  E X4 E X4 < 1 i j

i

j

2

76 es

4. FEJEZET Regresszio analzis k X i=0

EXi2Y 2 

k q   X E Xi4 E Y 4 ] < 1: i=0

Tehat teljesulnek a 4.3.2. tetel feltetelei, akkor az alltas is igaz lesz. Megjegyzes : A sztochasztikus approximacio modszerevel targyalhato a nemlinearis regreszszio feladatanak gradiens vektoros megoldasi modja is, amikor az l (c Z) = kf (c X) ; Y k2 alaku es f (c x) nemlinearis x-ben.

5. fejezet

Eloszlasbecsles Nemparameteres statisztika eseten nem all rendelkezesre semmilyen el}ozetes informacio a valoszn}usegi valtozo eloszlasarol, gy nem hasznalhatjuk azt a tudast | mint parameteres esetben |, hogy az eloszlas egy parameteres osztaly eleme lenne. Igy a szabalyok alapvet}o tulajdonsagainak is eloszlasfuggetlennek kell lenniuk.

5.1. Eloszlasfuggveny becslese Legyen X valos ertek}u valoszn}usegi valtozo. A feladat az X valoszn}usegi valtozo F (x) eloszlasfuggvenyenek becslese fuggetlen, azonos eloszlasu X1  X2  : : :  Xn mintakbol. Mint Pn korabban lattuk, az Fn (x) = n1 IfXi 0 kulonben.

5.1.2. tetel: (Kolmogorov) Ha F (x) folytonos, akkor

p

 K ( y ) lim P n sup jFn (x) ; F (x)j < y = 0 n!1 x2R

ahol

K (y ) =

1 X k=;1

(;1)k e;2k y

77

2 2

ha y > 0 kulonben,

78

5. FEJEZET Eloszlasbecsles

Vegyuk eszre, hogy az el}obbi tetelekben a hatareloszlas nem fugg az elmeleti eloszlasfuggvenyt}ol. Most adunk egy alternatv bizonytast az empirikus eloszlasfuggveny egyenletes konvergenciajara, amely sok hasznos oteletet tartalmaz es segt a kovetkez}o fejezet fontos tetelenek, a Vapnik{Chervonenkis-egyenl}otlensegnek a bizonytasaban.

5.1.3. tetel: (Glivenko{Cantelli) Legyen X1  : : :  Xn fuggetlen, azonos eloszlasu valos ertek}u valoszn}usegi valtozo F (x) = P(X1  x) eloszlasfuggvennyel. Ekkor



P sup jFn(x) ; F (x)j > "



x2R

2  8(n + 1)e;n" =32

es gy a Borel{Cantelli-lemma miatt lim sup jF (x) ; F (x)j = 0 n!1 x2R n 1 valoszn}useggel. A tetel bizonytasahoz szuksegunk lesz a Hoe#ding-egyenl}otlensegre.

5.1.4. tetel: (Hoeding)

Legyenek X1  : : :  Xn fuggetlen korlatos valoszn}usegi valtozok ugy, hogy Xi 2 ai  bi ] egy Pn valoszn}useggel. Jelolje az osszeguket Sn , vagyis Sn = Xi . Ekkor minden " > 0-ra i=1 n

;2"2 = P (bi ;ai )2

PfSn ; ESn "g  e es

i=1 n

;2"2 = P (bi ;ai )2

PfSn ; ESn  ;"g  e

i=1

:

Az egyenl}otlenseg bizonytasahoz hasznalunk egy segedegyenl}otlenseget:

5.1.1. lemma: Legyen X olyan valoszn}usegi valtozo, amelyre EX = 0, a  X  b. Ekkor minden s > 0-ra,   E esX  es (b;a) =8 : 2

2

Bizonytas : Az exponencialis fuggveny konvexitasabol kovetkezik, hogy ; a sb b ; x sa esx  xb ; a e + b ; a e  ha a  x  b.

Legyen p = ;a=(b ; a), ekkor kihasznalva, hogy EX = 0

EesX

b esa ; a esb b;a b ; a s = 1 ; p + pe (b;a) e;ps(b;a) def (u) = e  

5.1

79

Eloszlasfu ggveny becslese

ahol u = s(b ; a), es (u) = ;pu + log(1 ; p + peu ). Mivel  derivaltja

0(u) = ;p + p + (1 ;p p)e;u 

ezert (0) = 0 (0) = 0. A masodik derivalt, pedig

00 (u) =

p(1 ; p)e;u  1 : (p + (1 ; p)e;u )2 4

Igy a Taylor-sorfejtes szerint valamely  2 0 u]-ra, 2

2

2

2

(u) = (0) + u0 (0) + u2 00 ()  u8 = s (b 8; a) : Az 5.1.4 tetel bizonytasa: A bizonytas az ugynevezett Cherno-technikan alapul. A Markov-egyenl}otlensegb}ol tudjuk, hogy minden X nemnegatv valoszn}usegi valtozora es " > 0-ra,

PfX "g  E"X :

Ezert, ha s tetsz}oleges pozitv szam, akkor minden X valoszn}usegi valtozora

PfX "g = PfesX es"g  Eees" : sX

A Cherno#-technika lenyege, hogy keresunk egy olyan s > 0-t, amely minimalizalja, vagy kell}oen kicsive teszi a fels}o korlatot.

PfSn ; ESn( "g !) n X  e;s"E exp s (Xi ; EXi ) i=1

n n o ;s" Y s(Xi ;EXi )

= e 

e;s"

E e

i=1 Yn

es (bi ;ai ) =8 (5.1.1 lemma miatt) 2

2

i=1 n P 2 s (bi ;ai )2 =8 ;s"

= e e ni ;2"2

= e

P

(Xi -k fuggetlensege miatt)

=1

i=1

(bi ;ai )2

(s = 4"

Pn (b ; a )2 -t valasztva): i i

i=1

A masodik egyenl}otlenseg hasonloan bizonythato. Az 5.1.4 tetel ket egyenl}otlenseget osszekombinalva kaphatjuk, hogy n i=1

PfjSn ; ESnj "g  2e

;2"2 P (bi ;ai )2

:

80

5. FEJEZET Eloszlasbecsles

Az 5.1.3 tetel bizonytasa: Pn Vezessuk be a kovetkez}o jeloleseket: (A) = P(X 2 A) es n (A) = n1 IfXi 2Ag minden i=1 A  R merhet}o halmazra. Legyen A a (;1 x]( x 2 R alaku halmazok csaladja. Ezekkel a jelolesekkel sup jFn (x) ; F (x)j = sup jn(A) ; (A)j A2A

x2R

Feltehetjuk, hogy n"2 2, hiszen kulonben a fels}o korlat trivialis ( 1). 1. LE PE S: Szimmetrizalas szellemmintaval Legyenek X10  : : :  Xn0 2 R valoszn}usegi valtozok ugy, hogy X1  : : :  Xn  X10  : : :  Xn0 mind fuggetlen es azonos eloszlasu. Jelolje 0n az uj mintak szerinti empirikus merteket: n X 0 (A) = 1 I 0

n i=1 fXi 2Ag

n

Ekkor megmutatjuk, hogy n"2 2-re







  " 0   P sup jn(A) ; (A)j > "  2P sup n(A) ; n(A) > 2 A2A A2A

Ehhez legyen A 2 A egy olyan halmaz, amelyre jn(A ) ; (A )j > ", ha ilyen halmaz letezik, kulonben legyen A egy rogztett A-beli halmaz. Ekkor



    " 0   P sup n(A) ; n(A) > 2 P n(A ) ; 0n(A ) > 2"

A2A    " =

P jn (A ) ; (A )j > " 0n(A ) ; (A ) <  2    0   "  = E Ifjn (A );(A )j>"g P n (A ) ; (A ) < 2  X1  : : :  Xn

A felteteles valoszn}useget becsulhetjuk a Csebisev-egyenl}otlenseg segtsegevel a kovetkez}okeppen, ha n"2 2:





  P 0n(A ) ; (A ) < 2"  X1 : : :  Xn

1;

 Osszefoglalva tehat





(A )(1 ; (A )) 1 ; 1 1 n"2=4 n"2 2



1   " 0 P sup n(A) ; n(A) > 2 2 P (jn(A ) ; (A)j > ")

A2A

1

jn (A) ; (A)j > " 2 P Asup 2A

2. LE PE S: Szimmetrizalas veletlen el}ojelekkel Legyenek 1  : : :  n fuggetlen, azonos eloszlasu X1  : : :  Xn  X10  : : :  Xn0 -t}ol fuggetlen f;1 1g ertek}u valoszn}usegi valtozok, P(i = ;1) = P(i = 1) = 12 valoszn}usegekkel. Mivel X1  X10  : : :  Xn  Xn0 mind fuggetlen es azonos eloszlasu,

X n    sup  IfXi2Ag ; IfXi0 2Ag  A2A  i=1

5.1

81

Eloszlasfu ggveny becslese

X  n  sup  i IfXi 2Ag ; IfXi0 2Ag  A2A i=1

es

azonos eloszlasu. Igy az 1. lepes miatt



P sup jn(A) ; (A)j > "





A2A







!

n X  " 1  2P sup  (IfXi 2Ag ; IfXi0 2Ag ) >  2 = A2A n  i=1

X  ! n 1 = 2P sup n  i (IfXi 2Ag ; IfXi0 2Ag ) > 2" A2A i=1 

Az uniokorlatot hasznalva megszabadulhatunk az X10  : : :  Xn0 seged valoszn}usegi valtozoktol X  !  n 1 P sup n  i(IfXi 2Ag ; IfXi0 2Ag) > 2"  A2A

i=1

X  !  X  ! n n 1 " 1 " =    0 2Ag  > + P sup  I  P sup  i IfXi 2Ag  >  i f X i     4 4 A2A n i=1 A2A n i=1 X  !  n 1 = 2P sup n  i IfXi 2Ag  > 4" A2A i=1 

3. LE PE S:

 P 

n sup n1 i IfXi 2Ag A2A i=1

  Pn   > 4" = P sup n1  iIfXi xg > 4" valoszn}useg becslex2R i=1

AP sehez nezzuk el}oszor a felteteles valoszn}useget felteve X1  : : :  Xn -et. Vegyuk eszre, hogy rogztett x1  : : :  xn 2 R-re, ahogy x vegigfut R-en a kulonboz}o (Ifx 4  X1  : : :  Xn  2e;n" =32 : i=1 2

Igy









!

n X  "  1 P sup n  iIfXi 2Ag > 4  X1 : : :  Xn  2(n + 1)e;n" =32 : A2A 2

i=1

Mindket oldal varhato erteket veve







!

n X  P sup n1  iIfXi2Ag  > 4"  2(n + 1)e;n" =32 : A2A 2

i=1

 Osszefoglalva tehat azt kapjuk, hogy





P sup jn(A) ; (A)j > " A2A

2  8(n + 1)e;n" =32 :

5.2. Vapnik{Chervonenkis-elmelet Ebben a fejezetben a Glivenko{Cantelli-tetel egy altalanostasat bizonytjuk. Legyen most

X d-dimenzios valoszn}usegi valtozo, es legyenek X1  : : :  Xn az X eloszlasabol vettnfuggetlen P mintak. Hasznaljuk a kovetkez}o jeloleseket: (A) = P(X 2 A) es n (A) = n1 IfXi 2Ag i=1 minden merhet}o A  Rd halmazra.

5.2.1. den cio: Legyen x1 : : :  xn n darab Rd -beli rogztett pont, A pedig az Rd -beli

halmazok egy csaladja. Ekkor legyen NA (x1  : : :  xn ) az fx1  : : :  xn g \ A

alaku halmazok szama, ha A 2 A. Vagyis NA (x1  : : :  xn ) azt mutatja, hogy az A-beli halmazokkal az x1  : : :  xn pontoknak hanyfele kulonboz}o reszhalmazat lehet kimetszeni. Az A halmazcsalad n-edik shatter egyutthatoja

s(A n) def =

max NA (x1  : : :  xn ):

x1 :::xn 2Rd

Nyilvanvaloan s(A n)  2n , hiszen egy n pontu halmaznak osszesen 2n reszhalmaza van. Ha s(A n) = 2n , vagyis valamely n pontra NA (x1  : : :  xn ) = 2n , akkor azt mondjuk, hogy A darabokra tori (vagy shattereli) fx1  : : :  xn g-t. Ha ez nem teljesul, akkor barmely n pontnak van olyan reszhalmaza, amelyet nem tudunk kivalasztani A-beli halmazzal. Az is nyilvanvalo, hogy ha valamely n0 -ra s(A n0 ) < 2n , akkor mar minden n > n0 -ra s(A n) < 2n . 0

5.2

83

Vapnik{Chervonenkis-elmelet

5.2.2. den cio: A legnagyobb n0 szamot, amelyre meg van olyan n0 pont, amelyet A

darabokra tor, vagyis

s(A n0 ) = 2n

0

az A csalad Vapnik{Chervonenkis-dimenziojanak (vagy VC-dimenziojanak) nevezzuk, es VA val jeloljuk. Ha minden n-re s(A n) = 2n , akkor dencio szerint VA = 1. Azokat az A halmazcsaladokat, amelyekre VA < 1, Vapnik{Chervonenkis- (vagy VC-) csaladoknak hvjuk.

5.2.1. tetel: (Vapnik{Chervonenkis) Minden  valoszn}usegi mertekre es A halmazosztalyra, minden n-re es " > 0-ra





P sup jn(A) ; (A)j > " A2A

2  8s(A n)e;n" =32

Bizonytas : Kovetjuk a Glivenko{Cantelli-tetel bizonytasanak menetet. Most is feltehetjuk, hogy n"2 2, hiszen kulonben a korlat trivialis ( 1). Az els}o ket lepesben teljesen ugyanugy bebizonytjuk, hogy











n X  P sup jn(A) ; (A)j > "  4P sup n1  iIfXi 2Ag > 4" A2A A2A

!

i=1

Az egyetlen kulonbseg a 3. lepesben van. 3. LE PE S: Vegyuk eszre, hogy rogztett x1  : : :  xn 2 Rd -re ahogy A vegigfut A-n a kulonboz}o (Ifxi 2Ag  : : :  Ifxn 2Ag ) vektorok szama nem mas, mint az fX1  : : :  Xn g kulonboz}o olyan reszhalmazainak a szama, amelyeket ugy kaphatunk, hogy A-beli halmazokkal elmetszszuk, ami dencio szerint legfeljebb s(A n). Ezert rogztett X1  : : :  Xn -re a szupremum a X  !  n 1 P sup n  iIfXi 2Ag > 4" A2A

i=1 legfeljebb NA (X1  : : :  Xn )  s(A n)

valoszn}usegben Az uniokorlattal kapjuk, hogy









valoszn}usegi valtozo maximuma.

!

n X  "  1 P sup n  iIfXi 2Ag > 4  X1  : : :  Xn  A2A i=1

  !  X n " 1     s(A n) sup P n  i=1 i IfXi 2Ag > 4  X1  : : :  Xn A2A

Igy, mivel a szupremum kvulre kerult, eleg a

   X ! n 1 "    P n  iIfXi 2Ag > 4  X1 : : :  Xn i=1

felteteles valoszn}usegre talalni egy exponencialis fels}o korlatot. Ezt a Glivenko{Cantelli-tetel bizonytasanak 4. lepesevel teljesen azonos modon tehetjuk meg, es gy vegul kapjuk, hogy

P sup jn(A) ; (A)j > "  8s(A n)e;n" =32 : 2

A2A

84

5. FEJEZET Eloszlasbecsles

Ha a valoszn}usegi valtozoink valosak es az A halmazcsalad a (;1 x] alaku halmazokbol all, ahol x 2 R, akkor sup jn (A) ; (A)j = sup jFn (x) ; F (x)j

x2R A2A es s(A n) = n + 1, hiszen (;1 x] felegyenesekkel n pontnak n + 1 kulonboz}o reszhalmazat tudjuk kivalasztani:  fx1 g fx1  x2 g : : :  fx1  x2  : : :  xn g, ha x1 < x2 <    < xn .

Ekkor tehat a fenti tetel azt mondja, hogy



P sup jFn (x) ; F (x)j > "



x2R

2  8(n + 1)e;n" =32 :

Tehat a fenti tetel valoban altalanostja az empirikus eloszlasfuggveny konvergenciajara vonatkozo korabbi eredmenyt. A kovetkez}o tetel megmutatja a kapcsolatot egy halmazcsalad VC-dimenzioja es shatter egyutthatoja kozott.

5.2.2. tetel: Ha az A halmazcsalad VC-dimenzioja VA, akkor minden n-re s(A n) 

VA X n i=1

i :

Alkalmazva a binomialis tetelt, ebb}ol mindjart az is kovetkezik, hogy s(A n)  (n +1)VA . S}ot az is bebizonythato, hogy VA > 2-re s(A n)  nVA es minden VA -ra s(A n)  nVA + 1. Ez azt jelenti, hogy a shatter egyutthatora vagy az igaz, hogy s(A n) = 2n minden n-re, vagy pedig az, hogy s(A n)  nVA + 1, ami akkor teljesul, ha A Vapnik{Chervonenkis-csalad, vagyis a VC-dimenzioja veges. pE rdekes, hogy s(A n) nem eshet a ket nagysagrend koze, azaz nem lehet peldaul nln n vagy 2 n nagysagrend}u. Ha VA < 1, akkor a Vapnik{Chervonenkisegyenl}otlenseg fels}o korlatja exponencialis sebesseggel csokken, ahogy n n}o. A fenti tetel fels}o korlatja eles.

5.2.3. tetel:

1. Ha A a felegyenesek ; ; csaladja, azaz A = f(;1 x]( x 2 Rg, akkor VA = 1 es s(A n) = n + 1 = n0 + n1 . 2. Ha A az intervallumok ; ; csal ; adja: A = fx1  x2 ]( x1  x2 2 Rg, akkor VA = 2 es s(A n) = n(n+1) 2

+ 1 = n0 + n1 + n2 .

Bizonytas : 1. -et mar lattuk.

2. -ben VA = 2 abbol latszik, hogy ha lerogztunk 3 pontot az egyenesen, akkor nincs olyan intervallum, amelyik tartalmazza a ket szels}ot, de a kozeps}ot nem. A shatter egyutthatot megkapjuk, ha eszrevesszuk, hogy legfeljebb n ; k + 1 halmaz van fA \ fX1  : : :  Xn g( A 2 Ag-ban amelyre jA \ fX1  : : :  Xn gj = k( k = 1 : : :  n es egy amelyre jA \ fX1  : : :  Xn gj = 0. Ebb}ol

s(A n) = 1 +

n X k=1

(n ; k + 1) = n(n2+ 1) + 1:

5.2

85

Vapnik{Chervonenkis-elmelet

A ltalanostsuk a fenti eredmenyt d dimenziora.

5.2.4. tetel: 1. Ha A = f(;1 x1 ]      (;1 xd ]g, akkor VA = d. 2. Ha A az osszes Rd -beli teglalap csaladja, akkor VA = 2d. ra.

Ezek utan megkaphatjuk az 5.1.3 tetel altalanostasat d-dimenzios valoszn}usegi valtozok-

5.2.5. tetel: Legyen X1 : : :  Xn 2 Rd fuggetlen, azonos eloszlasu valos ertek}u valoszn}usegi valtozo F (x) = P(X1  x) eloszlasfuggvennyel. Ekkor



!

P supd jFn (x) ; F (x)j > " x2R

2  8nd e;n" =32

es gy a Borel{Cantelli-lemma miatt lim sup jF (x) ; F (x)j = 0 n!1 x2Rd n 1 valoszn}useggel. Talan az egyik legfontosabb halmazcsalad az Rd -beli felterek csaladja.

5.2.6. tetel: Legyen A az Rd -beli felterek, azaz az fx : aT x b a 2 Rd  b 2 Rg alaku

reszhalmazok csaladja. Ekkor VA = d + 1. Nezzunk meg egy negatv peldat:

5.2.7. tetel: Ha A az osszes R2 -beli konvex sokszog csaladja, akkor VA = 1. Bizonytas : Legyenek x1  : : :  xn 2 R2 az egysegkor kulonboz}o pontjai, ekkor konny}u latni, hogy barmely reszhalmazukhoz letezik olyan konvex sokszog, amelyik pontosan azokat a pontokat tartalmazza.

86

5. FEJEZET Eloszlasbecsles

6. fejezet

S}ur}usegfuggveny becslese 6.1. Az L1 hiba Az egyenletes konvergencia ellenere az empirikus eloszlasfuggveny sokszor nem bizonyul eleg jo eloszlasbecslesnek. A mertekelmeletb}ol tudjuk, hogy az F (x) eloszlasfuggveny egyertelm}uen meghatarozza a (A) eloszlast. A Glivenko{Cantelli-tetel azt mondja, hogy az Fn (x) empirikus eloszlasfuggveny egyenletesen konvergal az F (x) eloszlasfuggvenyhez. U gy t}unik, hogy ezzel megoldottuk a (A) eloszlasbecslesenek problemajat. Sajnos a statisztikaban sok problema eseten a n(A) empirikus eloszlasbecsles hasznalhatatlan. Er}osebb hibakriteriumot kell keresnunk.

6.1.1. den cio: Ket valoszn}usegi mertek,  es  variacios tavolsaga V (  ) = sup j(A) ;  (A)j A

ahol a szupremumot az osszes Borel-halmaz felett vesszuk.

6.1.1. tetel: (Schee) Ha a  es  valoszn}usegi mertek abszolut folytonos f , illetve g s}ur}usegfuggvennyel, akkor Z 1 V (  ) = 2 jf (x) ; g(x)j dx: Bizonytas : Jelolje A = fx : f (x) g(x)g. Ekkor egyreszt

Z  Z   V (  ) = sup j(A) ;  (A)j = sup  f (x) dx ; g(x) dx

A A   A A Z  Z Z  

 f (x) dx ; g(x) dx = (f (x) ; g(x)) dx =  A A A 0 1 Z Z = 21 B @ (f (x) ; g(x)) dx + (g(x) ; f (x)) dxC A= A (A )c Z 1 =2

jf (x) ; g(x)j

87

dx:

88

6. FEJEZET Su}ru}segfuggveny becslese

Masreszt

 Z   Z Z Z    f (x) dx ; g(x) dx =  (f (x) ; g(x)) dx + ( f ( x ) ; g ( x )) d x         A A A\A A\(A )c 0 1 Z Z  max B (g(x) ; f (x)) dxC @ (f (x) ; g(x)) dx A A\A A\(A )c 0 1 Z Z  max B @ (f (x) ; g(x)) dx (g(x) ; f (x)) dxC A=  A (A )c Z 1 =2

jf (x) ; g(x)j

dx:

Z 1 V (  ) = 2 jf (x) ; g(x)j dx:

Tehat

Ebb}ol a tetelb}ol az kovetkezik, hogy ha talalunk egy L1 -ben konzisztens s}ur}usegfuggvenybecsl}ot, akkor abbol kaphatunk egy variacios tavolsagban konzisztens eloszlasbecsl}ot.

6.1.2. den cio: Az fn s}ur}usegfuggvenybecsl}o x-nek es az f s}ur}usegfuggvenyb}ol vett fug-

getlen, azonos eloszlasu X1  : : :  Xn mintaknak Borel-merhet}o fuggvenye:

fn(x) = fn(x X1  : : :  Xn): Ha fn egy L1 -ben konzisztens s}ur}usegfuggvenybecsl}o, azaz

Z

lim jjf ; fnjj = nlim !1 jf (x) ; fn(x)j dx = 0

n!1

(sztochasztikusan) 1 valoszn}useggel, akkor a

Z

~n(A) = fn(x) dx A

eloszlasbecsl}ore (sztochasztikusan) 1 valoszn}useggel.

6.2. A hisztogram

lim V ( ~n ) = 0

n!1

R

Ha f a  valoszn}usegi mertek s}ur}usegfuggvenye, akkor f = (A) minden Borel-merhet}o A

halmazra, f majdnem mindenhol egyenl}o a dd Radon{Nikodym-derivalttal, ahol  a Lebesgue-merteket jeloli. A legtobb s}ur}usegfuggveny-becsl}o ezt a derivaltat probalja kozelteni. Ket standard L1 -ben konzisztens s}ur}usegbecsl}o a hisztogram es a magfuggvenyes becsl}o.

6.2

89

A hisztogram

Legyen Pn = fAn1  An2  : : :g az Rd egy partcioja pozitv es veges Lebesgue-mertek}u cellakra. Ekkor a hisztogram becsl}o az

fn(x) = n((AAn((xx)))) n

fuggveny, ahol n az empirikus mertek, es An (x) = Anj , ha x 2 Anj . A cellak gyakran hn elhosszusagu d dimenzios kockak, ebben az esetben

fn(x) = n(Ahnd (x)) n

6.2.1. tetel: Tegyuk fel, hogy -nek letezik f s}ur}usegfuggvenye. Ha a hisztogram becsl}o-

nel minden origo kozeppontu S gombre

sup diam(Anj ) = 0

lim

n!1 j :Anj \S 6=

es

jfj : Anj \ S 6= gj = 0 lim n!1 n

akkor

lim

Z

n!1

jf (x) ; fn (x)j (dx) = 0

1 valoszn}useggel, ahol diam(A) = sup jjx ; yjj. xy2A

Bizonytas :

Z

Z Z jfn(x) ; f (x)j (dx)  jfn (x) ; Efn (x)j (dx) + jEfn(x) ; f (x)j (dx) | {z } | {z } variacios tag

torztas

ahol Efn(x) a mintak szerinti varhato erteket jeloli. Variacios tag:

Z

jfn (x) ; Efn(x)j (dx) =

XZ

j Anj

jfn (x) ; Efn(x)j (dx) =

X j

jn (Anj ) ; (Anj )j

hiszen fn (x) konstans minden cellan. Jelolje Mn = jfj : Anj \ S 6= gj es szamozzuk at a cellakat ugy, hogy An1  An2  : : :  AnMn MSn legyen az az Mn cella, amelyre Anj \ S 6= . Legyen Sn = Anj .

Z

jfn (x) ; Efn(x)j  

X

j =1

jn (Anj ; (Anj )j + n (Snc ) + (Snc ) 

X jn (Anj ) ; (Anj )j + jn (Snc ) ; (Snc )j + 2(Snc )  X c c c



jn (Anj ) ; (Anj )j + jn (Sn ) ; (Sn )j + 2(S

)

90

6. FEJEZET Su}ru}segfuggveny becslese

Legyen A azon halmazok csaladja, amelyek az An1  An2  : : :  AnMn  Snc veges egyestesei. Ekkor a Sche#e-tetel miatt Mn X

jn (Anj ) ; (Anj )j + jn (Snc ) ; (Snc )j = 2 sup jn (A) ; (A)j A2A j =1

tehat 2(S c ) < " eseten a Vapnik{Chervonenkis-egyenl}otlenseg miatt

P

Z



jfn (x) ; Efn(x)j (dx) > "  P







2 sup jn (A) ; (A)j + 2(S c ) > " A2A



= P sup jn (A) ; (A)j > 2" ; (S c) A2A

=



" c 2  8s(A n)e;n( 2 ;(S )) =32  " c 2  8  2Mn +1 e;n( 2 ;(S )) =32

A tetel masodik feltetele miatt

Mn ! 0 n

tehat elegend}oen nagy n-re a jobb oldal kisebb, mint " e;n( ;(S c )) =64  2

2

amely osszegezhet}o, tehat a Borel{Cantelli-lemma miatt a variacios tag tart 0-hoz 1 valoszn}useggel. Torztas:

Z Z  ( A ( x )) 1 n Efn(x) = (A (x)) = (A (x)) f (z ) (dz) = f (z)Kn (x z ) (dz ) n n An (x)

ahol Kn (x z ) = Ifz(2AAnn(xx))g . Ha f folytonos, es egy kompakt halmazon kvul 0, akkor egyenletesen folytonos, ezert a tetel els}o feltetele miatt a torztas 0-hoz tart. Legyen most f tetsz}oleges, ekkor " > 0-hoz letezik olyan f~, amely folytonos, egy kompakt halmazon kvul 0, es ( )

Z

Ekkor

jf (x) ; f~(x)j (dx) < ":

 Z  Z jf (x) ; Efn(x)j (dx) = f (x) ; f (z )Kn (x z ) (dz ) (dx)   Z Z  Z ~ ~ ~   jf (x) ; f (x)j (dx) + f (x) ; f (z )Kn (x z ) (dz ) (dx)+  Z Z Z +  f~(z )Kn (x z ) (dz ) ; f (z )Kn (x z ) (dz ) (dx)   Z  Z ~ ~   " + f (x) ; f (z )Kn (x z ) (dz ) (dx)+

Z

6.2

A hisztogram

+

Z Z

91



jf~(z ) ; f (z )jKn (x z ) (dx) (dz ) =

 Z  Z Z ~ ~   = " + f (x) ; f (z )Kn (x z ) (dz ) (dx) + jf~(z ) ; f (z )j (dz )

!

2"

Itt igazabol elmondtuk a Banach{Steinhaus-tetel bizonytasat, amely szerint ha egy operatorsorozat pontonkent konvergal egy s}ur}u halmazon, es az operatornormak sorozata korlatos, akkor minden pontban konvergal.

6.2.2. tetel: Ha f egy origo kozep}u S kockan kvul 0, Lipschitz-folytonos, azaz jf (x) ; f (z )j  C jjx ; z jj

akkor hn oldalhosszusagu d-dimenzios kockakbol allo partcio eseten a hisztogramra

Z

E jf ; fnj  pc1 d + c2 hn nhn

tehat

hn = c3 n; d

1 +2

Z

valasztasra

E jf ; fnj  cnn; d : 1 +2

Bizonytas :

Z

Z Z E jf (x) ; fn(x)j (dx)  jf (x) ; Efn(x)j (dx) + E jfn(x) ; Efn(x)j (dx) | {z } | {z } torztas

variacio

Variacio: Legyen S olyan, hogy (S c ) = 0. Jelolje Mn azon cellak szamat a partcioban, amelyek metszik S) S -et, Mn = jfj : Anj \ S 6= gj  Vol( hdn . Akkor

Z



X

E

Z

E jfn(x) ; Efn(x)j (dx) 

j : Anj \S 6= Anj

= 

jfn(x) ; Efn(x)j

X

j : Anj \S 6=

Z

(dx) + 2Efn(x) (dx) = Sc

E jn(Anj ) ; (Anj )j 

X q

j : Anj \S 6=

=

E jn(Anj ) ; (Anj )j2 =

X r (Anj )(1 ; (Anj )) 

j : Anj \S 6=

n

92

6. FEJEZET Su}ru}segfuggveny becslese



v P (A )(1 ; (A )) u u nj t j: Anj \S6= nj

(a Cauchy{Schwarz-egyenl}otlenseg miatt)

n

s



Torztas:

Z

 Mn 

Vol(S ) :

nhdn

 Z  Z jf ; Efnj = f (x) ; f (z )Kn (x z ) (dz ) (dx  ZZ jf (x) ; f (z )jKn (x z ) (dz ) (dx) 



 

ZZ

ZZ

C jjx ; zjjKn (x z) (dz) (dx)  ChnKn(x z ) (dz ) (dx) = Chn

A magfuggvenyes becsl}ot a nemnegatv, merhet}o K (x) magfuggveny es a pozitv hn sorozat hatarozza meg:

x ; Xi n X 1 fn(x) = nhd K h n i=1

n

lim h = 0 n!1 n

es

6.2.3. tetel: Tegyuk fel, hogy -nek letezik f s}ur}usegfuggvenye. Ha a magfuggvenyes

becsl}onel

Z

K (x) (dx) = 1

akkor

lim

n!1

Z

lim nhdn = 1

n!1

jf (x) ; fn (x)j (dx) = 0

1 valoszn}useggel, vagyis a magfuggvenyes becsl}o is er}osen konzisztens. Peldak magfuggvenyre: 

Naiv magfuggveny

K (x) = Ifx2S r g

ahol S0r origo kozep}u r sugaru gomb.  Gauss magfuggveny

0

K (x) = e;jjxjj



Cauchy magfuggveny



Epanechnikov magfuggveny

2

K (x) = 1 + jj1xjjd+1 K (x) = (1 ; jjxjj2 )Ifjjxjj1g

6.2

93

A hisztogram

6.2.4. tetel: Ha f egy origo kozep}u S gombon kvul 0, f di#erencialhato es a gradiens Lipschitz-folytonos, azaz jjf 0 (x) ; f 0 (z )jj  C jjx ; z jj akkor a magfuggvenyes becslesre

Z

E jf ; fnj  pc1 d + c2 h2n nhn

tehat valasztasra

hn = c3 n; d

1 +4

Z

E jf ; fnj  c4n; d : 2 +4

A parameteres statisztikaban a konzisztencia tisztazasa utan az a legfontosabb kerdes, hogy adott pontossaghoz mekkora mintanagysag kell, azaz mekkora az illet}o becsles konvergenciasebessege. S}ur}usegfuggveny-becsles eseteben, ha nem teszunk fel semmit az f s}ur}usegfuggvenyr}ol, akkor nem tudunk semmit mondani a konvergenciasebessegr}ol, s}ur}usegbecsl}ok minden ffn g sorozatara igaz az, hogy a varhato L1 -hiba konvergenciasebessege tetsz}olegesen kicsi lehet.

6.2.5. tetel: S}ur}usegbecsl}ok minden ffng sorozatahoz es pozitv szamok minden monoton, 0-hoz tarto an < 321 sorozatahoz letezik f s}ur}usegfuggveny ugy, hogy Ejjf ; fnjj > an

minden n-re.

94

6. FEJEZET Su}ru}segfuggveny becslese

7. fejezet

Regressziobecsles 7.1. A regresszios problema Legyen Y valos ertek}u valoszn}usegi valtozo es legyen X d-dimenzios veletlen vektor (meggyeles). X koordinatai kulonboz}o eloszlasuak lehetnek, lehet nemelyik diszkret (peldaul binaris), masok lehetnek abszolut folytonosak. Igy nem teszunk fel semmit X eloszlasarol. A regresszioanalzis celja Y becslese, ha X adott, azaz olyan f fuggvenyt keresunk, amely X ertekkeszleten van denialva, es amelyre f (X ) "kozel" van Y -hoz. Tegyuk fel, hogy az analzis f}o celja a negyzeteskozep-hiba minimalizalasa: min E((f (X ) ; Y )2 ): f Jol ismert, hogy a minimumot az

m(x) = E(Y j X = x) regressziofuggveny eri el, ugyanis minden f merhet}o fuggvenyre

E((f (X ) ; Y )2 ) = E((m(X ) ; Y )2 ) + E((m(X ) ; f (X ))2 ) = = E((m(X ) ; Y )2 ) +

Z

jm(x) ; f (x)j2

(dx)

ahol  az X eloszlasat jeloli. A jobb oldal masodik tagjat a f fuggveny integralt negyzetes hibajanak nevezik, es J (f )-fel jelolik

J (f ) =

Z

jm(x) ; f (x)j2

(dx):

A negyzetes kozep hiba nyilvan pontosan akkor lesz kozel a minimumhoz, ha a J (f ) kozel van a 0-hoz. A s}ur}usegbecslessel szemben, ahol az L1 -hiba volt a legalkalmasabb hibakriterium, itt az L2 -hiba a legfontosabb. Raadasul a s}ur}usegbecslesnel az L1 -teret a Lebesgue-mertekkel denialtuk, mg a regressziobecslesnel az L2 -teret -vel denialjuk. A regressziobecsles feladatanal legyenek (X1  Y1 ) : : :  (Xn  Yn ) fuggetlen, azonos eloszlasu peldanyai (X Y )-nak. Az mn regressziobecsl}o x-nek es az (Xi  Yi ) mintaknak merhet}o fuggvenye: mn = mn(x (X1  Y1 ) : : :  (Xn  Yn )): Az mn regressziobecsles m-hez valo L2 () konvergenciajat vizsgaljuk. 95

96

7. FEJEZET Regresszio becsles

7.1.1. den cio: Az mn becsl}o gyengen univerzalisan konzisztens, ha J (mn ) ! 0 sztochasztikusan (X Y ) minden olyan eloszlasara, amelyre EjY j2 < 1.

7.1.2. den cio: Az mn becsl}o er}osen univerzalisan konzisztens, ha J (mn ) ! 0 1 valoszn}useggel (X Y ) minden olyan eloszlasara, amelyre EjY j2 < 1.

7.2. Lokalis atlagolason alapulo becsl}ok A lokalis atlagolo regressziobecsl}ok az

mn (x) =

n X i=1

Wni (x X1  : : :  Xn )Yi

alaku becsl}ok, ahol a Wni sulyok jellegzetesen nemnegatvak, osszeguk 1, tovabba Wni nagy, ha x kozel van Xi -hez, kulonben kicsi. Ilyen tpusu regressziobecsl}o a hisztogram, a magfuggvenyes es a legkozelebbi szomszed becsl}o. Legyen Pn = fAn1  An2  : : :g az Rd egy partcioja, es minden x 2 Rd -re jelolje An (x) az x-et tartalmazo cellat. Ekkor a hisztogrambecsl}o

8X n > Yi IfXi 2An (x)g > > < i=1n  mn (x) = > X IfXi 2An (x)g > > i =1 :0

ha

n X i=1

IfXi 2An (x)g > 0

kulonben.

A cellak gyakran hn elhosszusagu d-dimenzios kockak.

7.2.1. tetel: Ha minden origo kozep}u S gombre lim

sup

n!1 j : Anj \S 6=

es

diam(Anj ) = 0

jfj : Anj \ S 6= gj lim = 0 n!1 n

akkor a hisztogram regressziobecsl}o er}osen konzisztens, ha jY j  L valamely L < 1-re 1 valoszn}useggel. Megjegyzes : Ha a cellak hn elhosszusagu kockak, akkor a tetel feltetelei: hn ! 0 es

nhdn ! 1.

Miel}ott raternenk a tetel bizonytasara, kimondjuk es bebizonytjuk a Hoe#ding-egyenl}otlenseg egy, McDiarmidtol szarmazo altalanostasat, amelyre a 7.2.1 tetel bizonytasanal szuksegunk lesz. Ehhez el}oszor vezessuk be a martingal fogalmat.

7.2

ha

97

Lokalis atlagolason alapulo becslo} k

7.2.1. den cio: Valoszn}usegi valtozok egy Z1 Z2  : : : sorozatat martingal nak nevezzuk, E fZi+1jZ1  : : :  Zi g = Zi 1 valoszn}useggel

minden i > 0-ra. Legyen X1  X2  : : : valoszn}usegi valtozok egy tetsz}oleges sorozata. Z1  Z2  : : :-t az X1  X2  : : : sorozat szerinti martingal nak nevezzuk, ha minden i > 0-ra Zi az X1  : : :  Xi egy fuggvenye es E fZi+1jX1  : : :  Xi g = Zi 1 valoszn}useggel. Nyilvanvalo, hogy ha Z1  Z2  : : : az X1  X2  : : : sorozat szerinti martingal, akkor Z1  Z2  : : : martingal, hiszen

E fZi+1 jZ1 : : :  Zi g = E fE fZi+1 jX1  : : :  Xi g jZ1  : : :  Zi g = E fZi jZ1  : : :  Zi g

= Zi : A legfontosabb pelda martingalra a fuggetlen, nulla varhato ertek}u valoszn}usegi valtozok osszege. Legyen U1  U2  : : : fuggetlen valoszn}usegi valtozo nulla varhato ertekkel. Ekkor az

Si =

Xi j =1

Uj  i > 0

martingal.

7.2.2. den cio: Valoszn}usegi valtozok egy V1  V2  : : : sorozatat martingal dierencia sorozat nak nevezzuk, ha E fVi+1jV1  : : :  Vi g = 0 1 valoszn}useggel minden i > 0-ra. V1  V2 : : :-t az X1  X2  : : : sorozat szerinti martingal dierencia sorozat nak nevezzuk, ha minden i > 0-ra Vi az X1  : : :  Xi egy fuggvenye es E fVi+1jX1  : : :  Xi g = 0 1 valoszn}useggel. Minden Z1  Z2  : : : martingal termeszetes modon vezet egy martingal di#erenciahoz:

Vi = Zi ; Zi;1 :

7.2.2. tetel: (Azuma{Hoeding) Legyen X1  X2  : : : valoszn}usegi valtozok egy sorozata es V1  V2  : : : az X1  X2  : : : sorozat szerinti martingal di#erencia sorozat. Tegyuk fel, hogy letezik valoszn}usegi valtozok egy Z1 Z2  : : : sorozata es nemnegatv c1  c2  : : : konstansok ugy, hogy minden i > 0-ra Zi az X1  : : :  Xi;1 egy fuggvenye es Zi  Vi  Zi + ci 1 valoszn}useggel. Ekkor minden " > 0-ra es n-re

P

(X n i=1

)

Vi "

n i=1

;2"2 P c2i

e

98

7. FEJEZET Regresszio becsles

es

P

(X n i=1

)

V i  ;"

n

;2"2 P c2i

e

i=1

:

A bizonytas a Hoe#ding-egyenl}otlenseg bizonytasanak kiterjesztese. Szuksegunk lesz az 5.1.1 lemma analogjara:

7.2.1. lemma: Tegyuk fel, hogy a V es Z valoszn}usegi valtozokra 1 valoszn}useggel igaz, hogy EfV jZ g = 0 es, hogy valamely f fuggvenyre es c 0 konstansra f (Z )  V Ekkor minden s > 0-ra



E esV jZ

 f (Z ) + c:

  es c =8: 2 2

A 7.2.2 tetel bizonytasa: A Hoe#ding-egyenl}otlenseg bizonytasahoz hasonloan most is a Cherno#-technikat hasznaljuk. Pk Legyen Sk = Vi . Ekkor minden s > 0-ra i=1

PfSn "g





e;s" E esSn    = e;s" E esSn; E esVn jX1  : : :  Xn;1    e;s" E esSn; es cn =8 (7.2.1 lemma miatt) 

1 1

n

s2 P c2i =8 ; s"  e e i=1 n ;2"2 P c2i

= e

i=1

2 2

(ismetelve az el}oz}o lepeseket)

(ha s = 4"=

Pn c2 ).

i=1

i

A masodik egyenl}otlenseg hasonloan bizonythato.

7.2.3. tetel: (McDiarmid)

Legyenek X1  : : :  Xn fuggetlen valoszn}usegi valtozok, amelyek ertekuket egy A halmazbol veszik, es tegyuk fel, hogy f : An ! R fuggvenyre teljesul, hogy sup jf (x1  : : :  xn ) ; f (x1  : : :  xi;1  x0i  xi+1  : : :  xn )j  ci  1  i  n:

x1 :::x n x0i 2A

Ekkor minden " > 0-ra

P ff (X1  : : :  Xn ) ; Ef (X1 : : :  Xn ) "g  e es

P fEf (X1 : : :  Xn ) ; f (X1  : : :  Xn ) "g  e

n i=1

;2"2 / P c2i n

;2"2 / P c2i i=1

 :

re,

99

Lokalis atlagolason alapulo becslo} k

7.2

Bizonytas : Legyen V = f (X1  : : :  Xn ) ; Ef (X1 : : :  Xn ), V1 = EfV jX1 g ; EV , es k > 1-

Vk = EfV jX1 : : :  Xk g ; EfV jX1  : : :  Xk;1 g:

n Igy V = P Vk . Vilagos, hogy V1  : : :  Vn az X1  : : :  Xn szerinti martingal di#erencia sorozatot k=1 alkot. Denialjuk a kovetkez}o valoszn}usegi valtozokat

Hk (X1  : : :  Xk ) = E ff (X1  : : :  Xn )jX1  : : :  Xk g 

Z

ekkor

Vk = Hk (X1  : : :  Xk ) ; Hk (X1  : : :  Xk;1  x)Fk (dx)

ahol Fk az Xk eloszlasfuggvenye. Vezessuk be a



Z





Z



Wk = sup Hk (X1  : : :  Xk;1  u) ; Hk (X1  : : :  Xk;1  x)Fk (dx)  u

es a

Zk = inf Hk (X1  : : :  Xk;1 v) ; Hk (X1  : : :  Xk;1  x)Fk (dx) : v

valoszn}usegi valtozokat. Vilagos, hogy Zk  Vk  Wk 1 valoszn}useggel. Mivel minden k-ra Pn Zk az X1 : : :  Xk;1 egy fuggvenye, alkalmazhatjuk a 7.2.1 lemmat V = Vk -ra, ha meg k=1 tudjuk mutatni, hogy Wk ; Zk  ck . De ez kovetkezik a tetel feltetelei miatt

Wk ; Zk = sup sup (Hk (X1  : : :  Xk;1  u) ; Hk (X1  : : :  Xk;1  v))  ck  u

v

Pn

Megjegyzes : Ha az Xi -k korlatosak, akkor az f (x1  : : :  xn ) = xi valasztassal a Hoe#i=1 ding-egyenl}otlenseghez jutunk. A 7.2.1 tetel bizonytasa: A tetelt arra az esetre bizonytjuk, amikor m(x) folytonos. A celunk azt bebizonytani, hogy

Z

lim

n!1

1 valoszn}useggel. Legyen

(mn(x) ; m(x))2 (dx) = 0

Pn Y I

i fXi 2An (x)g

mn(x) = i=1n(A (x))  n

Z

ekkor 2

Z

(mn (x) ; m(x))2 (dx) 

(mn (x) ; mn (x))2 (dx) +

Z



(mn (x) ; m(x))2 (dx) =

= 2J1 + 2J2

100

7. FEJEZET Regresszio becsles

J2 1 valoszn}useg}u konvergenciajahoz megmutatjuk, hogy

Z

P amib}ol

J2 =

Z



2 2 jmn (x) ; m(x)j (dx) > "  e;n" =(32L ) 

jmn (x) ; m(x)j2 (dx)  2L

Z

jmn (x) ; m(x)j

(dx)

es a Borel{Cantelli-lemma miatt kovetkezik J2 1 valoszn}useg}u konvergenciaja.

Z

+

jmn (x) ; m(x)j

Z

Z

jmn (x) ; m(x)j

Z

jm (x) ; m(x)j (dx) ; E

n

A haromszog egyenl}otlensegb}ol



Z

(dx) = E

(dx)+



jm (x) ; m(x)j (dx)

n

(*)

Z

E jmn(x) ; m(x)j (dx)  jEmn(x) ; m(x)j

(dx) + E

Z

jmn (x) ; Emn(x)j

(dx)

ahol az els}o tag a torztas, a masodik a variacio. A kozepertektetel miatt R m(z) (dz) Z Ifz2An(x)g Emn(x) = (A (x)) m(z)(dz) = An(x) (A (x)) = m(an(x)) n

n

valamely an (x) 2 An (x)-re. Torztas: Mivel m(x) folytonos, egyenletesen is folytonos az origo kozep}u S gombon: 8 > 0-hoz 90 > 0: 0 jjx ; z jj <  eseten jm(x) ; m(z )j < .

Z

= =

Z ZS S

jEmn(x) ; m(x)j

jEm (x) ; m(x)j (dx) +

n

jm(an (x)) ; m(x)j

Z

Sc

(dx) +

Z

(dx) =

jEmn(x) ; m(x)j

(dx) =

jEmn(x) ; m(x)j

(dx) 

Sc   + 2L(S c ) 

"

4 hiszen ha jY j  L 1 valoszn}useggel, akkor jm()j  L. Tehat a torztas 0-hoz tart. Variacio: Jelolje Mn azon cellak szamat a partcioban, amelyek metszik S -et, Mn = jfj : Anj \ S 6= gj.

Z

=E

Z S

E jmn(x) ; Emn(x)j (dx) = jm (x) ; Em (x)j (dx) + E

n

n

Z

Sc

jmn (x) ; Emn(x)j

(dx) 

7.2

101

Lokalis atlagolason alapulo becslo} k  

X

E

Z

j : Anj \S 6= Anj

jmn (x) ; Emn(x)j

(dx) + 2L(S c ) 

X Z q

E jmn(x) ; Emn(x)j2 (dx) + 2L(S c) 

j : Anj \S 6=Anj 

X Z s nL2(Anj ) (dx) + 2L(S c )  (n(Anj ))2

j : Anj \S 6=Anj 

r

X

L (Annj ) + 2L(S c)  j : Anj \S 6=

 LMn

v P u 1 u t Mn j: Anj \S6= (Anj )

(Jensen-egyenl}otlenseg)

n

r

+ 2L(S c ) 

Mn + 2L(S c)  " n 4 hiszen a tetel masodik feltetele szerint Mnn ! 0, es (S c ) tetsz}olegesen kicsive tehet}o. Igy tehat eleg nagy n-re Z E jm (x) ; m(x)j (dx)  "  L

n

tehat (*) miatt P

Z

P

Z

2

jmn(x) ; m(x)j

jm (x) ; m(x)j (dx) ; E

n

Z



(dx) > "



jm (x) ; m(x)j (dx) >

n

"



2 A jobb oldalon allo valoszn}usegre a McDiarmid-egyenl}otlenseggel kaphatunk exponencialis fels}o korlatot. Rogztsuk le az (x1  y1 ) : : :  (xn  yn ) 2 Rd  ;L L] mintainkat es csereljuk ki (xi  yi )-t 0 (xi  yi0 )-re. Jeloljuk mni-vel az gy kapott becsl}ot. Ekkor mn (x) es mni(x) maximum ket cellan, An (xi )-n es An (x0i )-n, kulonbozik, gy

Z

jm (x) ; m(x)j (dx) ;

n



Z

Z

jmni(x) ; m(x)j

jmn(x) ; mni (x)j

(dx) 

(dx) 

2L 2L 4L 0 n(An (xi )) (An (xi )) + n(An(x0i)) (An (xi ))  n Tehat a McDiarmid-egyenl}otlenseg feltetele ci = 4nL -nel teljesul, gy 

P

Z

jm (x) ; m(x)j (dx) ; E

n

Z

jm (x) ; m(x)j (dx) >

n

"  e;n" =(32L )

2

2

2

102

7. FEJEZET Regresszio becsles

Tehat eleg nagy n -re

P

Z



2 2 jmn (x) ; m(x)j (dx) > "  e;n" =(32L ) 

amib}ol kovetkezik, hogy J2 ! 0 1 valoszn}useggel. J1 1 valoszn}useg}u konvergenciajanak belatasahoz vegyuk eszre, hogy ha n(An (x)) 6= 0, akkor  n n

 P YiIfX 2A (x)g P YiIfX 2A (x)g  i n i n    ; i=1 jmn (x) ; m(x)j =  i=1 n  P  n(An(x)) IfXi 2An (x)g  i=1     n X  1 1  = L IfXi 2An (x)g   n(A (x)) ; P n n  i=1 IfXi 2An (x)g   i=1  Pn   IfXi2An (x)g  = L  i=1n(A (x)) ; 1 = L jMn (x) ; 1j  n  

ahol Mn (x) az mn(x) specialis alakja, ha Y  1. Ha n (An (x)) = 0, akkor

jmn (x) ; mn (x)j = 0  L jMn (x) ; 1j :

Igy tehat

Z

Z

J1 = (mn(x) ; mn(x))2 (dx)  L2 (Mn (x) ; 1)2 (dx) ! 0 1 valoszn}useggel J2 1 valoszn}useg}u konvergenciaja miatt. Tehat a tetelt bebizonytottuk. A magfuggvenyes regressziobecsl}ot, a s}ur}usegbecsl}ohoz hasonloan, az abszolut integralhato K (x) magfuggveny es a pozitv hn simtotenyez}o hatarozza meg

Pn Y K  x;Xi i hn i =1 mn (x) = P  n K x;Xi hn

i=1

7.2.3. den cio: A K (x) magfuggveny regularis, ha nemnegatv es letezik S0r origo ko-

zeppontu, r > 0 sugaru gomb es b > 0 konstans ugy, hogy

K (x) bIfx2S r g 0

es

Z

sup K (u) dx < 1:

u2x+S0r

7.3

103

Empirikus hibaminimalizalas

7.2.4. tetel: Ha a K (x) magfuggveny regularis, hn ! 0, nhdn ! 1 es jY j  L valamely

L < 1-re 1 valoszn}useggel, akkor a magfuggvenyes regressziobecsl}o er}osen konzisztens.

A kn -legkozelebbi szomszed becsl}o az x-hez legkozelebbi kn darab Xi mintahoz tartozo Yi -ket atlagolja. Legyen (X(1n) (x) Y(1n) (x)) : : :  (X(nn) (x) Y(nn) (x)) az Xi-k x-t}ol vett tavolsaga szerint noveked}oen rendezett minta. X(in) (x) az x i-edik legkozelebbi szomszedja. Ha jjXi ; xjj = jjXj ; xjj, akkor Xi kozelebbi, ha i < j . Ekkor

mn (x) = k1

kn X

n i=1

Y(in) (x)

7.2.5. tetel: Ha az jjX ; xjj valoszn}usegi valtozo abszolut folytonos minden x-re, kn !

1, kn =n !

0 es jY j  L valamely L < 1-re 1 valoszn}useggel, akkor a kn -legkozelebbi szomszed regressziobecsl}o er}osen konzisztens. Tehat leteznek univerzalisan konzisztens regressziobecsl}ok, de a konvergenciasebesseg, a s}ur}usegfuggveny-becsleshez hasonloan, itt is tetsz}olegesen kicsi lehet.

7.2.6. tetel: Regressziobecsl}ok minden fmng sorozatahoz es pozitv szamok minden monoton 0-hoz tarto an < 1=64 sorozatahoz letezik (X Y )-nak olyan eloszlasa, amelyre X egyenletes eloszlasu 0 1]-en, Y = m(X ) es

Z

EJ (mn) = E (mn(x) ; m(x))2 (dx) > an minden n-re.

7.3. Empirikus hibaminimalizalas Az eddig ismertetett regressziobecslesi modszerek a lokalis atlagolas elven alapulnak. Letezik egy masik, hasonloan termeszetes alapelv, az empirikus hibaminimalizalas, amely szinten elvezethet univerzalisan konzisztens becslesekhez. Valasztunk egy Fn fuggvenycsaladot, es a regressziobecsles ebb}ol a csaladbol vehet fuggvenyeket. Az Fn kivalasztasakor vagy az m(x) regressziofuggvenyr}ol szerzett ismereteink jatszhatnak szerepet, vagy Fn olyan fuggvenyekb}ol all, amelyek szamtogeppel bizonyos szamtasi bonyolultsaggal realizalhatok. Korabban mar lattuk, hogy az m(x) regressziofuggveny minimalizalja az L2 -hibat. Tehat mondhatnank azt, hogy minimalizaljuk E(f (X ) ; Y )2 -t az Fn csaladon. Ez azonban nyilvanvaloan lehetetlen, mert a minimalizalando fuggveny fugg az (X Y ) ismeretlen eloszlasatol.

7.3.1. den cio: Az empirikus L2-hiba a mintakon elkovetett hibak negyzeteinek atlaga: n 1X (f (X ) ; Y )2

n i=1

i

i

Az empirikus hibaminimalizalas soran azt a fuggvenyt valasztjuk ki Fn-b}ol, amelynek az empirikus hibaja minimalis:

 X 1 n

mn = argmin n (f (Xi ) ; Yi )2 f 2Fn i=1

!

104

7. FEJEZET Regresszio becsles

A kerdes, hogy mekkora az gy valasztott mn (x) becsl}o L2 hibaja.

Z

jmn (x) ; m(x)j2





(dx) =





= E jmn (X ) ; Y j2 j Dn ; E jm(X ) ; Y j2 =



= E jmn







E n ; finf 2Fn

(X ) ; Y j2 j D





jf (X ) ; Y j2



+ finf E jf (X ) ; Y j2 ; E jm(X ) ; Y j2 2F





+

n

A jobb oldalon szerepl}o els}o tag a becslesi hiba, a masodik tag pedig az approximacios hiba. A becslesi hiba azt meri, hogy a becsl}o L2 -hibaja mennyire ter el a fuggvenycsaladbeli legjobb fuggveny L2 -hibajatol, az approximacios hiba pedig azt, hogy mennyire jol lehet a regressziofuggvenyt Fn-beli fuggvenyekkel kozelteni L2 ertelemben. Ha az Fn csalad nagy, akkor az approximacios hiba ugyan lehet nagyon kozel 0-hoz, de lehet, hogy nincs eleg mintank ahhoz, hogy Fn-b}ol jo becsl}ot valasszunk, azaz a becslesi hiba nagy lehet. Ha Fn kicsi, akkor pedig az approximacios hiba lehet nagyon nagy. Ahhoz, hogy univerzalisan konzisztens becsl}ot kapjunk, azt kell megmutatni, hogy mindket tag 0-hoz tart. Az approximacios hibara ez gyakran eleg egyszer}u. El}oszor is konnyen lathato, hogy inf

f 2Fn

E jf (X ) ; Y j2 ; E jm(X ) ; Y j2

= finf 2F

Z

n

jf (x) ; m(x)j

(dx):

Ha peldaul Fn  Fn+1 minden n-re, akkor az, hogy minden  mertekre es m 2 L2 -re lim inf

Z

n!1 f 2Fn

egyszer}uen azt jelenti, hogy

S1 F

S1 F

n=1

n

jf (x) ; m(x)j2

(dx) = 0

s}ur}u L2 ()-ben minden  mertekre. Ez igaz peldaul, ha

s}ur}u C01 (Rd )-ben a szupremum norma szerint, mivel C01(Rd ) s}ur}u L2 ()-ben minden  eloszlasra es Z jf (x) ; m(x)j2 (dx)  jjf ; mjj21

n=1

n

Most nezzuk tehat a becslesi hibat.

7.3.1. lemma:





E jmn (X ) ; Y j2 j Dn ; finf E jf (X ) ; Y j2  2Fn

 X  n 1  2 sup  jf (Xi ) ; Yi j2 ; E jf (X ) ; Y j2    n f 2Fn i=1

Bizonytas :





E jmn (X ) ; Y j2 j Dn ; finf E jf (X ) ; Y j2 = 2Fn   n 1X 2 = sup E (mn (X ) ; Y ) j Dn ; n jmn (Xi ) ; Yi j2 + f 2Fn

i=1

7.3

105

Empirikus hibaminimalizalas

+ n1

n X

jmn(Xi ) ; Yi j2 ;

i=1 n X

+1

n i=1



 

n 1X jf (X ) ; Y j2 +

n i=1

i

jf (Xi ) ; Yi j2 ; E jf (X ) ; Y j2

!

i



n X sup E (mn (X ) ; Y )2 j Dn ; n1 jmn (Xi ) ; Yi j2 + f 2Fn i=1 ! n X 1 2 2 + jf (X ) ; Y j ; E jf (X ) ; Y j  i

n i=1

i

  X n 1  2 2 jf (Xi ) ; Yi j ; E jf (X ) ; Y j   2 sup    n f 2Fn i=1

Az els}o egyenl}otlenseg mn valasztasabol adodik, mn minimalizalja az empirikus L2 -hibat Fnben, gy 8f 2 Fn-re n n 1X 1X 2 jmn (Xi ) ; Yi j2 ; n n jf (Xi ) ; Yij  0 i=1

i=1

Tehat ahhoz, hogy megmutassuk, hogy a becslesi hiba 0-hoz tart, a lemma jobb oldalan allo kifejezest kell vizsgalnunk. Legyen Z = (X Y ) Zi = (Xi  Yi ) i = 1 : : :  n gf (x y) = jf (x) ; yj2 minden f 2 Fn-re es Gn = fgf : f 2 Fng. Ekkor a fenti kifejezes a kovetkez}o alakban rhato

 X  n 1  sup  n g(Zi ) ; Eg(Z ): g2Gn i=1

Tehat egy atlag es a varhato erteke kozotti kulonbseget akarjuk felulr}ol becsulni egyenletesen egy fuggvenycsalad felett. Ha g korlatos, azaz g : Rd R ! 0 M ], akkor a Hoe#ding-egyenl}otlensegb}ol kapjuk, hogy

 !  X n 1  P  n g(Zi ) ; Eg(Z ) > "  2e;2n" =M i=1 2

7.3.2. lemma:

2

  X   X n n 1 1    sup  n g(Zi ) ; Eg(Z )  M sup  n Ifg(Zi )>tg ; P (g(Z ) > t) g2Gn i=1 g2Gn i=1 t>0

Bizonytas : Hasznaljuk a nemnegatv valoszn}usegi valtozokra ervenyes

Z1 0

azonossagot.

P(X > t) dt = EX

 X  n 1  sup  n g(Zi ) ; Eg(Z ) = g2Gn i=1

106

7. FEJEZET Regresszio becsles

Z1  n !  X  = sup  n1 Ifg(Zi )>tg ; P (g(Z ) > t) dt  g2Gn   i=1 0   X n 1  Ifg(Zi )>tg ; P (g(Z ) > t)  M sup   n g2Gn i=1 t>0

Legyen

G^ n = ffz : g(z) > tg : g 2 Gn t 2 0 M ]g :

Bebizonythato a Vapnik{Chervonenkis-egyenl}otlenseg altalanostasa, amib}ol kovetkezik, hogy

 !  X n 1  P sup  n g(Zi ) ; Eg(Z ) > "  8s(G^ n n)e;n"=(32M ): g2Gn i=1 

2

 Osszefoglalva az eddigieket, a kovetkez}ot kapjuk:

7.3.1. tetel: Tegyuk fel, hogy jY j  L valamely L < 1-re 1 valoszn}useggel. Legyen Fn

olyan f fuggvenyek csaladja, amelyekre jf (x)j  n minden x-re. Ekkor eleg nagy n-re



P E jmn

(X ) ; Y j2 j D



n ; finf 2Fn

E (f (X ) ; Y )2



>"

2 2 2  8nVG^ n e;n" =128(4n ) :

Ahol a fels}o korlat exponencialisan tart 0-hoz, ha G^ n Vapnik{Chervonenkis dimenzioja veges es nn ! 1. Ebben az esetben tehat a becslesi hiba 1 valoszn}useggel 0-hoz tart. Ahhoz, hogy az approximacios hiba 0-hoz tartson viszont kell az, hogy n ! 1. 4

Legyen peldaul Fn a

Kn X j =1

aj +j (x) : a1  : : :  aKn 2 R

alaku linearis kombinaciok csaladja, ahol a +j -k Rd -b}ol R-be kepez}o korlatos fuggvenyek. Ha ezen a csaladon minimalizaljuk az empirikus negyzetes hibat, akkor konzisztens becsl}ot kapunk, ha Kn ! 1 n ! 1 es nnKn ! 0. Ha meg n;n  ! 0 is teljesul valamilyen  > 0-ra, akkor a becsl}o er}osen univerzalisan konzisztens. A korabban latott hisztogram becsl}o is egy emipirikus hibaminimalizalo becsl}o. Legyen Pn = fAn1  An2  : : :g az Rd egy partcioja, es legyen Fn azon fuggvenyek csaladja, amelyek minden cellan konstansok. Ekkor a legkisebb empirikus negyzetes hibaju becsl}ot ugy kapjuk, ha cellankent minimalizalunk. Egy cellan pedig a minimumot az odaes}o Yi -k atlaga adja, ami nem mas, mint a hisztogrambecsl}o erteke az adott cellan. 4

4

1

8. fejezet

Alakfelismeres 8.1. A Bayes-dontes es kozeltese Az alakfelismeresben Y ket erteket vehet fel, 0-t vagy 1-et (peldaul, hogy egy paciens szenved-e egy adott betegsegben vagy nem). Az Y cmke ertekere szeretnenk kovetkeztetni adott X 2 Rd meggyelesvektor alapjan (ami tartalmazhatja pl. a paciens h}omersekletet, vernyomasat stb.). A dontes vagy osztalyozasi szabaly egy g : Rd ! f0 1g fuggveny, amelynek a min}oseget az L(g) = P (g(X ) 6= Y ) hibavaloszn}useg meri. A cel L(g) minimalizalasa. 8.1.1. den cio: Bayes-dontes:  1 ha P (Y = 1 j X = x) 1  2 g (x) = 0 kulonben. L = L(g ) az un. Bayes-hiba. A Bayes-dontes optimalis. 8.1.1. tetel: Minden g : Rd ! f0 1g dontesfuggvenyre P (g (X ) 6= Y )  P (g(X ) 6= Y ) : Bizonytas : Igazak az alabbi egyszer}u atalaktasok: P (g(X ) 6= Y j X = x) = 1 ; P (Y = g(X ) j X = x) = = 1 ; (P (Y = 1 g(X ) = 1 j X = x) + P (Y = 0 g(X ) = 0 j X = x)) = ;

= 1 ; Ifg(x)=1g P (Y = 1 j X = x) + Ifg(x)=0g P (Y = 0 j X = x) Igy tehat minden x 2 Rd -re P (g(X ) 6= Y j X = x) ; P (g (X ) 6= Y j X = x) = ;

= P (Y = 1 j X = x) Ifg (x)=1g ; Ifg(x)=1g + ;

+P (Y = 0 j X = x) Ifg (x)=0g ; Ifg(x)=0g = ;

= (2P (Y = 1 j X = x) ; 1) Ifg (x)=1g ; Ifg(x)=1g 0 g dencioja alapjan. Mindket oldalt  szerint integralva kapjuk a tetel alltasat. 107

108

8. FEJEZET Alakfelismeres

A P (Y = 1 j X = x) es P (Y = 0 j X = x) valoszn}usegek az un. a posteriori valoszn}usegek. Vegyuk eszre, hogy

P (Y = 1 j X = x) = E (Y j X = x) = m(x): Tehat a Bayes-dontes a kovetkez}okeppen rhato

g (x) =

 1

ha m(x) 21 0 kulonben.

A Bayes-donteshez ismernunk kellene a regressziofuggvenyt, ami tipikusan ismeretlen, ezert most is a Dn = f(X1  Y1 ) : : :  (Xn  Yn )g fuggetlen, azonos eloszlasu mintakat hasznalhatjuk. Olyan gn (x) = gn ((X1  Y1 ) : : :  (Xn  Yn ) x) osztalyozasi szabalyt szeretnenk talalni, amelynek az L(gn) = P (gn(X ) 6= Y j (X1  Y1 ) : : :  (Xn  Yn)) hibavaloszn}usege kozel van L -hoz.

8.1.2. den cio: A gn osztalyozasi szabaly gyengen univerzalisan konzisztens, ha (X Y )

minden eloszlasara

EL(gn) = P(gn (X ) 6= Y ) ! L

ha n ! 1, es er}osen univerzalisan konzisztens, ha

lim L(gn ) = L

n!1

1 valoszn}useggel. Termeszetes gondolat, hogy a mintak segtsegevel becsuljuk az m regressziofuggvenyt az mn regressziobecsl}ovel, es vegyuk a Bayes-dontes mintajara az un. "plug-in" dontesfuggvenyt.  1 ha m (x) 1 n 2 (*) g (x) = n

0 kulonben.

A kovetkez}o tetel azt alltja, hogy ha az mn kozel van a valodi m regressziofuggvenyhez, akkor a gn hibavaloszn}usege kozel lesz az optimalis g hibavaloszn}useghez.

8.1.2. tetel: A fent denialt gn dontesfuggvenyre

Z

0  P (gn (X ) 6= Y j Dn ) ; P (g (X ) 6= Y )  2 jmn(x) ; m(x)j (dx)  2

Z

jmn

(x) ; m(x)j2

(dx)



1 2

Bizonytas : Tetsz}oleges x 2 Rd -re

P (gn(X ) 6= Y j Dn X = x) ; P (g (X ) 6= Y j X = x) =

;

= Ifg (x)=1g m(x) + Ifg (x)=0g (1 ; m(x)) ; Ifgn (x)=1g m(x) + Ifgn (x)=0g (1 ; m(x)) = ;

= Ifg (x)=1g m(x) + Ifg (x)=0g (1 ; m(x)) ; Ifg (x)=1g mn (x) + Ifg (x)=0g (1 ; mn(x)) +

8.2

Lokalis to bbsegen alapulo do ntesek

;

109

;

+ Ifg (x)=1g mn(x) + Ifg (x)=0g (1 ; mn(x)) ; Ifgn (x)=1g mn (x) + Ifgn (x)=0g (1 ; mn (x)) + ;

;

+ Ifgn (x)=1g mn(x) + Ifgn (x)=0g (1 ; mn(x)) ; Ifgn (x)=1g m(x) + Ifgn (x)=0g (1 ; m(x))   Ifg (x)=1g (m(x) ; mn (x)) + Ifg (x)=0g (mn (x) ; m(x))+ +Ifgn (x)=1g (mn (x) ; m(x)) + Ifgn (x)=0g (m(x) ; mn (x))   2 jmn (x) ; m(x)j  ahol az utolso el}otti egyenl}otlensegnel azt hasznaltuk, hogy gn dencioja miatt Ifgn(x)=1g mn (x) + Ifgn (x)=0g (1 ; mn(x)) = maxfmn(x) 1 ; mn(x)g amib}ol Ifg (x)=1g mn (x) + Ifg (x)=0g (1 ; mn(x)) ; Ifgn (x)=1g mn(x) + Ifgn (x)=0g  0: Igy 0  P (gn (X ) 6= Y j Dn ) ; P (g (X ) 6= Y ) = =

Z

(P (gn (X ) 6= Y j Dn  X = x) ; P (g (X ) = 6 Y j X = x)) (dx) 

2

Z

jmn(x) ; m(x)j

(dx)  2

Z

jmn

(x) ; m(x)j2



(dx)

1 2

a Cauchy{Schwartz-egyenl}otlenseg miatt. Igy egy L2 -ben konzisztens regressziobecsl}ob}ol automatikusan kaphatunk konzisztens dontesfuggvenyt. De ahhoz, hogy (*) a Bayes-dontest jol kozeltse egyaltalan nem fontos, hogy mn (x) kozel legyen m(x)-hez. Csak az a lenyeges, hogy a dontesi hatar ugyanazon oldalan legyenek, azaz hogy mn(x) 21 legyen, ha m(x) 12 es legyen < 12 , ha m(x) < 21 . Megis gyakran hasznaljak a plug-in donteseket az E jmn(X ) ; Y j2 j Dn L2 -hiba minimalizalasaval kapott regressziobecsl}ovel, mert az L2 -hiba minimalizalasa hatekonyan szamthato becsl}okhoz vezet.

8.2. Lokalis tobbsegen alapulo dontesek A regressziobecsleshez hasonloan itt is denialhatjuk a harom lokalis atlagolason alapulo osztalyozasi szabalyt a hisztogram, a magfuggvenyes es a legkozelebbi szomszed dontest. Legyen Pn = fAn1  An2  : : :g az Rd egy partcioja, es minden x 2 Rd -re jelolje An (x) az x-et tartalmazo cellat. Ekkor a hisztogram szabaly

8 < gn (x) = : 1 0

Pn

Pn

ha IfYi =1g IfXi 2An (x)g IfYi =0g IfXi 2An (x)g i=1 i=1 kulonben. Azaz tobbsegi dontest hoz az An (x)-be es}o mintak cmkei alapjan. Lathato, hogy ha mn(x) a hisztogram regressziobecsl}o, azaz

8X n > Yi IfXi 2An (x)g > > < i=1n  mn(x) = > X IfXi 2An (x)g > > i =1 :0

ha

n X i=1

IfXi 2An (x)g > 0

kulonben,

110

8. FEJEZET Alakfelismeres

akkor a hisztogram szabaly nem mas, mint egy plug-in osztalyozasi szabaly, amelyben az m(x) regressziofuggvenyt az mn(x) becsl}ovel becsuljuk. Tehat a hisztogram szabaly konzisztenciaja a korabbiak miatt kovetkezik a hisztogram regressziobecsl}o konzisztenciajabol.

8.2.1. tetel: Ha minden origo kozep}u S gombre lim

sup

n!1 j : Anj \S 6=

diam(Anj ) = 0

es

lim jfj : Anjn\ S 6= gj = 0 akkor a hisztogram osztalyozasi szabaly er}osen univerzalisan konzisztens. n!1

A magfuggvenyes osztalyozasi szabalyt a

8 < 1 gn (x) = : 0

  Pn Pn ha IfYi =1g K x;hnXi IfYi =0g K x;hnXi i=1 i=1 kulonben.

fuggveny adja meg, ahol a K (x) : Rd ! R egy nemnegatv, integralhato magfuggveny es hn pedig egy n-t}ol fugg}o simto tenyez}o. Ez a szabaly is egy plug-in szabaly, ahol az mn (x) regressziobecsl}o most a magfuggvenyes becsl}o, tehat a konzisztencia itt is a regressziobecsl}o konzisztenciajabol kovetkezik.

8.2.2. tetel: Ha a K (x) magfuggveny regularis, hn ! 0 es nhdn ! 1, akkor a magfugg-

venyes osztalyozasi szabaly er}osen univerzalisan konzisztens.

A kn -legkozelebbi szomsz ; ed szabaly az x-hez legko;zelebbi kn darab X i cmkei alapjan hoz tobbsegi dontest. Legyen X(1n) (x) Y(1n) (x)  : : :  X(nn) (x) Y(nn) (x) az Xi -k x-t}ol vett tavolsaga alapjan rendezett minta. Ekkor

8 < gn (x) = : 1 0

kn P

kn P

ha IfY in (x)=1g IfY in (x)=0g i=1 i=1 kulonben. (

)

(

)

Konnyen lathato, hogy ez is egy plug-in szabaly, ahol most mn (x) a kn -legkozelebbi szomszed regressziobecsl}o, tehat a konzisztencia itt is a regressziobecsl}o konzisztenciajabol kovetkezik.

8.2.3. tetel: Ha az jjX ;xjj valoszn}usegi valtozo abszolut folytonos minden x-re, kn ! 1 es knn ! 0, akkor a kn -legkozelebbi szomszed osztalyozasi szabaly er}osen univerzalisan konzisztens. A s}ur}usegfuggveny-becsleshez es a regressziobecsleshez hasonloan itt sem lehet altalaban semmit mondani a konvergenciasebessegr}ol, a konvergencia tetsz}olegesen lassu lehet.

8.2.4. tetel: Osztalyozasi szabalyok minden fgng sorozatahoz es pozitv szamok minden

monoton, 0-hoz tarto an < 161 sorozatahoz letezik (X Y )-nak olyan eloszlasa, amelyre X egyenletes eloszlasu 0 1]-en, L = 0 es

P (gn(X ) 6= Y ) > an minden n-re.

8.3

111

Empirikus hibaminimalizalas

8.3. Empirikus hibaminimalizalas Hasonloan a regressziobecsleshez, valaszthatunk dontesfuggvenyt az empirikus hibaminimalizalas modszerevel.

8.3.1. den cio: A g szabaly empirikus hibavaloszn}usegen a mintakon elkovetett atlagos

hibat ertjuk, azaz

Ln (g) = n1

n X i=1

Ifg(Xi )6=Yi g

Az empirikus hibavaloszn}useg nyilvan torztatlan becslese a valodi hibavaloszn}usegnek, azaz ELn (g) = L(g). Legyen C a g : Rd ! f0 1g dontesfuggvenyek egy csaladja. A feladat az, hogy valasszunk ki C-b}ol egy olyan dontesfuggvenyt, amelynek hibavaloszn}usege kozel van a C-beli legjobb dontes hibavaloszn}usegehez. A C csalad megallaptasaban sokfele szempont jatszhat szerepet, peldaul az osztalyozando adat eloszlasarol rendelkezesre allo el}ozetes informacio, szamtasi megfontolasok. Valasszuk a C csaladbol azt a dontest, amelynek az empirikus hibavaloszn}usege minimalis, azaz legyen gn = argmin Ln(g) g 2C

Azt varjuk, hogy gn hibavaloszn}usege kozel lesz a csaladbeli optimumhoz, azaz L(gn ) ; inf L(g) becslesi hiba kicsi. g2C

L(gn ) ; L =







L(gn ) ; ginf L(g) + ginf L(g) ; L  2C 2C L(g) ; L az approximacios hiba. El}ofordulhat ahol L(gn ) ; ginf L(g) a becslesi hiba es ginf 2C 2C azonban, hogy a becslesi hiba kicsi, de L(gn ) megis tavol van az L Bayes-hibatol. Tehat lehet, hogy az ginf L(g) ; L approximacios hiba nagy. 2C

A C csalad tehat eleg nagy kell, hogy legyen ahhoz, hogy jo kozeltest adjon az optimalis megoldasra, de nem lehet tul nagy sem, mert akkor az adatok mennyisege nem elegend}o arra, hogy jo dontest valasszunk ki bel}ole. A tovabbiakban a becslesi hibat vizsgaljuk. (Az approximacios hiba a csalad kivalasztasatol fugg csak, es attol nem, hogy a csaladbol hogyan valasztunk dontest.)

8.3.1. lemma:

L(gn ) ; ginf L(g)  2 sup jLn (g) ; L(g)j 2C g 2C

Bizonytas :

L(gn ) ; ginf L(g) = sup (L(gn ) ; Ln(gn) + Ln(gn) ; Ln(g) + Ln(g) ; L(g))  2C g 2C

Az

 sup (L(gn ) ; Ln(gn ) + Ln(g) ; L(g))  2 sup jLn (g) ; L(g)j g2C g2C els}o egyenl}otlenseg gn valasztasabol adodik, Ln (gn )  Ln (g).

112

8. FEJEZET Alakfelismeres Tehat sup jLn(g) ; L(g)j-re kell fels}o korlatot talalnunk. g2C

8.3.1. tetel: Tegyuk fel, hogy C veges sok dontesfuggvenyt tartalmaz, ekkor



!

P sup jLn(g) ; L(g)j > " g2C

Bizonytas :



! X

P sup jLn(g) ; L(g)j > " g2C



g2C

 2jCje;2n"

2

P (jLn(g) ; L(g)j > ")  2  jCje;2n"

2

a Hoe#ding-egyenl}otlenseg miatt, hiszen nLn(g) binomialis eloszlasu valoszn}usegi valtozo n es L(g) parameterekkel. Megjobb fels}o korlatot kaphatunk, ha feltesszuk, hogy a C-beli dontesek kozott van olyan, amelyik hibavaloszn}usege nulla.

8.3.2. tetel: Tegyuk fel, hogy jCj < 1 es min L(g) = 0. Ekkor minden n-re es " > 0-ra g 2C P (L(gn ) > ")  jCje;n"

es

jCj E (L(gn))  1 + log n :

Bizonytas :

P (L(gn ) > ")  P



= E If

max

g2C: Ln (g)=0



L(g)>"g

X

g2C: L(g)>"





max

g2C: Ln (g)=0





L(g) > " =



= E max I I  g2C fLn (g)=0g fL(g)>"g

P (Ln(g) = 0)  jCj(1 ; ")n

mivel annak a valoszn}usege, hogy egy (Xi  Yi ) sem esik az f(x y) : g(x) 6= yg halmazba, kevesebb, mint (1 ; ")n , ha a halmaz valoszn}usege nagyobb, mint ". Innen a tetel els}o alltasa kovetkezik, ha hasznaljuk az 1 ; x  e;x egyenl}otlenseget. A varhato hibavaloszn}useg becsleshez vegyuk eszre, hogy minden u > 0-ra

Z1

E (L(gn)) = P (L(gn ) > t) dt  u+

Z1 u

0

Z1

P (L(gn) > t) dt  u + jCj e;nt dt = u + jCnj e;nu : u

Mivel u tetsz}oleges, valaszthatjuk ugy, hogy minimalizalja a fels}o korlatot. Az optimalis valasztas u = lognjCj , amivel a fels}o korlat jCj u + jCj e;nu = log jCj + jCj  e;n n = log jCj + 1

n

n

n

log

n

8.3

113

Empirikus hibaminimalizalas

Most terjunk vissza az altalanos esethez, azaz felejtsuk el a feltetelezeseinket, hogy jCj < 1 es min L(g) = 0. g 2C Legyen  (X Y ) valoszn}usegi merteke Rd  f0 1g-en, es legyen n a mintainkon alapulo empirikus mertek. Tehat egy A  Rd  f0 1g merhet}o halmazra (A) = P ((X Y ) 2 A) es Pn n (A) = n1 If(Xi Yi )2Ag . Ekkor i=1

L(g) =  (f(x y) : g(x) 6= yg) 

azaz L(g) a -merteke az ffx :

g(x) = 1g  f0gg  ffx : g(x) = 0g  f1gg

halmaznak. Hasonloan gy

Ln(g) = n (f(x y) : g(x) 6= yg) 

  sup jLn (g) ; L(g)j = sup n (A) ; (A) g 2C

ahol A az osszes ffx :

A 2A

g(x) = 1g  f0gg  ffx : g(x) = 0g  f1gg  g 2 C

alaku halmaz csaladja. Emlekezzunk vissza, hogy a

  sup n (A) ; (A)

A 2A

kifejezesre a Vapnik{Chervonenkis-egyenl}otlenseg ad fels}o korlatot. Most vezessuk be dontesek csaladjainak Vapnik{Chervonenkis-dimenziojat is. 8.3.2. den cio: Legyen C a g : Rd ! f0 1g dontesfuggvenyek egy csaladja, es tartalmazza A az osszes ffx : g(x) = 1g  f0gg  ffx : g(x) = 0g  f1gg  g 2 C alaku halmazt. A C csalad shatter egyutthatoja es VC-dimenzioja egyezzen meg az A halmazcsalad shatter egyutthatojaval es VC-dimenziojaval. S (C n) = s(A n) VC = VA Ekkor tehat a Vapnik{Chervonenkis-egyenl}otlenseg es a 8.3.1. lemma miatt igaz a kovetkez}o:

8.3.3. tetel:



!

P sup jLn(g) ; L(g)j > " es



g2C

P L(gn) ; ginf L(g) > " 2C



ahol gn az empirikus hibat minimalizalo dontes.

2  8S (C n)e;n" =32

2  8S (C n)e;n" =128 

114

8. FEJEZET Alakfelismeres

Ebb}ol a 8.3.2 tetel bizonytasaban latott modon kaphatunk fels}o korlatot a varhato hibavaloszn}usegre r EL(gn) ; ginf L(g)  16 log (8e2Sn(C n))  2C

illetve mivel VC > 2-re S (C n)  nVC

r

EL(gn) ; ginf L(g)  16 VC log2nn + 4 : 2C Ha feltesszuk, hogy ginf L(g) = 0, azaz, hogy a Bayes-dontes benne van C-ben es L = 0, 2C akkor egy gyorsabban 0-hoz tarto fels}o korlatot kapunk.

8.3.4. tetel: A fenti esetben P (L(gn ) > ")  2S (C 2n)2;n"=2 : A dontescsaladok Vapnik{Chervonenkis-dimenziojanak vizsgalatat konnyti meg az alabbi tetel. 8.3.5. tetel: Ha A = fA  f0g  Ac  f1g( A 2 Ag, akkor s(A n) = s(A n) minden n-re es ezert VA = VA . A dontescsaladok shatter egyutthatojanak denciojaban az A halmazok fx : g(x) = 1g alakuak, mg A olyan (x y) parok halmaza, amelyekre g(x) 6= y. A fenti tetel azt jelenti, hogy S (C n) = s(A n), tehat eleg az A tulajdonsagait vizsgalni, ami egyszer}ubb, hiszen Rd reszhalmazainak a csaladja. Ha peldaul x 2 R es C a

 1

ha x  a 0 kulonben alaku dontesek csaladja, akkor az fx : g(x) = 1g halmazok a felegyenesek, tehat ekkor VC = Vffelegyenesekg = 1. Lehet C peldaul a linearis dontesek csaladja, azaz a

g(x) =

g(x) =

 1

ha aT x > b 0 kulonben

alaku dontesfuggvenyeket tartalmazo csalad. Ekkor az fx : g(x) = 1g halmazok pont az Rd -beli fx : aT x > bg felterek, amelyek csaladjarol korabban lattuk, hogy a VC-dimenzioja d + 1.

Ajanlott irodalom 1] H. Cramer: Mathematical methods of Statistics Princeton University Press, Princeton, 1946. 2] E.L. Lehman: Testing Statistical Hipotheses Wiley & Sons, New York, 1959. 3] E.L. Lehman: Theory of Point Estimation Chapman & Hall, New York, 1991. 4] Mogyorodi Jozsef (szerk.): Matematikai statisztika (ELTE jegyzet) Tankonyvkiado, Budapest, 1990. 5] Vincze Istvan: Matematikai statisztika (ELTE jegyzet) Tankonyvkiado, Budapest, 1974.

115