35 0 3MB
ACADEMIA DE STUDII ECONOMICE DIN BUCUREŞTI FACULTATEA DE RELAŢII ECONOMICE INTERNAŢIONALE
PROIECT ECONOMETRIE
RADA COSMIN ANUL 3, SERIA B, GRUPA 956, REI
BUCUREŞTI
2016
Înregistrați pentru cel puțin 30 de unitati, valorile specifice ale unor caracteristici (X1, X2 si Y) între care există o legătură logică. Datele prezentate sub forma tabelară fac parte din lucrare. Se cer următoarele: a) prezentarea problemei şi verificarea preliminară a datelor - verificarea ipotezei conform căreia datele nu sunt afectate de erori de măsură (I1); - verificarea corelaţiei dintre variabilele independente. b) definirea modelului de regresie; - aproximarea grafică a modelului legăturii dintre variabile; - forma, variabilele şi parametrii modelului de regresie. c) estimarea parametrilor modelului; - estimarea punctuală a parametrilor; - estimarea parametrilor prin interval de încredere. d) testarea semnificației corelației şi a parametrilor modelului de regresie; - testarea semnificației corelației; - testarea parametrilor unui model de regresie. e) testarea ipotezelor clasice asupra modelului de regresie; - testarea ipotezei de homoscedasticitate (I2); - testarea ipotezei de autocorelare a erorilor (I3); - testarea normalității erorilor (I4); - testarea ipotezei privind multicolinearitatea (I5); f) previziunea valorii variabilei Y (punctuală şi pe interval de încredere) în ipoteza modificării variabilelor factoriale (ultima valoare a lui X1 creşte cu 10%, iar cea a lui X2 scade cu 5%).
a)
Prezentarea problemei
În această lucrare am ales să analizez impactul variației exporturilor per capita și a importurilor per capita asupra PIB-ului per capita în anul 2012, în Asia de Vest, Centrală și de Est. Din punct de vedere geografic, am definit regiunile astfel:
Asia Vestică: Armenia, Azerbaijan, Bahrein, Cipru, Georgia, Iran, Irak, Israel, Iordania, Kuweit, Liban, Oman,
Arabe Unite, Yemen; Asia Centrală: Kazakhstan, Uzbekistan;
Arabia Saudită, Siria, Turcia, Emiratele Kyrgyzstan,
Tajikistan,
Turkmenistan,
Asia de Est: China, Hong Kong, Macau, Japonia, Coreea de Nord, Coreea de Sud, Mongolia. Datele pentru fiecare țară în parte au fost preluate de pe site-ul
www.nationmaster.com. Modelul de regresie liniară simplă se va elabora pentru a afla în ce măsură variabila independentă (PIB/capita) va fi influențată de nivelul variabilelor dependente (exporturi/capita și importuri/capita). Ulterior, vom determina dacă există o legătură liniară între PIB/capita și exporturi/capita, respectiv PIB/capita și importuri/capita. Astfel vom decide dacă modelul de regresie liniară simplă se poate numi valid, iar dacă se va stabili că este, pe baza acestuia se vor putea realiza previziuni în funcție de anumite valori ale variabilei independente.
PIB per capita Acest indicator macroeconomic măsoară producția dintr-o țară și se concretizează în suma cheltuielilor pentru consum a gospodăriilor private și a organizațiilor nonprofit, a cheltuielilor brute privind investițiile, a cheltuielilor guvernamentale, a investițiilor în scopul depozitării și a exporturilor nete (câștigurile din exporturi din care se scad cheltuielile pentru importuri). Formulă de calcul: PIB = consum privat + consumul statului + investiții + (exporturi – importuri) Pe scurt, PIB-ul per capita (pe cap de locuitor) reprezintă rezultatul dintre PIB-ul unei țări raportat la numărul de locuitori ai acesteia. Formulă de calcul:
PIB/capita =
PIB Populație
Export per capita Exportul reprezintă o operațiune comercială cu caracter de vânzare a unor bunuri materiale și/sau servicii către persoane fizice sau juridice dintr-o altă țară în schimbul unei sume dintr-o valută convenită. Cuprinde exportul de mărfuri
(bunuri corporale, stabile) și exportul invizibil (de servicii). Exportul poate fi și de capital, reprezentând investiții directe și plasarea de titluri de valoare în alte țări. Pe scurt, exportul per capita reprezintă valoarea exporturilor unei țări raportată la numărul de locuitori ai țării respective. Formulă de calcul: Export/capita =
Valoarea exporturilor Populație
Import per capita Operațiune comercială de cumpărare din străinatate a unor bunuri materiale și/sau servicii contra unei cantități de monedă convenită, implicând trecerea de către acestea a frontierei vamale a importatorului. Importul poate fi: direct sau indirect; de bunuri materiale și/sau de servicii; propriu-zis sau de completare; temporar sau permanent; cu plată imediată sau cu plată amânată, etc. Formulă de calcul: Import/capita =
Valoarea importurilor Populație
a.1 Verificarea ipotezei conform căreia datele nu sunt afectate de erori de măsură (I1)-regula celor 3 sigma.
Pentru a putea testa datele, e necesar să aflăm valorile celor 3 variabile între care acestea să se încadreze (limite). Astfel, limitele sunt de forma:
´ variabila ±3 σ . Astfel, pentru a calcula media și apoi limitele voi utiliza funcția Descriptive Statistics. Conform tabelului din Excel, constatăm că valoarea medie a PIB-ului per capita este de 17258,6759; valoarea medie a exporturilor/capita este de 8296,33862; valoarea medie a importurilor/capita este de 6832,89069. De asemenea, variația PIB-ului pe parcursul anilor s-a modificat cu 19399,7748; variația
exporturilor/capita
s-a
modificat
importurilor/capita s-a modificat cu 12943,7491.
cu
14705,366;
variația
Tabel 1 – Rezultatele calculelor din Descriptive Statistics
a.2
Verificarea
variabilele
corelației
x1 și
x2
să
dintre nu
fie
variabilele puternic
independente
corelate,
->
respectiv
coeficientul r să fie < 0,75/0.8 (multicolinearitate). x1-PIB/loc 1 0.360597 237
x1-PIB/loc x2-HPI
x2-HPI
1
Concluzie:
r = 0.360597237 ⇒ r < 0,75, = valoare pozitivă r ∈ (-1;1) (+) între cele două variabile există o legatură directă şi nu sunt puternic corelate.
b.1 forma, variabilele și parametrii modelului de regresie Pornim de la ipoteza legaturii liniare:
Yi =
β 0+ β1∗X 1 + β 2∗X 2 + ε i
y i = b0 +b 1∗x 1+ b2∗x 2 +e i ^y i b^ 1∗x 1 b^ 2∗x 2 b^ 0 =
+
+
Unde: y - reprezintă variabila dependentă, endogenă, efect sau explicată -> Migraţia persoanelor (numărul persoanelor de ambele sexe)
x 1 - reprezintă variabila independentă, exogenă, cauzală sau explicativă -> PIB/Locuitor($/loc.) x 2 - reprezintă variabila independentă, exogenă, cauzală sau explicativă -> Indicele fericirii globale (HPI) α şi β – parametrii modelului ε i – variabila reziduală
b.2 aproximarea grafică a modelului legăturii dintre variabile
Corelatie Export/capita - PIB/capita 90000.00 80000.00 70000.00 60000.00 50000.00 40000.00 30000.00 20000.00 10000.00 0.00 0.00
20000.00
40000.00
60000.00
80000.00
Figură 1 – Corelația dintre Export/capita și PIB/capita
Corelatie Import/capita - PIB/capita 90000.00 80000.00 70000.00 60000.00 50000.00 40000.00 30000.00 20000.00 10000.00 0.00 0.00
20000.00
40000.00
60000.00
80000.00
Figură 2 – Corelația dintre Import/capita și PIB/capita
Pe baza eşantionului format din ţările Asiei Centrale, Asiei Estice și Asiei Vestice se determină estimatorii a şi b ai parametrilor α şi β.
Tabel 2 – Coeficienții modelului de regresie simplă (Export/capita – PIB/capita)
Coeficienții ecuației de regresie:
a^
-
Intercept = coeficientul
-
X variable 1 = coeficientul
b^
Având în vedere rezultatele din tabel, vom construi ecuația de regresie astfel:
^ ^y = a^ + b∗x=11494,41+0,69∗x Fiind pozitiv coeficientul de regresie, se demonstrează încă o dată faptul că există o legătură directă între valoarea Exporturilor/capita și a PIB-ului/capita. De asemenea, indică și cu cât crește sau scade PIB/capita la modificarea cu o unitate a Exporturilor/capita.
c.1 estimarea parametrilor modelului Vom stabili dacă modelul de regresie este valid cu ajutorul testului Fischer (testul F), luând în considerare tabelul ANOVA. Etapa 1) Formularea ipotezelor statistice H0: modelul de regresie este nu este valid (ipoteza nulă) H1: modelul de regresie este valid (ipoteza alternativă) Etapa 2) Compararea valorii calculate a testului F cu valoarea teoretică preluată din tabelul repartiției Fisher ((Fα, k-1, n-k).
F=
R2 (n−2) F α ;1; n−2 2 1−R
Fcalc =F=
R2 ( n−2 )=10,36 2 1−R
Fcrt =F α ;1; n−2=F0.05 ;1 ;27=¿ 4,21 Fcalc > F crt
Etapa 3) Stabilirea concluziei Deoarece F
calculat
(10,36) este mai mare decât Fcritic (F0,05, 1, 27 = 4.21) vom
respinge ipoteza nulă şi vom accepta ipoteza alternativă. În concluzie, se acceptă ipoteza H1, mediile grupelor sunt semnificativ diferite, diferențele nu sunt datorate întâmplării, ci sunt sistematice, iar rezultatul este semnificativ statistic. Modelul este valid, garantându-se cu o probabilitate de 95%.
c.2 estimarea parametrilor prin interval de încredere b^ 0
- t critic * s b^ ≤ 0
β0
≤
b^ 0 + t critic * s b^
0
t critic = t 0.05; n−k = t 0.05;28 s b^
0
= TINV(0,05;28)= 2.048407142
= s e^ * √ a11 = s e^ * √ 2.178824969 = 142739.0476440918 *
1.476084336682698= 210694.8724604492 a11 =2.178824969 s e^
=
√
∑ e^ 2i
= √ MSE
n−k
=
√ 20374435722.3423 = 142739.0476440918
⇒ -562566.6002-2.048407142*210694.8724604492 ≤
β0
≤ -562566.6002 +
2.048407142*210694.8724604492
β0 ≤ -562566.6002 + 431588.8815307633 ⇒ -562566.6002 – 431588.8815307633 ≤ β0 ≤ -130977.718766856 ⇒ -994155.481648642 ≤ Din tabelul ANOVA: Lower 95% 994155.48 16
Upper 95% -130977.719
⇒ Intervalul de încredere este [-994155.4816; -130977.719]
d.1 Testarea semnificației corelației
Ipoteze:
MSR Fcalc = MSE
H 0 :β=0 (nu este semnificativ din punct de vedere statistic) H 1 :β≠0 (este semnificativ din punct de vedere statistic) = 5.32743564385441
Fcritic = F∝ /2 ;k−1 ;n−k = F0.05 ;2 ;28 = 3.340385558 ⇒
Fcalc
>
Fcritic
Significance F < α
Resping
H0
F 5.327435 644
⇒ Resping
Significanc eF 0.0109484 64
H 0 , accept ipoteza altervativă
H 1 , potrivit căreia parametrul β este semnificativ,
mediile grupelor sunt semnificativ diferite una faţă de alta, diferenţele observate între mediile grupelor nu sunt datorate întâmplării.
e.1. Testarea ipotezei de homoscedasticitate Pentru a verifica homoscedasticitatea erorilor, am construit 2 regresii auxiliare. În fișierul Excel se poate observa că am început cu ordonarea țărilor în funcție de variabila dependentă Importuri/capita. Apoi, am eliminat 9 valori din lista inițială, rămânând astfel cu 20 de țări pe care le-am împărțit în 2 subeșantioane, în funcție de valorile mici ale importurilor/capita, respectiv ale valorilor mari ale importurilor/capita. Subesantio n1 PIB/capita 1800,00 1716,53 1494,43 3289,06 872,34 1159,63 4763,30 7391,97 6188,19 3337,86
(valori mici X) Import/ca pita 175,79 405,01 476,26 481,27 481,27 889,81 916,33 1120,73 1223,81 1231,36
Ulterior, pentru fiecare eșantion am realizat un model de regresie ce se poate regăsi în fișierul Excel, din care am reținut suma pătratelor reziduurilor pentru ambele eșantioane. SS
23368416
Residual 1 SS
,22 30163750
Residual 2
61
Tabel 3 - Pătratele reziduurilor pentru ambele eșantioane
Având aceste date la dispoziție, putem începe testarea ipotezei de homoscedasticitate.
H0:
^ a^ =0, b=0 , model valid (se verifică ipoteza de homoscedasticitate:
dispersiile rezidurilor Exporturi/capita); H1:
sunt
constante
şi
independente
de
variabila
^ 0 a^ ≠ 0, b≠ , model nevalid se verifică opusul ipotezei de homoscedasticitate,
şi anume heteroscedasticitatea); Deoarece Significance F (0,006743055) este mai mic decât pragul de semnificaţie α (0,05), se acceptă ipoteza alternativă. Comparăm apoi și Fcritic cu Fcalculat: Fcalc = (SS Residuals 2/n1 – k) / (SS Residuals 1 / n2 – k), unde n1=n2=(n-c)/2 și c este numărul de valori eliminate anterior, iar k este numărul de variabile independente din fiecare subeșantion. Fcalc = 3016375061/23368416,22 = 129,079 Se citește Ftab(0,05; 9; 9) = 3,179 Deoarece Fcalc ˃ Ftab, deducem din nou că se acceptă ipoteza alternativă, nu se verifică ipoteza de homoscedasticitate, ci cea de heteroscedasticitate, cu o probabilitate de 95%.
e.1. Testarea ipotezei de autocorelare a erorilor n
r1
uˆ i2
i
* uˆ i 1
n
uˆ i 1
2
; r1 1,1
i
Pentru
a
cerceta
existența
autocorelării
se
utilizeaza Testul Durbin Watson (DW), ce constă în calcularea termenului empiric și în compararea mărimii d cu două valori teoretice, d1 și d2, preluate din tabelele D-W, în funcție de un prag de semnificație
α , numărul variabilelor
exogene independente (k=1, în cazul de față) și al valorilor observate (n=29).
uˆ
= valoare reziduală; După cum se observă în output-ul din Excel de mai jos, valoarea DW este
de 0,50. Deci, coeficientul de autocorelație calculat pe baza erorilor de ordinul 1 este egal cu 0,50. Deoarece este mai mare decât 0, autocorelația este strict pozitivă. Pentru a testa semnificaţia coeficientului de autocorelație a erorilor de gradul 1 (k=1) se utilizează testul Durbin Watson, iar nivelul de semnificaţie este 0,05. Valorile critice ale modelului, preluate din tabelul distribuţiei DurbinWatson, sunt d1=1,119 şi d2=1,254. Deoarece d1 < DW < d2 (0 < 0.50 < 1,08) putem garanta cu o probabilitate de 95% că erorile sunt autocorelate pozitiv.
Tabel 4 - Output pentru calcularea erorilor și indicelui Durbin-Watson (DW)
e.1. Testarea normalității erorilor
PIB/capita 78275,15 56366,57 46720,36 41690,70
Importuri/c apita 15923,62 7011,24 6507,45 24104,76
Predicted Y 23958,60502 17390,12051 17018,82387 29988,16068
Residuals 54316,54498 38976,44949 29701,53613 11702,53932
36795,82 36151,21 25136,21 24612,54 22590,16 22180,78 20355,25
68124,00 9063,09 5012,75 10046,84 10283,12 7733,85 5983,20
62430,63911 18902,34788 15917,21983 19627,3783 19801,51826 17922,68898 16632,44806
11935,43
2921,87
14376,22709
10666,06
3089,31
14499,6315
9705,39
4594,47
15608,94463
7391,97
1120,73
13048,77469
6669,54
1539,68
13357,54368
6510,61
2066,53
13745,83571
6188,19
1223,81
13124,74535
4945,13
2921,81
14376,18287
4763,30
916,33
12898,13051
3672,97 3508,41
2121,95 1702,65
13786,68062 13477,65368
3337,86
1231,36
13130,30975
3289,06 1800,00 1716,53
481,27 175,79 405,01
12577,48834 12352,3475 12521,2842
1494,43
476,26
12573,79593
1159,63
889,81
12878,58509
872,34
481,27
12577,48834
25634,81911 17248,86212 9218,990171 4985,161699 2788,641736 4258,091016 3722,801939 2440,797089 3833,571504 5903,554632 5656,804693 6688,003684 7235,225707 6936,555352 9431,052868 8134,830507 10113,71062 -9969,24368 9792,449753 9288,428336 -10552,3475 -10804,7542 11079,36593 11718,95509 11705,14834
Tabel 5 - Valorile celor două variabile și valorile ajustate și reziduale
Tabel 6 - Calculul intervalului pentru pragul de semnificație
Cu ajutorul acestor date, verificarea ipotezei de normalitate a erorilor se poate face pe baza următorului grafic: pe OX se trec valorile ajustate ale variabilei Y (predicted Y), iar pe axa OY se vor trece valorile variabilei reziduale. Se observă că valorile variabilei reziduale nu se înscriu în intervalul calculat, deci ipoteza de normalitate a variabilei reziduale nu poate fi acceptată cu pragul de semnificație de =0,05. În concluzie, nici acest model nu este normal.
Residuals 60000 50000 40000 30000
Residuals
20000 10000 0 -10000 0
10000 20000 30000 40000 50000 60000 70000
-20000 -30000
Bibliografie Datele statistice au fost preluate din aceste surse: http://www.nationmaster.com/country-info/stats/Economy/GDP-per-capita#2012 http://www.nationmaster.com/country-info/stats/Economy/Exports-per-capita
http://www.nationmaster.com/country-info/stats/Economy/Imports-per-capita