Proiect Econometrie - ASE [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Cuprins I. Introducere II. Descrierea datelor ce vor fi utilizate în modelul econometric III. Specificarea modelului econometric unifactorial a) Estimațiile parametrilor modelului b) Validitatea modelului de regresie c) Semnificaţia statistică a parametrului pantă (𝛽𝛽1 ).

d) Verificaţi îndeplinirea ipotezelor modelului clasic de regresie liniară d.1) Homoscedasticitatea erorilor aleatoare d.2) Non-autocorelarea erorilor aleatoare d.3) Normalitatea erorilor aleatoare și reprezentarea diagramei qq-plot e) Corectați modelul de regresie

f) Previzionaţi, atât punctual cât și printr-un interval de încredere 95%, valoarea variabilei dependente Y dacă variabila explicativă creşte cu 10% faţă de ultima valoare înregistrată, utilizând modelul econometric corectat.

IV. Specificarea modelului econometric multifactorial a) Să se estimeze parametrii modelului şi să se interpreteze valorile obţinute pentru parametrii pantă. b) Verificaţi existenţa multicoliniarităţii variabilelor explicative c) Deoarece nu exista multicoliniaritate, nu este nevoie sa transformam modelul. d) Verificaţi îndeplinirea ipotezelor modelului clasic de regresie liniară

V. Concluzii VI. Bibliografie

I. Introducere S&P500 reprezintă denumirea abreviată a indicelui Standard & Poor's 500 care este indicele celor mai mari companii americane (în funcţie de valoare) listate la NYSE şi NASDAQ. Indicele cuprinde cele 500 de companii principale şi aproximativ o acoperire de 80% a capitalizării disponibile a pieţei cu Apple, Microsoft şi Exxon în calitate de primele trei cele mai mari companii. La fel ca toţi indicii principali, indicele S&P 500 utilizează Standardul global de clasificare industrială (GICS) pentru a diviza companiile în sectoare, precum energie, sănătate, finanţe, tehnologia informaţiei şi retail. Datele folosite în model sunt prezentate în tabelul de mai jos: An- Lună

Prețul S&P500 ($)

Oct-17

2,575.26

Nov-17

2,647.58

Dec-17

2,673.61

Jan-18

2,823.81

Feb-18

2,713.83

Mar-18

2,640.87

Apr-18

2,648.05

May-18

2,705.27

Jun-18

2,718.37

Jul-18

2,816.29

Aug-18

2,901.52

Sep-18

2,913.98

Oct-18

2,711.74

Nov-18

2,760.17

Dec-18

2,506.85

Jan-19

2,704.10

Feb-19

2,784.49

Mar-19

2,834.40

Apr-19

2,945.83

May-19

2,752.06

Jun-19

2,941.76

Jul-19

2,980.38

Aug-19

2,926.46

Sep-19

2,976.74

Oct-19

3,037.56

Nov-19

3,140.98

Dec-19

3,230.78

Jan-20

3,225.52

Feb-20

2,954.22

Mar-20

2,584.59

Rata șomajului (%)

Rata inflației (%)

4.1 4.1 4.1 4.1 4.1 4 3.9 3.8 4 3.9 3.9 3.7 3.8 3.7 3.9 4 3.8 3.8 3.6 3.6 3.7 3.7 3.7 3.5 3.6 3.5 3.5 3.6 3.6 4.4

2.04 2.2 2.11 2.07 2.21 2.36 2.46 2.8 2.87 2.95 2.7 2.28 2.52 2.18 1.91 1.55 1.52 1.86 2 1.79 1.65 1.81 1.75 1.71 1.76 2.05 1.81 2.25 2.49 1.54

Indicele datează din 1923, dar a fost extins la 500 de companii în ianuarie 1957. Dacă priveşti un grafic al modului în care indicele s-a manifestat în tot acest timp, vei obţine o perspectivă asupra fluctuaţiilor economiei americane, prin perioadele de creştere şi recesiune. În cadrul acestui proiect am studiat regresia liniară unifactorială și multifactorială parcurgând toate etapele necesare în identificarea unui model econometric.Ca suport economic am studiat dependenţa între S&P 500, rata şomajului şi rata inflaţiei (datele fiind din SUA). Acest proiect urmărește modificarea indicelui prețului în funcție de rata şomajului şi rata inflaţiei. Se poate observa o evoluție constantă a prețului ( fiind în creștere până la sfârșitul anului 2019 ) , urmată de o cădere bruscă ( începutul crizei). Ca sursă a datelor am folosit www.miseryindex.us/rawdata.aspx. Pentru evoluţia S&P am folosit site-ul investing.com.

II. Descrierea datelor ce vor fi utilizate în modelul econometric Modelul de regresie liniară unifactorială este: Y = 𝜷𝜷𝟎𝟎 + 𝜷𝜷𝟏𝟏 𝐗𝐗+𝜺𝜺

Modelul de regresie liniară multifactorială este: Y = 𝜷𝜷𝟎𝟎 + 𝜷𝜷𝟏𝟏 𝑿𝑿𝟏𝟏+𝜷𝜷𝟐𝟐 𝑿𝑿𝟐𝟐 + 𝜺𝜺

Y – Prețul S%P500 masurat in dolar ( variabila dependentă)

S&P 500 este un indice bursier care conține 500 de companii publice mari, majoritatea americane. 𝑿𝑿𝟏𝟏 – Rata șomajului masurat in procent ( variabila independentă )

Rata șomajului reprezintă raportul dintre numărul șomerilor si populația activă, exprimat procentual. 𝑿𝑿𝟐𝟐 – Rata inflației masurat in procent ( variabila independentă )

Rata medie anuală a inflației reprezintă creșterea medie a prețurilor de consum într-un an față de anul precedent. Aceasta rată se calculează ca un raport, exprimat procentual, între indicele mediu al prețurilor dintr-un an și cel al anului precedent, din care se scade 100.

𝜺𝜺 – variabila eroare ( reziduuri)

Variabila eroare, aleatoare, cu proprietăți probabilistice bine-definite și care surprinde influența tuturor factorilor reziduali asupra variabilei Y.

III. Specificarea modelului econometric unifactorial Variabilele modelului de regresie unifactorial Y – Prețul S%P500 măsurat in dolar ( variabila dependentă) 𝑿𝑿 – Rata șomajului măsurat in procent ( variabila independentă )

a) Estimațiile parametrilor modelului Excel :

E Views: File -> Import -> Import from File -> Serie de date proiect Econ..xlsx

În workfile apar 3 serii de date : an_luna , pretul_sp500, rata_somajului

Pentru estimarea modelului de regresie liniară cu prețul_sp500 ca variabilă dependentă (Y) si rata_șomajului ca variabilă independentă (X) se procedeaza astfel: În Workfile -> Object-> New object -> Type of object -> Equation-> Ok:

Se precizează ecuația de regresie : pretul_sp500 c rata_somajului, iar apoi metoda : LS si sample: 1 30

Output:

R Studio:

PRETUL__SP500 = 5257,08216693 – 635,879642615*RATA_SOMAJULUI

𝛽𝛽0 - este parametrul intercept fiind egal cu 5257,08216693

Dacă rata șomajului este 0% , atunci prețul S&P500 ar fi de 5257,08216693 $.

𝛽𝛽1 - este parametrul pantă fiind egal cu -635,879642615 (rata șomajului)

Dacă rata șomajului crește cu un procent , atunci prețul S&P500scade in medie cu 635,879642615 $.

b) Validitatea modelului de regresie 𝐻𝐻0 : modelul de regresie Y = 𝜷𝜷𝟎𝟎 + 𝜷𝜷𝟏𝟏 𝐗𝐗+𝜺𝜺 nu este valid sau nu este semnificativ statistic 𝐻𝐻1 : modelul de regresie Y = 𝜷𝜷𝟎𝟎 + 𝜷𝜷𝟏𝟏 𝐗𝐗+𝜺𝜺 este valid sau semnificativ statistic Excel:

Eviews:

R Studio:

𝐹𝐹𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 =40,87177 >𝐹𝐹0.05;1;28 =4,195972 , înseamnă că 𝐹𝐹𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 se găsește în regiunea critică ,

adică respingem 𝐻𝐻0 la nivelul de semnificație 0,05 , concluzionând că datele de selecție sunt în favoarea ipotezei alternative H1, adică modelul de regresie este valid statistic.

c) Semnificaţia statistică a parametrului pantă (𝛽𝛽1 ). 𝐻𝐻0 : 𝛽𝛽1 = 0 (parametrul este nesemnificativ statistic sau parametrul nu este semnificativ diferit

de 0)

𝐻𝐻1 : 𝛽𝛽1 ≠0 (parametrul este semnificativ statistic sau parametrul este semnificativ diferit de

0)

Excel:

Eviews:

R Studio:

𝑡𝑡0.05;28 = 2.048 2

𝑡𝑡𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = -6.393103

sau

Cum 𝑡𝑡𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 < - 𝑡𝑡𝛼𝛼;𝑛𝑛−2

acceptăm 𝐻𝐻1 la nivelul de semnificație de 5% , iar parametrul 𝛽𝛽1

Rc : t < -𝑡𝑡𝛼𝛼;𝑛𝑛−2 2 2

t > 𝑡𝑡𝛼𝛼;𝑛𝑛−2 2

este semnificativ statistic

Interpretaţi intervalul de încredere 95% pentru acest parametru: Excel:

Eviews: View → Coefficient Diagnostics → Confidence intervals , iar la Confidence levels se păstrează doar 0.95.

R Studio:

Cum intervalul de încredere 95% al parametrului 𝛽𝛽1 nu conține valoarea 0 , atunci acest parametru este semnificativ diferit de 0. •

Intervalul [-839,6211; -432,1382] acoperă valoarea adevarată a lui 𝛽𝛽1 , adică dacă rata inflației crește cu un procent, prețul S&P500 scade, in medie , cu o valoare acoperită de intervalul [432,1382; 839,6211].

d) Verificaţi îndeplinirea ipotezelor modelului clasic de regresie liniară d.1) homoscedasticitatea erorilor aleatoare 𝐻𝐻0 : 𝛼𝛼1 = 𝛼𝛼2 =0 (nu există heteroscedasticitate sau erorile aleatoare sunt homoscedastice)

𝐻𝐻1 : (∃)𝛼𝛼𝑖𝑖 ≠0 (există heteroscedasticitate sau erorile aleatoare sunt heteroscedastice)

Definim : • • •

SERIES REZIDUURI = RESID SERIES PRETUL__SP500_FITTED = PRETUL__SP500 – REZIDUURI SERIES SQUARED_REZIDUURI = REZIDUURI^2

Testul White Excel: Pentru a calcula homoscedasticitatea in Excel am descărcat extensia XLSTAT , unde avem testul White.

𝐻𝐻0 : 𝛼𝛼1 = 𝛼𝛼2 =0 (nu există heteroscedasticitate sau erorile aleatoare sunt homoscedastice) 𝐻𝐻1 : (∃)𝛼𝛼𝑖𝑖 ≠0 (există heteroscedasticitate sau erorile aleatoare sunt heteroscedastice) EViews: Creăm seria pătratelor reziduurilor 𝜀𝜀̂𝑖𝑖2 prin comanda: series squared_ reziduuri = reziduuri^2, iar în workfile va apărea noua variabilă squared_ reziduuri. View / Residual diagnostics / Heteroskedasticity Tests și la Test Type se alege White, iar apoi se specifică regresorii din noul model de regresie, în cazul acesta c rata_somajului.

R Studio:

Ecuația de regresie auxiliară estimată este:

𝜀𝜀̂𝑖𝑖2 = 517912.9 -248496.1⋅ 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑖𝑖 +30393.24 ⋅ 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑖𝑖2 𝑊𝑊𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = Obs*R-squared = 0.939862 Probabilitatea asociată :

Prob.Chi-Square(2) = 0.625 > 0.05

2 2 2 = 𝜒𝜒𝛼𝛼;𝑑𝑑𝑑𝑑 =𝜒𝜒0.05;2 = 5.99 𝜒𝜒𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐

2 𝑊𝑊𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = 0.939862 < 𝜒𝜒0.05;2 = 5.99 , deci respingem 𝐻𝐻1 si acceptăm 𝐻𝐻0 , adică erorile

aleatoare sunt homoscedastice.

Testul Glejser H0: 𝜆𝜆1 = 0, (𝑛𝑛𝑛𝑛 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒ă ℎ𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒, 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ă 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒ă ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜)

H1: 𝜆𝜆1 ≠ 0, (există heteroscedasticitate)

|𝜀𝜀̂𝑖𝑖 | = 𝜆𝜆0 + 𝜆𝜆1 𝑥𝑥𝑖𝑖 + 𝜈𝜈𝑖𝑖

|𝜀𝜀̂𝑖𝑖 | = 𝜆𝜆0 + 𝜆𝜆1 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑖𝑖 + 𝜈𝜈𝑖𝑖

Eviews: Retinem reziduurile: series reziduuri = resid View / Residual diagnostics / Heteroskedasticity Tests și la Test Type se alege Glejser, iar apoi se specifică regresorii din noul model de regresie, în cazul acesta c rata_somajului.

R Studio: ------

t-Statistic = -0.700318 |𝜀𝜀̂𝑖𝑖 | = 259.5244 − 44.57853 ⋅ 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑖𝑖 se = (132,1962)

( 34,51822)

Coeficientul pantă 𝜆𝜆1 nu este semnificativ statistic (t-Statistic =-0, 700318 şi Prob= p value = 0,4895),deci erorile aleatoare ale modelului original de regresie sunt homoscedastice.

d.2) Non-autocorelarea erorilor aleatoare Testul Durbin-Watson Excel:

Eviews:

R Studio:

Interpretarea testului: H0 : Reziduurile nu sunt autocorelate (order = 1)

H1 : rho ≠ 0 (exista autocorelarea erorilor) d1 = 1.352 d2 = 1.489 DW = 1,091425 0 0,05, nu putem respinge H0 că reziduurile provin dintr-o distribuţie normală. Nu avem suficiente motive să respingem ipoteza nulă H0, prin urmare nu excludem posibilitatea ca variabila eroare să urmeze o repartiție normală.

Reprezentarea diagramei qq-plot: E-Views:

Comanda: qqplot

R Studio:

Din diagrama QQ-plot se poate deduce ca reziduurile provin dintr-o distributie normala.

e) Corectați modelul de regresie Corectarea autocorelarii Eviews: Estimam rho folosind comanda scalar rho=1-@dw/2 rho=0.454287 Pentru a estima modelul transformat de regresie 𝑦𝑦𝑡𝑡∗ = 𝛽𝛽0∗ + 𝛽𝛽1 𝑥𝑥𝑡𝑡∗ + 𝑢𝑢𝑡𝑡 comenzile: series y_star = y -rho*y(-1)

series x_star = x - rho*x(-1) Estimăm ecuația de regresie pentru modelul transformat: y_star c x_star scalar beta0=c(1)/(1-rho)

folosim

R Studio:

Ecuatia modelului corectat: PRETUL__SP500 = 2568.288 – 489.6105*RATA_SOMAJULUI Folosim Testul Durbin-Watson pentru a testa autocorelarea erorilor: H0 : Reziduurile nu sunt autocorelate (order = 1) H1 : rho ≠ 0 (exista autocorelarea erorilor)

DW=1.7558

Din tabelul cu valorile critice ale statisticii DW, pentru nivelul de semnificaţie 5%, n=29, pentru k=1, găsim: d1=1,341

d2=1.483

Deoarece d2𝐹𝐹0.05;1;27=4.21 , înseamnă că 𝐹𝐹𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 se găsește în regiunea critică , adică respingem 𝐻𝐻0 la nivelul de semnificație 0,05 , concluzionând că datele de selecție sunt în favoarea ipotezei alternative H1, adică modelul de regresie este valid statistic.

În concluzie, modelul 𝒚𝒚∗𝒕𝒕 = 𝜷𝜷∗𝟎𝟎 + 𝜷𝜷𝟏𝟏 𝒙𝒙∗𝒕𝒕 poate fi considerat ca fiind reprezentativ pentru a descrie legătura dintre Prețul S%P500 şi Rata Somajului. f) Previzionaţi, atât punctual cât și printr-un interval de încredere 95%, valoarea variabilei dependente Y dacă variabila explicativă creşte cu 10% faţă de ultima valoare înregistrată, utilizând modelul econometric corectat.

Eviews:

new_val=3.04095 scalar t_critic = @qtdist(1-0.025,28) series ci_lower = pretul_star_f - t_critic * se_prediction series ci_upper = pretul_star_f+ t_critic * se_prediction

t_critic=2.048407

Astfel, de pe ultima linie a grupului, adică de pe linia 31, citim că previziunea punctuală a profitului este 𝑦𝑦�31 = 1079.407 $ , la intervalul de încredere 95% al nivelului profitului Y ,dacă variabila explicativă creşte cu 10% faţă de ultima valoare înregistrată ( adică 3.04095) este 𝐶𝐶𝐼𝐼95% ( Prețul_SP500 rata_somajului) = [770.6247;1388.189] $.

In selectii repetate, 95 din 100 intervale ca cel obtinut vor acoperi valoarea adevarata a Pretului S&P, daca rata somajului este 3.04095. R Studio:

IV. Specificarea modelului econometric multifactorial Y – Prețul S%P500 masurat in dolar ( variabila dependentă) S&P 500 este un indice bursier care conține 500 de companii publice mari, majoritatea americane. 𝑿𝑿𝟏𝟏 – Rata șomajului masurat in procent ( variabila independentă )

Rata șomajului reprezintă raportul dintre numărul șomerilor si populația activă, exprimat procentual. 𝑿𝑿𝟐𝟐 – Rata inflației masurat in procent ( variabila independentă )

Rata medie anuală a inflației reprezintă creșterea medie a prețurilor de consum într-un an față de anul precedent. Aceasta rată se calculează ca un raport, exprimat procentual, între indicele mediu al prețurilor dintr-un an și cel al anului precedent, din care se scade 100.

a) Să se estimeze parametrii modelului şi să se interpreteze valorile obţinute pentru parametrii pantă. Excel:

Eviews:

R Studio:

Parametrul pantă 𝛽𝛽1 corespunzător variabilei 𝑿𝑿𝟏𝟏 (Rata somajului): estimația este � 𝛽𝛽1 = -631.67. Interpretare: dacă rata somajului creşte cu 1 procent, pretul S&P500 va scădea, în medie, cu 631.67 dolari, menținând constant nivelul celorlalte variabile explicative din model.

Parametrul pantă 𝛽𝛽2 corespunzător variabilei 𝑿𝑿𝟐𝟐 (Rata inflatiei): estimația este �2 = -20.64. 𝛽𝛽 Interpretare: dacă rata inflatiei creşte cu 1 procent, pretul S&P500 va scădea, în medie, cu 20.64 dolari, menținând constant nivelul celorlalte variabile explicative din model.

b) Verificaţi existenţa multicoliniarităţii variabilelor explicative Eviews: EQ1/ Proc / Make Regressor Group -> View / Covariance Analysis/ Method(Correlation)

𝑟𝑟𝑥𝑥1 ,𝑥𝑥2 =0,114198 rezultă că coeficientul de corelatie Pearson intre 𝑋𝑋1 și 𝑋𝑋2 este apropiat de valoarea 0 , adică nu există corelație (asociere aleatoare).

R Studio:

Calculam factorul de inflaţie a varianţei (Variance Inflationary Factor)

Valoarea VIF este 1.0132, o valoare apropiata de 1, deci nu exista multicoliniaritate.

c) Deoarece nu exista multicoliniaritate, nu este nevoie sa transformam modelul.

d) Verificaţi îndeplinirea ipotezelor modelului clasic de regresie liniară Homoscedasticitatea erorilor aleatoare

Testul White

𝑊𝑊𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = Obs*R-squared = 2.49 Probabilitatea asociată :

Prob.Chi-Square(2) = 0.77> 0.05

2 2 2 = 𝜒𝜒𝛼𝛼;𝑑𝑑𝑑𝑑 =𝜒𝜒0.05;5 = 11.07 𝜒𝜒𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐

2 = 11.07 , deci respingem 𝐻𝐻1 si acceptăm 𝐻𝐻0 , adică erorile 𝑊𝑊𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = 0.939862 < 𝜒𝜒0.05;2 aleatoare sunt homoscedastice.

Non-autocorelarea erorilor aleatoare

Testul Durbin-Watson

Interpretarea testului: H0 : Reziduurile nu sunt autocorelate (order = 1) H1 : rho ≠ 0 (exista autocorelarea erorilor)

d1 = 1.284 d2 = 1.567 DW = 1.071291 0 0,05, nu putem respinge H0 că reziduurile provin dintr-o distribuţie normală. Nu avem suficiente motive să respingem ipoteza nulă H0, prin urmare nu excludem posibilitatea ca variabila eroare să urmeze o repartiție normală.

V. Concluzii Modelul studiat ne-a arătat dependenţa S&P de şomaj şi inflaţie. Însă acest model

pare a fi valabil doar într-o recesiune, deoarece de obicei S&P şi oricare indice bursier cresc într-o situaţie inversă celei prezente. O inflaţie scăzută şi şomaj înalt determină o stagnare în creştere economică şi eventual în indici. Dar după cîte constatam din model perioadele de criză se caracterizează prin disproporţii economice.

VI. Bibliografie http://www.miseryindex.us/rawdata.aspx https://www.investing.com/indices/us-spx-500-historical-data https://capital.com/ro/indice-s-p-500-definitie