Cours Econometrie [PDF]

Filière de Sciences Économiques et de Gestion Licence d’Études Fondamentales Département de Sciences Économiques Économ

32 0 6MB

Report DMCA / Copyright

DOWNLOAD PDF FILE

Papiere empfehlen

Cours D'econometrie Licence 3

0 0 5MB Read more

Proiect Econometrie

0 0 3MB Read more

Econometrie Spatiala

1 0 1MB Read more

Proiect Econometrie

0 0 355KB Read more

Proiect Econometrie Csie

0 0 2MB Read more

Econometrie Des Series Temporelles

4 1 3MB Read more

Proiect Econometrie - ASE

0 0 1MB Read more

Intrebari Recapitulare Econometrie

0 0 164KB Read more

Exercitii Econometrie Rezolvate Ase

0 0 2MB Read more

Lucrare Indiviuala Econometrie

0 0 238KB Read more

Cours Econometrie [PDF]

Author / Uploaded
Bbaggi Bk

0 0 0
Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden

Datei wird geladen, bitte warten...

Zitiervorschau

Filière de Sciences Économiques et de Gestion Licence d’Études Fondamentales Département de Sciences Économiques

Économétrie I À l’usage des étudiants inscrits en S5 Parcours : Économie Option : Sciences-Économiques

Enseignante : Amale LAHLOU

Année Universitaire : 2015 - 2016

1

Support de cours : le manuel Économétrie Cours et exercices corrigés 9ème édition RÉGIS BORBONNAIS Maître de conférence à l’université de Paris-Dauphine

Logiciels informatiques recommandés : SPSS, EVIEWS, EXCEL On utilisera EXCEL et EVIEWS pour la résolution des exercices

Introduction L’économétrie prend la part du lion dans toute analyse économique. Elle a trait au traitement mathématique des données statistiques relevant des phénomènes économiques. Économie

&

Métrique &



Informatique

Économétrique



économétrie

L’économétrie est un outil à la disposition de l’économiste lui permettant d’infirmer ou de confirmer les théories qu’il construit. Un modèle est une présentation formalisée d’un phénomène économique réel sous forme d’équations dont les variables sont des grandeurs économiques. On distingue entre :  Un modèle économique  Un modèle économétrique Pr. Amale LAHLOU

S5 : Sciences Economiques

3

Méthodologie économétrique Théorie économique

Spécification ou confection du modèle

Estimation des paramètres(MCO=OLS) Vérification ou validation du modèle. Modèle conforme à la réalité ?

non

Prévision ou prédiction

Utilisation pour des fins de politique économique Pr. Amale LAHLOU

4

Si on s’intéresse à

établir une relation entre deux

variables sous forme d’un modèle, on parlera de régression simple en exprimant une variable en fonction de l’autre. Si la relation porte entre une variable et

plusieurs autres variables, on parlera de régression multiple. La mise en œuvre d’une régression impose l’existence d’une relation de cause à effet entre les variables prises en compte dans le modèle. Pr. Amale LAHLOU

S5 : Sciences Economiques

5

Chapitre 1 (manuel de Régis Bourbonnais) : Le modèle de régression linéaire simple I. Présentation du modèle A. Exemple introductif B. Rôle du terme aléatoire C. Conséquence du terme aléatoire

II. Estimation des paramètres A. Modèle et hypothèse B. Formulation des estimateurs (Méthode du Moindre Carrés Ordinaires) C. Les différentes écritures du modèle : erreur et résidu D. Propriétés et caractéristiques des estimateurs Pr. Amale LAHLOU

S5 : Sciences Economiques

6

III. Conséquences des hypothèses A. B. C.

Hypothèse de normalité des erreurs Conséquences de l’hypothèse de normalité des erreurs Test bilatéral, test unilatéral et probabilité critique d’un test

IV. Equation et tableau d’analyse de variance A. B.

Équation d’analyse de la variance Tableau d’analyse de la variance

V. La prévision à l’aide du modèle de régression linéaire simple A. B.

Prévision Ponctuelle Intervalle de prédiction

III. Applications Pr. Amale LAHLOU

S5 : Sciences Economiques

7

Introduction Variable Y à expliquer

Variable X explicative Quantitatif

Qualitatif

Quantitatif

Régression linéaire Corrélation simple

Analyse de la variance à un facteur

Qualitatif

Régression logistique

Test du Khi deux D’indépendance

La régression linéaire simple (le nom est du à Galton) est un outil fréquemment utilisé pour étudier la linéarité entre deux variables quantitatives ayant un rôle asymétrique :  une variable Y à expliquer (à prédire ou encore variable dépendante, variable endogène ou variable réponse)

 et une variable X explicative (prédictive ou encore variable indépendante, variable exogène). Pr. Amale LAHLOU

S5 : Sciences Economiques

8

Les objectifs de la régression linéaire simple  Description d’une éventuelle relation de cause à effet entre deux variables (études non-expérimentales) ;

 Explications et confrontations des hypothèses en se basant sur des études expérimentales contrôlées ;

 Prédiction d’une variable à partir de l’autre. Pr. Amale LAHLOU

S5 : Sciences Economiques

9

Exemple Introductif Soit la fonction de consommation Keynésienne : Avec,

C  a0  a1 R

C : Consommation par habitant R : revenu a1 : propension marginale à consommer a0 : consommation autonome ou incompressible On a : La consommation C est une variable « à expliquer » et le revenu R est une variable « explicative ». a1 et a0 sont les paramètres du

modèle ou coefficients de la régression linéaire simple. Pr. Amale LAHLOU

S5 : Sciences Economiques

10

Spécification Modèle en série temporelle : par exemple, la consommation et le revenu annuel pour le Maroc de 2000 à 2013 Ct  a0  a1 Rt

t  2000,..., 2013

Ct : Consommation au temps t (cas du Maroc) Rt : revenu au temps t (cas du Maroc)

Modèle en coupe instantanée : par exemple, la consommation et le revenu pour 15 pays en 2013 (date fixe)

Ci  a0  a1 Ri

i  1,...,15

Ci : Consommation relative au payé i en 2013 Ri : revenu relatif au payé i en 2013

Modèle en panel : par exemple, la consommation et le revenu pour 15 pays de 2000 à 2013

Ci ,t  a0  a1Ri ,t

Pr. Amale LAHLOU

i  1,...,15 ; t  2000,..., 2013

S5 : Sciences Economiques

11

Rôle du terme aléatoire Le revenu est-il l’unique variable explicative de la consommation? Sûrement NON ! d’où, l’ajout du terme ɛ qui résumera toutes les fluctuations non observables attribuables à un ensemble de facteurs ou de variables non prises en compte dans le modèle :

Ct  a0  a1 Rt   t

ou

Ci  a0  a1Ri   i

La variable aléatoire ɛt (ou ɛi) regroupe trois types d’erreur : – Erreur de spécification – Erreur de mesure – Erreur de fluctuation d’échantillonnage Pr. Amale LAHLOU

S5 : Sciences Economiques

12

Exemple Introductif (C2EX1, eco9) Revenu 1

8000

2

9000

3

9500

4

9500

5

9800

6

11000

7

12000

8

13000

9

15000 16000

10

Sachant que la propension marginale à consommer est de 0,8 et la consommation incompressible est 1000 UM, 1. Calculons la consommation théorique estimée durant les dix ans: ˆ  1000  0,8 Y C t t 2. On suppose dans cet exemple que :

 t  N  0, 20000  Générer cette variable aléatoire et puis calculer la consommation observée tenant compte de cette erreur : Ct  1000  0,8 Rt   t  Cˆt   t

Évolution du Revenu moyen par habitant pour 10 ans Pr. Amale LAHLOU

S5 : Sciences Economiques

13

Cliquer ici

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille exemple introductif)

Cˆt  1000  0,8 Rt Année

Utilitaire d’analyse sous Excel

Cˆ t   t

C’est un exemple Revenu Disponible

Consommation Théorique

Aléa ɛt

Consommation observée

1

8000

7400

-10,01

7389,99

2

9000

8200

-30,35

8169,65

3

9500

8600

231,71

8831,71

4

9500

8600

52,84

8652,84

5

9800

8840

-51,92

8788,08

6

11000

9800 -183,79

9616,21

7

12000

10600

-6,55

10593,45

8

13000

11400 -213,89

11186,11

9

15000

13000 -241,91

12758,09

13800

69,62

13869,62

Moyenne

-38,43

10

16000

Ecart type 137,2486

Pr. Amale LAHLOU

S5 : Sciences Economiques

14

Conséquence du terme aléatoire En général, les coefficients a0 et a1 sont inconnues et on les estime par échantillonnage. On pose :

aˆ0 estimateur de a0 aˆ1 estimateur de a1

aˆ0 et aˆ1 sont des variables aléatoires qui suivent les mêmes loi de probabilité que celle de ɛt (les erreurs sont supposées

indépendantes et identiquement distribuées par une loi normale) N.B. : L’estimation de aˆ1 est la valeur de l’estimateur aˆ1 de a1 pour un échantillon. Pr. Amale LAHLOU

S5 : Sciences Economiques

15

Modèle et hypothèses Le modèle théorique de régression simple s’écrit : pour

t  1,

,n

yt  a0  a1 xt   t n

: Nombre d’observations (taille de l’échantillon)

yt

: Variable à expliquer au temps t, variable dépendante ou variable endogène. Elle est entachée d’une erreur additive ɛt

xt

: Variable certaine explicative au temps t, variable indépendante ou variable exogène

a1 : Paramètre du modèle, c’est le coefficient de régression. Il représente la pente de la droite (variation de Y due à une variation unitaire de X) a0 : Paramètre du modèle, c’est l’ordonnée à l’origine.

ɛt

: Erreur de spécification de nature aléatoire et inconnue (différence entre le modèle vrai et le modèle spécifié), appelée encore bruit blanc ou facteur de perturbation cette erreur et restera inconnue.

Pr. Amale LAHLOU

S5 : Sciences Economiques

16

Les hypothèses suivantes permettent de déterminer les estimateurs des coefficients du modèle ayant de bonnes propriétés et de construire des tests statistiques (tests et intervalles de confiance).

xt

ou f  xt 

(H1)

: Le modèle est linéaire en

(H2)

: Les valeurs

(H3)

: E   t   0 l’espérance mathématique de l’erreur est nulle : en moyenne le modèle est bien spécifié et donc l’erreur moyenne est nulle

(H4)

(H5)

xt sont observées sans erreur ( xt non aléatoire)

: E ( t )     cste la variance de l’erreur est constante : le risque de l’amplitude de l’erreur est le même quelle que soit la période 2

2

: E   t  t    0 si t  t  les erreurs sont non corrélées (ou encore indépendantes) : une erreur à l’instant t n’a pas d’influence sur les erreurs suivantes.

(H6)

: Cov  xt ,  t   0 l’erreur est indépendante de la variable explicative

(H7)

:  t  N  0,  2  hypothèse supplémentaire pour les inférences.

Pr. Amale LAHLOU

S5 : Sciences Economiques

17

(H1) :

Le modèle est linéaire en xt ou f  xt  On suppose l’existence d’une relation linéaire entre X et Y

Y

Y

Linéarité X Pr. Amale LAHLOU

S5 : Sciences Economiques

Non-linéarité X 18

Linéarisation de certaines fonctions avec des transformations β0

0< β t 80,025  2, 306 ˆ ˆ aˆ1   aˆ1  0,01793912 Sur la table de Student donnée en annexe on lit :

P( T8  2,306)  0,05 Ou encore, on calcule la p-value :

P( T8  43,53)  8,557 10-11  0,05 On rejette H0 : la propension marginale à consommer est significativement différente de 0. La variable revenu est bien explicative de la variable consommation. Notez bien : sous Excel, LOI .STUDENT .INVERSE (0,05;8)  2,306  t *aˆ 1  43,53

LOI .STUDENT (43,53;8;2)  8,55710-11    0,05 Pr. Amale LAHLOU

S5 : Sciences Economiques

72

Q2. Quel est l’intervalle de confiance au niveau de confiance de 95 % pour la propension marginale à consommer ?

aˆ1  a1  Tn  2 Comme ˆ aˆ1

P  Tn 2

Ainsi, l’intervalle de confiance nous est donné par :

   aˆ1  a1  2 2  tn 2   1    P  tn 2   tn 2   0,95   ˆ  ˆ a  1  

I a1  aˆ1  tn/22ˆ aˆ1 , aˆ1  tn/22ˆ aˆ1   0, 74;0,82  On a un risque de 5 % pour que la variable a1 se trouve à l’extérieur de l’intervalle de confiance  0, 74;. 0,82  comme 0  0, 74;0,82 .  , on rejette H0

Pr. Amale LAHLOU

S5 : Sciences Economiques

73

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille test de signification)

Cliquer ici Année

yt

1 2 3 4 5 6 7 8 9 10

7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62

 yt  y   xt  x   yt  y  xt  x 

xt 8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00

-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05

Somme 99 855,75 112 800,00 Moyenne 9 985,58

-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00

8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00

 yt  y 

2

6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18

11 280,00

 xt

 x

2

10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00

et  yt  yˆt

ˆt y 7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81

64 156 000,00

et2

-33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00

1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38

SCT

aˆ1

SCR

= 0,78

t théorique (bilatéral à risque α=5 %) :

ddl 8

ˆ aˆ = 0,01793912 1

tn22  t80,025  2,306004133

LOI .STUDENT .INVERSE  0,05;8  2,306004133

t

* aˆ1

Pr. Amale LAHLOU



aˆ1 ˆ aˆ1

 43,535175 >t80,025 S5 : Sciences Economiques

On rejette (H0 : a1 = 0) 74

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)

Cliquer ici

Extrait du Rapport détaillé par une analyse sur Excel Coefficients

Erreur-type

Statistique t

Probabilité

Limite inférieure Limite supérieure pour seuil de pour seuil de confiance = 95% confiance = 95%

Constante

1176,089634

207,3920575

5,670851856

0,000469936

697,8426925

1654,336576

Variable X 1

0,780982745

0,01793912

43,53517545

8,5489E-11

0,73961506

0,822350431

aˆ0

aˆ1

ˆ aˆ

0

ˆ aˆ

1

taˆ0 

aˆ0 ˆ aˆ0

taˆ1 

aˆ0  tn/22ˆ aˆ0

aˆ1 ˆ aˆ1

aˆ1  tn/22ˆ aˆ1

Probabilité ou p-valeur :

p  2  P Tn  2  taˆ



p  2  P Tn  2   t aˆ Pr. Amale LAHLOU

aˆ0  tn  2ˆ aˆ0  /2



aˆ1  tn/ 22ˆ aˆ1

S5 : Sciences Economiques

On rejette H0 : a1 = 0 Puisque p-valeur est inférieur à α 75

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)

Cliquer ici

Extrait du rapport détaillé par une analyse sous EVIEWS

ˆ aˆ

0

ˆ aˆ

1

t aˆ 0

taˆ1

n

aˆ0

  P  value  t 

aˆ1

P  value taˆ0

aˆ1

ˆ 

Pr. Amale LAHLOU

S5 : Sciences Economiques

76

IV. Qualité de l’ajustement La régression est-elle globalement de bonne qualité ? Le test de Fisher s’intéresse à la significativité globale d’un modèle. Dans le cas de la régression simple, seul le paramètre a1 est concerné

A. Équation fondamentale d’analyse de la variance B. Tableau d’analyse de la variance (ANalysis Of Variance - ANOVA) Pr. Amale LAHLOU

S5 : Sciences Economiques

77

Équation fondamentale de l’analyse de la variance La somme des résidus est nulle puisque la droite de régression passe par le n point moyen :

e t 1

n

e

t

t 1

t

0

n

   yt  yˆ t 



t 1

n

 y t 1



 aˆ0  aˆ1 xt 

t



ny  naˆ0  naˆ1 x ny  n  y  aˆ1 x   naˆ1 x



0

La moyenne de la série à expliquer est égale à la moyenne de la série ajustée :

y  yˆ n

En effet,

e t 1

Pr. Amale LAHLOU

t

n

n

n

t 1

t 1

t 1

 0    yt  yˆ t   0   yt   yˆ t S5 : Sciences Economiques

78

n

ainsi

(y t 1

t

 y)

2



n

(y t 1



n

  yˆ t 1



  yˆ

En effet, n

 y t 1

t

t

  yˆ n

t 1



t

n

t 1



t

t

  yˆ n

t 1

ˆ t  y ˆt  y   y

t

  

ˆt  y ˆt  y ) 2 y n

2

t 1

 Pr. Amale LAHLOU

t 1

n

ˆt )2  y    ( yt  y 2

t 1

ˆ y ˆ y

 

2

n

  et2

Terme nul

t 1

2

n

  (et  e ) 2 t 1

n

 e  yˆ t

t 1 n

t

 y n

n

 et yˆ t  y  et t 1 n

t 1

 e aˆ t

t 1



n

ˆ t )  2 ( yt  y ˆt )  y ˆt  y   y    ( yt  y 2

0

ˆ1 xt  a

n

n

t 1

t 1

Car  et

0

t 1

n

xe t 1

t t

0

ˆ 0  et  a ˆ1  et xt a 0

S5 : Sciences Economiques

79

n

2 ( y  y )   t t 1

n

n

t 1

t 1

2 ˆ ( y  y )    yt  yˆ t   t



SCT



SCE

2

SCR

Somme des Carrés Totaux

Somme des Carrés Expliqués par le modèle

Somme des Carrés Résiduels Non expliqués par le modèle

(TSS :Total Sum of Squares)

(RSS: Regression Sum of Squares)

(ESS: Error Sum of Squares)

SCT SCE SCR

la variabilité totale des yt. C’est la somme des carrés des écarts des observations yt par rapport à la moyenne y la variabilité expliquée par le modèle. C’est la dispersion totale - la dispersion résiduelle la variabilité résiduelle. C’est la Somme des carrés des écarts des observations yt par rapport aux valeurs estimés par le modèle yˆ t n

  yt t 1

Pr. Amale LAHLOU

ˆt   y 2

n

e  t 1

2 t

S5 : Sciences Economiques

n

  et

e

2

t 1

80

yt yt yˆ

ˆ 1x t a  ˆ0 a  ˆt y

SCR :  yt  yˆt 

SCT :  yt  y 

SCE :  yˆt  y 

y

xt

0 Ecart total  yt  y  = écart dû au modèle n

n

SCT   ( yt  y ) 2   n  1

(y

t

t 1

 yˆt  y 

 y )2

n 1

t 1

n

n

SCE   ( yˆ t  y )   n  1 aˆ

 (x

2 t 1 1

2

t 1

t

+ écart résiduel

 yt  yˆt 

  n  1  y2

 x )2

n 1

  n  1

Cov 2 ( x, y )

 x2

n

n

n

t 1

t 1

SCR   ( yt  yˆt ) 2   et 2   n  2 

e t 1

2

t

n2

  n  2  ˆ 2 81

n

2 ( y  y )   t t 1

SCT



n

n

t 1

t 1

2 2 ˆ ( y  y )  e  t  t

SCE



SCR

permet de juger la qualité de l’ajustement d’un modèle : Plus la variance expliquée SCE est proche de la variance totale SCT (respectivement, plus la variance résiduelle est petite) meilleur est l’ajustement du nuage de points par la droite des Moindres Carrés.

D’où, l’introduction des indicateurs de la qualité d’ajustement Pr. Amale LAHLOU

S5 : Sciences Economiques

82

Coefficient de détermination R2: R2 est un indicateur de la qualité de l’ajustement de la droite aux données. Autrement dit, il mesure l’adéquation entre le modèle et les données observées. Il nous indique le pourcentage de l’information restituée par le modèle par rapport à la qualité d’information initiale. n

R

2

SCE   SCT

2 ˆ ( y  y )  t t 1 n

(y

t

t 1

0  R2  1

 y )2

n

R2  1  Pr. Amale LAHLOU

SCR  1 SCT

 ( yt  yˆt )

n

t 1 n

 ( yt  y ) t 1

2 e  t

2

 1

2

S5 : Sciences Economiques

t 1

n

2 ( y  y )  t t 1

83

y

y

yˆt  y

0  R2  1

yˆt  yt

2 se rapproche Plus le R x x 2 R 1 de 0, plus le nuage de R2  0 points est diffusé autour l'équation de la droite de l'équation de la droite de de la droite de régression. régression est capable de régression détermine 0% déterminer 100% de la de la distribution des Plus le R² tend vers 1, distribution des points. points. Autrement dit, la plus le nuage de points se Autrement dit, la droite droite de régression rapproche de la droite de de régression déterminée n'explique absolument régression. et les paramètres a0 et a1 pas la distribution des calculés sont ceux qui points. La variable déterminent parfaitement explicative x est donc la distribution des points. inutile. Pr. Amale LAHLOU

S5 : Sciences Economiques

84

Coefficient de corrélation multiple R : R est aussi un indicateur de la qualité de la représentation : R 

R2

On note par rXY le coefficient de corrélation linéaire simple de Pearson entre deux variables statistiques X et Y : rXY 

E  X  E  X   Y  E Y    var  X 

var Y 



cov  X , Y 

1  r  1

 XY

Il sert à mesurer l’intensité de la relation linéaire entre ces deux variables. Étant donné un échantillon aléatoire de n couples d’observations, le coefficient empirique est donné par : n

   XY 

 ( x  x )( y  y ) t 1

t

t

n

 ( xt  x ) t 1

Pr. Amale LAHLOU

n



n

2

 ( yt  y ) t 1

x y n x y

2

t 1

t t

n

x n x

S5 : Sciences Economiques

t 1

2 t

n

2

2 2 y  n y t t 1

85

Remarquons que le coefficient de corrélation linéaire simple s’écrit : r

Ce qui implique :

cov  X , Y 

 XY

t 1

Pr. Amale LAHLOU

 X2

y

 X  X 2 r  aˆ1  r   aˆ1  Y  Y  

En plus : 2 n 2 aˆ1   xt  x   2  nt 1  2   y  y  t

Donc,



cov  X , Y   X

 2  R2

n

 aˆ1 xt  aˆ1 x  n

2   y  y  t



t 1

et

X Y

2

n

2

t 1

 aˆ1

2 ˆ   y  y  t t 1 n

2   y  y  t



SCE  R2 SCT

t 1

  signe  aˆ1  R

S5 : Sciences Economiques

86

Corrélation linéaire

Nulle Aucune relation entre les variations des valeurs de l’une des variables et les valeurs des autres variables

-1 Pr. Amale LAHLOU

nulle

faible

faible -0,5

0 S5 : Sciences Economiques

Très forte 0,5

parfaite

Très forte

Positive Augmentation ou diminution simultanée des valeurs des deux variables

forte

forte

parfaite

Négative Les valeurs de l’une des variables augmentent, les valeurs de l’autre variable diminuent

1 87

y

y

y

v

x

x Relation parfaite

x

Relation forte

y

Relation modérée

y

x Relation faible

Pr. Amale LAHLOU

x Pas de relation S5 : Sciences Economiques

88

Y

Y

Y

v

v

X

X

X

r  1

r 0

r 1

il existe une corrélation linéaire négative parfaite entre X et Y : droite de régression décroissante.

corrélation linéaire nulle. Alors, aucune dépendance linéaire entre X et Y.

il existe une corrélation linéaire positive parfaite entre X et Y : droite de régression croissante.

Plus la valeur de r s’éloigne de 0 pour s’approcher de 1 plus l’intensité du lien linéaire entre X et Y grandit de façon croissante ou décroissante. Bien noté que la corrélation n’indique aucun effet de causalité Pr. Amale LAHLOU

S5 : Sciences Economiques

89

Coefficient de détermination ajusté : En cas de régression linéaire simple, il est donné par les formules : Il peut être négatif





2 1  R SCR n  2 n 1 Ra2  1   R2   1  1  R2 SCT n  1 n2 n2





 Lorsque l’on ajoute des variables explicatives au modèle le R2 peut seulement croître même si ces nouvelles variables sont très liées à la variable à expliquer. Il peut être ainsi amplifié artificiellement par l’addition de n’importe quelle variable

explicative. Tandis que le R2 ajusté peut croître ou décroître.  Il est préférable de comparer les valeurs des R2 ajustés pour déterminer si l’introduction d’une variable supplémentaire est utile Pr. Amale LAHLOU

S5 : Sciences Economiques

90

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille coefficient de détermination)

Cliquer ici

 yt  y   xt  x   yt  y  xt  x 

xt

Année

yt

1 2 3 4 5 6 7 8 9 10

7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62

8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00

Somme

99 855,75

112 800,00

Moyenne 9 985,58

Estimation de

-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05

-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00

8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00

 xt

2

6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18

11 280,00

aˆ1 aˆ0

 yt  y 

 x

2

10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00

ˆt y 7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81

64 156 000,00

et  yt  yˆt -33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00

SCT

et2 1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38 SCR

SCT = 39 296 098,18 SCR = 165 169,38

= 0,780982745 = 1176,089634

SCE = SCT – SCR = 39 130 928,80

yˆt  aˆ1 xt  aˆ0  0, 78 x  1176, 08

Coefficient de détermination R2 = 0,995796799 Coefficient de détermination Ra2 ajusté = 0,995271399 Coefficient de corrélation linéaire multiple R = 0,997896187

n

n

SCR    yt  yˆ t    et2 t 1

Pr. Amale LAHLOU

2

t 1

n

n

SCT   ( yt  y ) 2 SCE   ( yˆt  y ) 2 R 2  SCE t 1

t 1

S5 : Sciences Economiques

SCT

Ra2  1 

SCR n  2 SCT n  1 R 

R2 91

Cliquer ici

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)

Extrait du Rapport détaillé par une analyse sur Excel R Statistiques de la régression Coefficient de détermination multiple R Coefficient de détermination

R2

0,997896187

R2

0,995796799

Coefficient de détermination ajusté

0,995271399

Erreur-type

143,6877615

Observations

10

Ra2

ˆ 

n 99,58% de la variabilité dans la consommation peut s’expliquer par la variabilité du revenu. Seulement 0,42% restants s’expliquent très mal : parfaite corrélation Pr. Amale LAHLOU

S5 : Sciences Economiques

92

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)

Cliquer ici

Extrait du rapport détaillé par une analyse sous EVIEWS

ˆ aˆ

0

n

ˆ aˆ

1

t a*ˆ0

ta*ˆ1

aˆ0 aˆ1

  P  value  t  P  value ta*ˆ0

* aˆ1

R2

ˆ 

Ra2

Pr. Amale LAHLOU

93

Tableau d’analyse de la variance pour un modèle de régression simple Source de variation Régression linéaire Variables explicatives

Degrés de liberté

Sommes des carrés

Moyenne des carrés

 

Fisher F 

SCE  n

k 1

( yˆ t  y ) 2 MCE  SCE  t 1 k

MCE F  MCR 

n

SCR   et2

Résidu

SCR MCR  n  k 1 2 n  k 1   ( yt  yˆt ) n

t 1

t 1

Total

n 1

k nombre de facteurs. Pour la régression simple k = 1

SCT  n

2 ( y  y )  t t 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

94

Source de variation Régression linéaire Variable explicative x

Degrés de liberté

Sommes des carrés

 ( yˆ

 y)

t

t 1

2

2 ˆ ( y  y )  t

F 

t 1

 ( yˆ

n2

(y t 1



n 1

 yˆ t ) 2

t

 e  n  2 2 t

2 e  t t 1

n

2 t

n2 Dans la variance

n

(y

t

 y)

n

(y

2

t 1

n

2 Dans la variance  ( yt  y ) t 1

Il y a une seule variable explicative. D’où, le degré de liberté est : 1



n

e

t 1

F 

 y )2 1

t

t 1 n

t 1

t 1

Total

n

1

n

Résidu

Fisher

n

n

1

Moyenne des carrés

(y t 1

t

 y)  0

D’où, le degré de liberté est : n  1

ˆt )  y

n

e t 1

2 t

Il y a n écart et deux contraintes connues : n

Il y a n écart et une contrainte connue : n

t

2

e t 1

t

0

n

et

e x t 1

t

t

0

D’où, le degré de liberté est :

n2

Source de variation Régression Variable explicative (x)

Résidus

Total (y)

Degrés de

liberté

1 n2

n 1

Sommes des carrées

Moyenne des carrées

SCE

SCE MCE  1

SCR

SCR MCR  n2

SCT

Fisher

F 

F  

MCE SCE 1  MCR SCR  n  2 

Fisher de degrés de liberté 1 et n-2

SCE SCE 2 2 MCE R R SCT  (n  2) 1  (n  2) F    2 SCR SCR MCR 1 R (1  R 2 ) (n  2) n2 SCT

Si la variance expliquée par le modèle est significativement supérieure à la variance résiduelle, alors la variable X est réellement explicative. Pr. Amale LAHLOU

S5 : Sciences Economiques

96

Le test de Fisher (analyse de la variance) permet d’intégrer la taille de l’échantillon n dans l’appréciation de la qualité de la représentation. Soit le test d’hypothèses :  H : SCE  SCR 0

  H1 : SCE  SCR SCE

 1  Calculer le Fisher empirique : F  SCR n2   F  Comparer F avec 1, n  2 , le Fisher tabulé à (1,n-2) degré de liberté

et au seuil   Conclure : si F   F1, n  2  ou la p-valeur associée est inférieur à α on rejette l’hypothèse nulle d’égalité des variances et donc la variable X est

significative et explicative de la variable Y Pr. Amale LAHLOU

S5 : Sciences Economiques

97

Équivalence des tests dans un modèle de régression linéaire simple Test sur le coefficient de régression linéaire (pente de la droite de régression)

 H 0 : a1  0 1   H1 : a1  0

Test sur le coefficient de corrélation linéaire entre les variables x et y

 H 0 : rxy  0  2 H : r  0 xy  1

Test de signification de la Somme des Carrés Expliqués

 H 0 : SCE  0  3   H1 : SCE  0

Test de signification du coefficient de détermination

H0 : R2  0  4  2  H1 : R  0

Pr. Amale LAHLOU

S5 : Sciences Economiques

98

Démonstration  Le test (1) se fait au moyen de la statistique de Student Tn  2 :  H 0 : a1  0 1   H1 : a1  0

aˆ1 sous H0 et au risque :  Tn  2 ˆ aˆ1  Le test (2) se fait au moyen de la statistique de Student Tn  2 : H0 : r  0  2   H1 : r  0

sous H0 et au risque  :

r

1

1  r 

 Tn  2

2

Pr. Amale LAHLOU

n2

S5 : Sciences Economiques

99

 Le test (3) se fait au moyen de la statistique de Fisher F1, n  2  : H 0 3   H1

sous H0 et au risque  :

:

SCE  0

:

SCE  0

SCE

1

SCR

 F1, n  2 

n2  Le test (4) se fait au moyen de la statistique de Fisher F1, n  2  : H 0 4   H1

sous H0 et au risque  :

:

R2  0

:

R2  0

R2

1

1  R  2

Pr. Amale LAHLOU

 F1, n  2 

n2

S5 : Sciences Economiques

100

En effet, sous l’hypothèse H 0 : a1  0 aˆ1 *  Tn  2 Déjà montré  t aˆ1  ˆ aˆ1  De même : r 1

1  r 

n2

1  r 

r

 n2

2

n2

n

 y t 1

aˆ1 

 x

t

t 1

 x

n

 et2

aˆ1 

n

 x t 1

ˆ 

t

 y

t

 x

 n2

t

 x

 y

 y

t 1 n

2

n

 y t 1

n

 x t 1

2

 y   aˆ 2

t

 x

t

2 1

n

 x t 1

 x

2

t

2

t

 x

2



aˆ1  Tn  2 ˆ aˆ1

t 1

n2 Pr. Amale LAHLOU

aˆ1

2

n

t 1

2

 x2

t 1

1

n

Cov( x, y )

2   x  x  t

 n2

1 r 2

 x y

n

aˆ1 1

Cov( x, y )

aˆ1 

 Tn  2

2

r

r

S5 : Sciences Economiques

Équation fondamentale de l’analyse de la variance

yˆ t  y  aˆ1 xt  x  101

 De même,

SCE SCR

1

 F1, n  2 

n2

n

SCE SCR

1

n  2

 n  2 

  yˆ t  y  t 1 n

 y t 1

 n  2 

n

2

 yˆ t 

aˆ

t 1

n

e

2

t

n

2 1

 n  2 

2 ˆ ˆ ˆ ˆ   a  a x  a  a x  0 1t 0 1

 x

 x

2

t

t 1

n

e t 1

t 1

2 t

 n  2 

2 t

ˆ t  aˆ0  aˆ1 xt y y  aˆ0  aˆ1 x

 2 aˆ  a2ˆ 2 1

1

n

n

e t 1

n

2 ˆ ( y  y )  e  t t t

2 t

2

t 1

t 1

2

aˆ  n  2 



2 1 2 aˆ1

n

e t 1

2 t

 2

SCE SCR

1

n  2

12 



2 n2

1

n2

 aˆ1  a1  2    aˆ1    aˆ    2 n 1     aˆ   2 1  xt  x   2  n  2   1  2  2  aˆ1 n n t 1  et   et        t 1     t 1     n  2



 F1, n  2  S5 : Sciences Economiques

102

puisque,



t



N 0,  2 

 aˆ1  a1      aˆ  1   SCE

Donc,

SCR

 et  N  0,1      t 1    n

et



2

1

2

 n2 2

Une seule normale centrée réduite au carré



2 1

Le rapport (de deux variables indépendantes) d’un Chi-deux divisé par son degré de liberté (1) à un Chi-deux divisé par son degré de liberté (n-2) suit une loi de Fisher de degrés de liberté (1, n-2)

 F1,n  2 

n2

Il est à noter qu’en régression linéaire simple, on se ramène à un test par analyse de la variance où le Fisher empirique est le carré de Student empirique : n

F 

SCE

*

SCR

1

n  2

 n  2

  yˆ  y  t

t 1

n

2 e t

n

aˆ 1   xt  x  2

 n  2

t 1 n

t 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

2 e t

2

 aˆ1    t a*ˆ  2  1 ˆ aˆ1  ˆ aˆ1  aˆ 12

 

2

t 1

103

 De même,

R2

1

1  R 

 F1,n  2 

2

n

r 2  aˆ12

n2

 xt  x  t 1 n

n

2



  yt  y 

2

t 1

 aˆ1 xt  aˆ1 x 

n

2

t 1

n

2   y  y  t



t 1

2 ˆ   y  y  t t 1 n

2   y  y  t



SCE  R2 SCT

t 1

Donc, le carré du coefficient de corrélation linéaire simple est égal au coefficient de détermination : r 2  R 2 r  signe  aˆ1  R   1 1   2 2 1 R 1 r  n2 n2   R2



2

r2



Pr. Amale LAHLOU





  1   F1, n  2  2  1 r  n2  r



S5 : Sciences Economiques



104

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille ANOVA)

Cliquer ici

 yt  y   xt  x   yt  y  xt  x 

xt

Année

yt

1 2 3 4 5 6 7 8 9 10

7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62

8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00

Somme

99 855,75

112 800,00

Moyenne 9 985,58

Estimation de

-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05

-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00

 yt  y 

8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00

6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18

11 280,00

aˆ1 aˆ0

 xt

2

 x

2

10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00 64 156 000,00

ˆt y

et  yt  yˆt

7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81

-33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00

SCT

= 0,780982745 = 1176,089634

yˆt  aˆ1 xt  aˆ0  0, 78 x  1176, 08

1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38 SCR

Source de variation

ddl

Sommes des carrées

Moyenne des carrées

Fisher

x

1

39130928,80

39130928,80

1895,311501

Résidus

8

165169,38

20646,17282

Total

9

39296098,18

F théorique (1,8) (risque α=5 %) : F   1895,311501>F1,8

et2

 F1,8   5,317655063

On rejette (H0 : a1 = 0) La variable Xt est significative

L’analyse de la variance confirme que la variance expliquée est significativement plus 105 élevée que la résiduelle.

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)

Cliquer ici

Extrait du Rapport détaillé par une analyse sur Excel ANALYSE DE VARIANCE Degré de Somme des carrés liberté

Régression

1

39130928,8

Résidus

8

165169,3825

Total

9

39296098,18

SCE

Moyenne des carrés

SCT = SCE + SCR

Pr. Amale LAHLOU

Valeur critique de F

39130928,8 1895,311501

8,5489E-11

20646,17282

MCE=SCE/1 MCR = SCR/8

SCR

F

MCR  ˆ2

ˆ  MCR

S5 : Sciences Economiques

F 

MCE MCR

P-valeur :



P F1,n 2  F 

 106

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)

Cliquer ici

Extrait du rapport détaillé par une analyse sous EVIEWS

ˆ aˆ

0

n

ˆ aˆ

1

t a*ˆ0

ta*ˆ1

aˆ0 aˆ1

  P  value  t  P  value ta*ˆ0

* aˆ1

R2

ˆ 

 

P  value F

*

F

*

Pr. Amale LAHLOU

Ra2

y y

SCR

107

R.B Exercice 4, page 36 Un agronome cherche à estimer la relation liant la production de maϊs yi au taux de bauxite xi se trouvant dans la terre en formalisant la relation :

yi  a0  a1 xi   i

Le modèle est spécifié en coupe instantanée. À partir d’une étude statistique portant sur 85 parcelles de terre, un économètre lui fournit les résultats suivants :

yi  132,80  1,1 xi  ei les ratios empiriques de Student Et on a :

85

e i 1

Pr. Amale LAHLOU

2 i

i  1,...,85

ta*ˆ1  10, 2 et ta*ˆ0  4,3

6234, 32

S5 : Sciences Economiques

108

Question 1: Montrer que tester l’hypothèse H0 : a1 = 0 revient à tester l’hypothèse r = 0 où r est le coefficient de corrélation linéaire simple entre yi et xi ; le calculer. Soit l’hypothèse nulle (H0 : a1 = 0). Soit l’erreur du premier espèce   5% * 0, 025 0, 05 t  10 , 2  t  z  1,96 Comme aˆ1 

(approximation avec une

nous rejetons H0, c’est-à-dire,

loi normale centrée réduite)

a1 est

significativement différent de 0 : le taux de bauxite est un facteur explicatif négatif (puisque aˆ1 est négatif) de la production de maїs. On a déjà montré l’équivalence de ce test avec (H0 : r = 0). Du fait de r

aˆ1

1

1  r 



2

n2

n

 x

 x

t

t 1



n

e t 1

aˆ1

2

2 t

n

 x t 1

ˆ 

t

 x

2



aˆ1  t a*ˆ1 ˆ aˆ1

n2 Pr. Amale LAHLOU

S5 : Sciences Economiques

109

Calculons

r

1

1  r  2

r: rappelons que le signe de rest celui de a ˆ1  ta*ˆ1  r 2

n2

 t   n  2  t  * 2 aˆ1

* 2 aˆ1

10,22   0,556  r  0,746  r  0,746 2 83  10,2

Question 2: Construire le tableau d’analyse de la variance et vérifier les résultats obtenus en question 1 à partir du test de Fisher. Pour construire le tableau d’analyse de la variance, il faut connaître : 85

SCE   ( yˆ i  y )

85

85

i 1

i 1

SCR   ( yi  yˆ i ) 2   ei2

2

i 1

85

SCT   ( yi  y ) 2 i 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

110

85

Or,

SCE  1 SCT

R2 

2 e i

 1

ti 1

85

(y

t

i 1

 y )2

SCR SCT

2 2 et R  r  0,556.

85

la connaissance de SCR   ei2  6234, 32 permet de déterminer i 1

SCT 

SCR 2 SCE  SCT  r  7806, 941  14041, 261 ainsi que 2 1 r

On construit le tableau d’analyse de la variance : Source de variation

Degrés de liberté

Sommes des carrées

Moyenne des carrées

x

1

SCE = 7806,94

SCE/1 = 7806,94

Résidus

85-2 = 83

SCR = 6234,32

SCR/83 = 75,11

Total

85-1 = 84

SCT = 14041,26

Pr. Amale LAHLOU

S5 : Sciences Economiques

Fisher F* = 103,94

111

SCE



F  N.B. :

SCR

1

n2

7806,94 0,05   103,94  F1,83   3,96 75,11

F   103,94  F   10,195  10, 2  ta*ˆ1

Notez bien : sous Excel,

INVERSE .LOI .F (0,05;1;83)  3,95596086 F *  103,94 LOI .F (103,94;1;83)  2,69563 10-16    0,05 

Question 3 : le coefficient a1 est-il significativement inférieur à (-1) ? Soit le test unilatéral à gauche suivant :

Pr. Amale LAHLOU

 H 0 : a1  1   H1 : a1  1

S5 : Sciences Economiques

112

Tout d’abord calculons l’écart type : aˆ1 aˆ1 1,1 * ˆ taˆ   10, 2   aˆ  *   0,10784 ˆ aˆ 10, 2 taˆ aˆ1  a1  1,1  (1) Puis, sous H0, nous avons : * 1

1

1

1

t aˆ1 

ˆ aˆ

1



0,10784

 0,9273

Comme le test est unilatéral, on doit travailler avec la table de Student unilatéral au seuil α. Toutefois, on peut travailler avec la table de Student bilatérale avec un seuil 2 α. Puisque aˆ1  a1  1,1  (1) * 0 , 05 0 , 01 t aˆ1 

ˆ aˆ

1



0,10784

 0,9273  t

z

 1,65

Nous acceptons l’hypothèse H0, c’est-à-dire, a1 n’est pas significativement inférieur à (-1). Notez bien : sous Excel, LOI .STUDENT .INVERSE (0,10;83)  1,66342018 t *aˆ 1  0,9273

LOI .STUDENT (0,9273;83;1)  0,178229748    0,05 Pr. Amale LAHLOU

S5 : Sciences Economiques

113

V. Prévision dans le modèle de régression simple

A. Prévision ponctuelle B. Intervalle de prédiction

Pr. Amale LAHLOU

S5 : Sciences Economiques

114

V. Prévision dans le modèle de régression simple Prévision ponctuelle : Le modèle estimé sur la période t  1,..., n

ˆ0  a ˆ1 xt  et yt  a ˆ n 1  aˆ0  aˆ1 xn 1 Pour xn 1connue la prévision est donnée par : y La prévision est sans biais : ˆ n 1 L’erreur de prévision est : en 1  yn 1  y en 1   a0  a1 xn 1   n 1    aˆ0  aˆ1 xn 1  Or,

 E  en 1 



 a0  aˆ0    a1  aˆ1  xn 1   n 1 E  a0  aˆ0   xn 1 E  a1  aˆ1   E   n 1 

Donc, E  en 1   0 et en général, pour un horizon h, E  en  h   0 Pr. Amale LAHLOU

S5 : Sciences Economiques

115

Covaˆ0 , aˆ1    x Var (aˆ1 )

Prévision par un intervalle : on calcule la variance de l’erreur

Var  en 1  Var  aˆ0 



Var  yn 1  yˆ n 1  Var   a0  aˆ0    a1  aˆ1  xn 1   n 1 



Var  aˆ0   xn21Var  aˆ1   2 xn 1Cov  aˆ0 , aˆ1   Var   n 1 



  2 2   x Var  aˆ1  n  

 2 n

 x 2Var  aˆ1   xn21Var  aˆ1   2 xn 1 xVar  aˆ1    2

2 1      1   xn 1  x  Var  aˆ1  n  2  1 2     2   1   xn 1  x  n n  x x

Pr. Amale LAHLOU



Var   n 1    2

2

 t 1

Var  en 1 

xn+1 est certaine

 1 2    n  

  xn 1  x   1 n 2  x  x    t  t 1  S5 : Sciences Economiques

t



2

2

116

L’intervalle de prédiction de niveau de confiance (1 - α) % :

    2 1   N 0, ˆ    n    

en 1  yn 1  yˆ n 1

Soit,

yn 1  yˆ n 1

ˆ 

1  n

xn 1  x  n 2   x  x  t

xn 1  x 2 n 2   x  x  t t 1

   1    

 Tn  2

2

1

t 1

Donc, les deux bornes de l’intervalle de prédiction est donné par :

yn 1  yˆ n 1  t n 2 2ˆ  

1  n

xn 1  x 2 n 2  xt  x 

1

t 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

117

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille prévision)

Cliquer ici

 yt  y   xt  x   yt  y  xt  x 

xt

Année

yt

1 2 3 4 5 6 7 8 9 10

7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62

8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00

Somme

99 855,75

112 800,00

Moyenne 9 985,58

Estimation de

-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05

-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00

 yt  y 

8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00

6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18

11 280,00

aˆ1 aˆ0

= 0,780982745 = 1176,089634

 xt

2

 x

ˆt y

2

10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00

7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81

64 156 000,00

et  yt  yˆt -33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00

SCT

et2 1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38

SCR

yˆt  aˆ1 xt  aˆ0  0, 78 x  1176, 08

    2  xn 1  x  2 1 Var (et * )  ˆ   n  1  18 352,15 Consommation pour un revenu xt*=10 000 n  xt  x 2    t 1  yˆt*  aˆ0  aˆ1xt*  1176,08  0,78 10000 yˆ t  985,917086  Prédiction ponctuelle : *

l’intervalle de prédiction yn 1  yˆ n 1  t n  2ˆ  

2

1  n

xn 1  x 2 n 2  xt  x 

1

t 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

118

(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)

Cliquer ici

Extrait du Rapport détaillé par une analyse sur Excel et  yt  yˆt

yˆt  aˆ1 xt  aˆ0

et ˆ et

ˆ et  Pr. Amale LAHLOU

SCR  ˆ  n 1

n2  135,4701208 n 1 119

R.B. Exercice 5, CEX2, page 41 Nous reprenons le modèle consommation-revenu spécifié série temporelle :

yt  1176, 08  0, 78 xt  et Les ratios de Student empiriques sont :

t  1,...,10 ta*ˆ1  43,53 et ta*ˆ0  0,21

Question 1 : Calculer le coefficient de détermination et effectuer le test de Fisher permettant de déterminer si la régression est globalement significative. Comme



F 

R2



1  R   n  2  1  r 2

    n  2 r2

2

 t

 aˆ1

2

  43, 53

2

t a2ˆ1

2 43 , 53 Alors, r 2    0,99579 et puisque 2 2 n  2  t aˆ1 8  43,53

F *  1894,86  F10,,805  5,32 la variable explicative revenu est significative Pr. Amale LAHLOU

S5 : Sciences Economiques

120

Question 2 : Quelle est la conséquence sur la consommation de l’augmentation du revenu de 8 % ?

Soit une augmentation du 8 % du revenu, de combien augmente la consommation ? Soit la formule :

yˆt  aˆ0  aˆ1 xt  yˆt  aˆ1xt Ainsi, yˆt  aˆ1xt  0, 78  0, 08  0,0624 Pour une augmentation du revenu de 8%, la consommation augmente de 6,24 % Question 3 : pour les années 11 et 12, on prévoit 16 800 et 17 000 UM de revenu par habitant. Déterminer la prévision de consommation pour ces deux années ainsi que l’intervalle de prédiction au seuil de 95 %.

Soit le modèle estimé : yˆt  1176, 08  0, 78 xt En supposant x11  16800 et x12  17000 Pr. Amale LAHLOU

S5 : Sciences Economiques

121

Alors, les prévisions ponctuelles sont de :

yˆ11  1176, 08  0, 78 16800  14280,08 yˆ12  1176, 08  0, 78 17000  14436,08 Déterminons IC11 l’intervalle de prédiction à l’année 11 (la réalisation à 95% de se trouver dans cet intervalle) : ˆ11  tn/ 22ˆ  y11  y

1  n

 x11  x  n

 x t 1

t

2

 x

1 2

Comme, yˆ11  14280,08 ; tn/22  2,306 ; ˆ   143, 69 ; x11  16800 n

  xt  x   6415600 ; x  11280 ; n  10 Alors,

2

t 1

y11  14280, 08  2, 306  143, 69 y11  14280, 08  415,81792

1  10

16800  11280  64156000

2

1 122

Déterminons IC12 l’intervalle de prédiction à l’année 12 (la réalisation à 95% de se trouver dans cet intervalle) : ˆ12  tn/ 22ˆ  y12  y

1  n

 x12  x  n

2

  xt  x 

1 2

t 1

Comme, yˆ  14436,08 ; t  /2  2,306 ; ˆ  143, 69 ; x  17000 12 n2  12 n

x  x  t 1

Alors:

t

2

 6415600 ; x  11280 ; n  10

1 17000  11280  y12  14436,08  2,306 143,69  1 10 64156000 y12  14436,08  420,42992 2

D’où, IC11  13864,26;14695,90 et IC12  14015,65;14856,51 Pr. Amale LAHLOU

S5 : Sciences Economiques

123

R.B. Exercice 6, page 43 Un économiste spécialisé en économie du travail s’intéresse à la relation liant la rémunération et la durée des études (théorie du capital humain). Pour ce faire, il dispose d’un échantillon de 40 hommes et 25 femmes ayant le même âge, dont il relève la rémunération annuelle (yi), exprimé en milliers de francs, et le nombre d’années d’études (xi). Les estimations économétriques conduisent aux résultats suivants : Pour les hommes (n1 = 40)

yi  18, 60  1,8 xi  ei les ratios de Student empiriques

t  5,2 et Rh2  0, 42 * haˆ1

Pr. Amale LAHLOU

t

* haˆ 0

Pour les femmes (n2 = 25)

yi  14,50  0, 7 xi  ei les ratios de Student empirques

 9,3

t *faˆ1  2,5 et

t *faˆ0  12,8

R 2f  0, 22

S5 : Sciences Economiques

124

Question 1 : L’influence de la durée des études sur la rémunération vous semble-t-elle significative ?

analyse avec les ratios empiriques de Student Pour les hommes

t

* haˆ1

haˆ1   5,2  t380,025  t0,025  z 0,05  1,96 ˆ haˆ1

L’écart type est

ˆ haˆ

1

et

Pour les femmes

t *faˆ1 

faˆ1  2,5  t230,025  2,069 ˆ faˆ1

L’écart type est

haˆ 1,8  1   0,35 5, 2 5, 2

PT38  5,2  7,10 10-6

ˆ faˆ

1

et

faˆ1 0, 7    0,28 2, 5 2, 5

PT28  2,5  0,02

• Les deux coefficients de régression sont significativement différents de 0. • le coefficient de pondération des années d’études pour les femmes est plus faible et moins significatif que celui des hommes. 125

Question 2 : Existe-il une différence significative entre la rémunération des hommes et des femmes ? On se ramène à un test de différence de moyennes de variables aléatoires normales indépendantes et de variances inégales :

 H 0 : ha1  fa1 Ou encore  H 0 : d  ha1  fa1  0    H1 : d  ha1  fa1  0  H1 : ha1  fa1 Soit donc la distribution  haˆ1  faˆ1    ha1  fa1   Tn1  n2  4 ˆ haˆ1  faˆ1 On pose dˆ  haˆ  faˆ donc 1 2 dˆ

ˆ  ˆ dˆ

Sous H0:

ˆ dˆ

1 2 haˆ1  faˆ1

t  * dˆ

2 2 2 2 ˆ ˆ ˆ ˆ ˆ  ˆ ha    2 cov( ha , fa )     ˆ1 faˆ1 1 1 haˆ1 faˆ1

1,8  0,7 0,342  0,282

0 , 025  2,49  t61  t0, 025  z 0, 05  1,96

Nous rejetons l’hypothèse H0 ; c’est-à-dire, il existe une différence significative des coefficients de régression : la durée des études des femmes a moins d’impact sur la rémunération que la durée des études des hommes. Pr. Amale LAHLOU

S5 : Sciences Economiques

126

R.B. Exercice 7, page 44 Soit les résultats d’une estimation économétrique :

yt  32,95  1, 251xt  et

n  20 R 2  0, 23

ˆ  10, 66

Pr. Amale LAHLOU

S5 : Sciences Economiques

127

Question 1 : À partir des informations connues, on demande de retrouver les statistiques suivantes : la Somme des Carrés de Résidus (SCR), la Somme des Carrés Totaux (SCT), la Somme des Carrés Expliqués (SCE), la valeur de la statistique du Fisher empirique (F*) et l’écart type du coefficient aˆ1 ˆ aˆ1  ? SCR 2 ˆ    10, 66  SCR  10, 66   18  2045, 44 n2 SCR SCR 2045, 44 2 R  1  0, 23  SCT    2656, 42 2 SCT 1 R 1  0, 23 SCT  SCE  SCR  SCE  SCT  SCR  2656, 42  2045, 44  610,98 R2

F  *

F

*

SCE 610,98   18  5, 40 2045, 44  n  2  SCR  n  2 

1  R    t   5, 40  t

ˆ aˆ1 

2

* aˆ1

2

* aˆ1

aˆ1 1, 251   0,54 * taˆ1 2,32

 5, 40  2,32

S5 : Sciences Economiques

128

Question 2 : Le coefficient de la variable x est-il significativement supérieur à 1 ?

On pose le test d’hypothèse unilatéral à droite : H0 :   H1 :

a1

 1

a1

 1

Sous H0, nous pouvons écrire :

t

* ˆ1 a



aˆ1  a1

 aˆ

1

Valeur lue sur la table bilatérale de Student

1,25  1 0 ,10   0,46  t18  1,734 0,54

On accepte H0: le coefficient a1 n’est pas significativement supérieur à 1.

Pr. Amale LAHLOU

S5 : Sciences Economiques

129

R.B. Exercice 8, page 45 À partir d’un échantillon de 190 observations, on étudie la relation entre la variable à expliquer yi et la variable explicative xi . À l’aide des informations fournies ci-dessous reconstituez les huit valeurs manquantes signalées par VM1, ...VM8.   3,447 et x  38,416 x

Dependent variable : Y Method: Least Squares Sample: 1 190 Included Observations; 190

n

ˆ aˆ ˆ aˆ 0

1

t

* aˆ 0

t

* aˆ1

 

P  value ta*ˆ0

 

aˆ0

Variable

Coefficient

STD. Error

T-Statistic

Prob.

aˆ1

C

-4364,928

VM1

-16,61141

0,0000

X

VM4

VM3

VM2

0,0000

R2

R-Squard

VM5

Mean dependent var

VM6

y

ˆ 

S.E. of regression

322,8850

S. D. dependent var

VM8

y

Sum squard resid

VM7

F-statistic

778,9623

F*

SCR Pr. Amale LAHLOU

P  value ta*ˆ1

S5 : Sciences Economiques

130

aˆ0 - 4364,928 VM . 1  ˆ aˆ0  *   262,7669 t aˆ0 - 16,61141 * * VM 4 ? VM 2  t  F  778,9623  27,9099  VM 2  t   ou encore . aˆ1 VM 3 ? VM 4 ?  VM . 3  ˆ aˆ  ou encore  1 VM 2 27,9099 ˆ  322,88 322,8850 322,8850 VM 3  ˆ aˆ1      6,8136 190 190  x n  1 3,447 189 2 2  xt  x   xt  x  * aˆ1

t 1

t 1

* ˆ ˆ VM 4  a  t . 1 aˆ1  aˆ1  VM 2 VM 3  27,9099 6,8136  190,1669

* F 778,9623 2   0,8056  .VM 5  R  * F  n  2 778,9623 188

Pr. Amale LAHLOU

S5 : Sciences Economiques

131

 .VM 6  y  aˆ0  aˆ1 x  -4364,928 VM4  x  -4364,928 190,166938,416  2940,5236 190

2  .VM 7   et2  (n  2)ˆ 2  188322,8850  19599888 t 1

190

 .VM 8   y 

  yt  y 

2

t 1

n 1

SCR 2 SCT 1  R   n 1 n 1

19599888 VM 7 1  0,850  1  VM 5   831,4770 n 1 189

Pr. Amale LAHLOU

S5 : Sciences Economiques

132

Exercice On cherche à appréhender une relation entre deux variables quantitatives : Variable à expliquer Y

Variable explicative X

1

22

20

2

18

20

3

17

16

4

27

32

5

32

27

6

28

18

7

40

28

8

18

11

Pr. Amale LAHLOU

S5 : Sciences Economiques

133

Questions 1. Représenter graphiquement le nuage des points et donner le modèle de régression yˆi  aˆ0  aˆ1 xi par le méthode des moindres carrées. Interpréter le résultat. 2. Calculer les différents dispersions selon la loi des écarts. 3. Déterminer le coefficient de détermination et le coefficient de corrélation. 4. Représenter l’analyse de la variance et le test Fisher 5. S’assurer à l’aide d’un test de Student que la propension marginale est significativement différente de zéro. 6. Déterminer l’intervalle de confiance du paramètre a0. 7. Prévision de la variable dépendante pour la valeur x9 = 34 et l’intervalle de prédiction de cette prévision. Pr. Amale LAHLOU

S5 : Sciences Economiques

134

1. Influence de la variable X sur la variable Y

la production

45 40 35

y = 0,8206x + 7,6074

30 25 20

15 10 5 0 0

Pr. Amale LAHLOU

5

10

15

20

S5 : Sciences Economiques

25

30 35 les déchets 135

ˆt yt  y

et

10,56

24,019

-2,02

4,08

2,25

52,56

24,019

-6,02

36,23

45,375

30,25

68,06

20,737

-3,74

13,96

1,75

18,375

110,25

3,06

33,866

-6,87

47,14

5,50

6,75

37,125

30,25

45,56

29,763

2,24

5,00

28

-3,50

2,75

-9,625

12,25

7,56

22,378

5,62

31,61

28

40

6,50

14,75

95,875

42,25

217,56

30,584

9,42

88,66

11

18

-10,50

-7,25

76,125

110,25

52,56

16,634

1,37

1,87

279

340,00

457,50

228,56

SCT

SCR

 xt  x   yt  y   xt  x  yt  y   xt  x   yt  y  2

xt

yt

1

20

22

-1,50

-3,25

4,875

2,25

2

20

18

-1,50

-7,25

10,875

3

16

17

-5,50

-8,25

4

32

27

10,50

5

27

32

6

18

7 8 Somme Moyenne

21,50

25,25

2

et2

Toutes les colonnes du tableau sont nécessaires pour estimer tous les paramètres.

Pr. Amale LAHLOU

S5 : Sciences Economiques

136

Calculons tout d’abord les deux estimations de aˆ0 et aˆ1 : 8

aˆ1 

Cov  X , Y  Var  X 



  x  x  y  y  t 1

t

8

x  x  t 1

et

t

2



279  0,82 340

t

aˆ0  y  aˆ1 x  25,25  0,82×21,25  7,62

Donc, l’équation de la droite qui représente le mieux les relations entre le pourcentage de déchets et la production est : yˆi  7,62 + 0,82 xi Ce résultat peut être interprété comme suit :

À l’origine (x = 0), la variation de y s’élève à 7,62 ; Une unité supplémentaire de x génère un supplément de y de 0,82 Pr. Amale LAHLOU

S5 : Sciences Economiques

137

2. Loi des écarts ou encore la relation fondamentale d’analyse de la variance met l’accent sur la relation entre :

 l’erreur associée à l’hypothèse nulle (mesurée par SCT) : SCT est la dispersion totale des yi (somme des carrés des écart des observations yi 8

par rapport à la moyenne y ) SCT    yi  y   457,50 2

i 1

 l’erreur associée à l’hypothèse alternée «Y dépend de X » (mesurée par SCR) : SCR est la dispersion résiduelle (somme des carrés des écart des observations yiet les valeurs estimées yˆ i par le modèle) 8

8

SCR    yi  yˆi    et2  228,56 i 1

2

i 1

Ainsi, la dispersion expliquée somme des carrés des écart des valeurs estimées yˆ i par le modèle par rapport à la moyenne y s’élève à 228,94 en effet,

8

SCE    yˆi  y   SCT  SCR  228,94 2

i 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

138

3. Coefficient de détermination (indicateur de la qualité de la représentation) : mesure le pouvoir explicatif du modèle en évaluant le pourcentage de l’information restituée par le modèle par rapport à la qualité d’information initiale, R2 

SCE SCR 228,56  1  R2  1   SCT SCT 457,50

R 2  0,5004

Le modèle yˆi  7,62 + 0,82 xi restitue 50,04 % de l’information totale sur la variable Y. Coefficient de détermination multiple (coefficient de corrélation) : indicateur couramment utilisé. Il existe plusieurs formules pour le calcul Cov  X , Y   de R R  R2 ; R  ; R  aˆ1 X ; r  signe  aˆ1  R  XY Y R  R 2  R  0,5004 

Selon l’exemple : R  0, 7074 Ce qui implique l’existence d’une forte relation linéaire positive sur les données observées entre les deux variables traitées. Mais attention : un coefficient très élevé calculé sur un peu de données est moins significatif qu’un coefficient plus faible mais calculé sur un grand nombres de données ! Pr. Amale LAHLOU

S5 : Sciences Economiques

139

• Coefficient de détermination ajusté : Sur un échantillon de petite taille, il est préférable d’introduire le nombre de variable explicatives k dans la

formule de R2, soit donc

Ra2 l’indicateur qui élimine l’explication du

phénomène dû au hasard par les variables explicatives. SCR n  k  2 228,56 6 Ra2  1   Ra2  1   Ra2  0, 4171 SCT n  1 457,50 7 Le pouvoir explicatif du modèle yˆi  7,62 + 0,82 xi est seulement 41,71 %. Sortie EXCEL :

Pr. Amale LAHLOU

S5 : Sciences Economiques

140

4. Validité globale du modèle, Analyse de la variance pour la régression et le test de Fisher : Permet d’introduire la taille de l’échantillon dans l’appréciation de la qualité de l’ajustement : Source de variation

Degrés de liberté

Sommes des carrées 8

1

Régression linéaire

 ( yˆ

t

t 1

 228,94 8

Résidu

 y )2

(y n2  6  t 1

t

 yˆt ) 2

Moyenne des carrées

la valeur Fisher théorique lue sur la table de MCE R2  F    n  2 Fisher-Snédécor MCR 1  R2 228,94 228, 94 à un seuil de F   6,01 38,10 confiance α : F1,n2   F10,,605  5,99

38,10

il y’a 5 chances sur 100 de trouver un F 8 observé supérieur à 5,99 lorsque, dans la 2 ( yt  y ) population totale des observations n 1  7  Total t 1 possibles, aucune relation n’existe entre  457, 50 les deux variables. * Ainsi, on compare la valeur empirique F avec la valeur théorique : Pour α = 5%, F *  6,01  F10,,605  5,99 c’est-à-dire, dans l’ensemble le modèle  228,56

est significatif. Mais attention, les deux valeurs sont proches ! Pr. Amale LAHLOU

S5 : Sciences Economiques

141

Tests de signification global e du modèle

yˆi  7,62 + 0,82 xi

pour   5% on a : F10,,605  5,99

  

F *  6,01  t6 2

2

,8

On rejette l’hypothèse nulle :

F *  F10,,605

 2,4848

2

0,025  0,05  6,01  5,99   0,05 8,81  5,99 p  value  0,049822  5 % p  value 

i  1,

p  value   Mais attention : p  value  

! Pr. Amale LAHLOU

S5 : Sciences Economiques

142

5. Validité de la propension marginale et Test de Student : On définit l’écart-type des erreurs du modèle avec : ˆ  ˆ2 1 n 2 SCR 228,56 2 ˆ ˆ   e      38, 09   t n2  n  2 t 1 6 2

ˆ   6,17

2 On définit l’erreurs standard sur aˆ0 avec : ˆ aˆ  ˆ aˆ 0

0

     1 21,502  x2 2 2 1 2   ˆ aˆ0  38, 09   ˆ aˆ0  ˆ    n  56,55   2  340  n 8 x  x    t   t 1  

ˆ aˆ  7,52 0

On définit l’erreurs standard sur aˆ1 avec : ˆ aˆ  ˆ a2ˆ 1

ˆ  2 aˆ1

ˆ2 n

x  x  t 1

Pr. Amale LAHLOU

2

 ˆ a2ˆ1 

38, 09  0,11  340

1

ˆ aˆ  0,33 1

t

S5 : Sciences Economiques

143

Sous l’hypothèse nulle H 0 : a1  0 on a : ta*ˆ1

aˆ1  a1 0,82 t    2, 4848 ˆ aˆ1 0,33 * aˆ1

est le nombre d’écarts-type qui séparent la valeur observée de 0.

pour   5%

on compare ta*ˆ avec la valeur de Student tabulée : 1



ta*ˆ1  2,4848  t6 2  2,447 On rejette ainsi H0.

On peut calculer la p-value par interpolation linéaire :

 





p  value ta*ˆ1  2 P T  ta*ˆ1 

0, 02  0, 05  2, 4848  2, 447   0, 05  0, 048    0, 05 3,143  2, 447

On peut encore calculer l’intervalle de confiance : il y a 95% de chance pour que le coefficient a1 soit dans cet intervalle : a1  0  IC aˆ1 Pr. Amale LAHLOU

 aˆ



2 2 ˆ ˆ ˆ  0,01;1,62 1   aˆ1 t 6 ; a1   aˆ1 t 6



S5 : Sciences Economiques



144

6. Sous l’hypothèse nulle H 0 : a0  0 on a t a*ˆ0

aˆ0  a0 7,62  1,0133 :t  ˆ   aˆ0 7,52 * aˆ0

est le nombre d’écarts-type qui séparent la valeur observée de 0.

pour   5%

on compare ta*ˆ avec la valeur de Student tabulée : 0

t

* aˆ0



 1,0133  t6 2  2,447

On accepte ainsi H0.

On peut calculer la p-value par interpolation linéaire :

 





p  value ta*ˆ0  2 P T  ta*ˆ0 

0,30  0,50 1.0133  0, 718  0,50  0,358    0, 05 1,134  0, 718

On peut encore calculer l’intervalle de confiance : il y a 95% de chance pour que le coefficient a0 soit dans cet intervalle : a0  0  IC aˆ0 Pr. Amale LAHLOU

 aˆ



0



 ˆ aˆ0 t6 2 ; aˆ 0  ˆ aˆ0 t6 2   10,78;26,02 S5 : Sciences Economiques



145

Sortie EXCEL

Légère différence de calcul due au arrondies

7. Le modèle est globalement significatif (mais on se trouve dans une zone critique). Pour x9 = 34 on aura :

yˆ39  7,62 + 0,82  34   35,5

Pr. Amale LAHLOU

S5 : Sciences Economiques

146

Espérance nulle et normalité

et ˆ et

Le modèle estimé de régression linéaire simple est : yˆi  7, 61  0,82 xi i  1,8 Il suffit de remplacer les xi dans l’équation pour calculer les valeurs prédites. Le résidu est calculé via la formule : Soit ˆ e  t

SCR  ˆ  n 1

et  yt  yˆt

n2  5, 71409138 n 1

variance des et. On suppose la normalité des résidus Pr. Amale LAHLOU

S5 : Sciences Economiques

un estimateur sans biais de la

et ˆ et

N  0,1 147

Exercice On cherche à appréhender une relation entre deux variables quantitatives à savoir le PIB (en tant que variable à expliquer) et le montant des dépenses de la dette (en tant que variable explicative) : Années

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Pr. Amale LAHLOU

PIB (Millions de DH) 426 402,00 397 781,90 419 485,20 505 015,00 527 679,00 577 344,00 616 254,00 688 843,00 732 449,00 764 031,00 808 607,00 828 169,00

Montant des dépenses de la dette (Millions de DH) 20 467,30 18 297,97 15 520,95 17 170,51 17 413,41 18 475,01 19 103,87 18 598,76 17 578,78 17 572,71 18 597,96 19 876,06

S5 : Sciences Economiques

148

Questions 1. Représenter graphiquement le nuage des points et donner le modèle de régression y  a0  a1 x par le méthode des moindres carrées. Interpréter le résultat. 2. Calculer les différents dispersions selon la loi des écarts. 3. Déterminer le coefficient de détermination et le coefficient de corrélation. 4. Représenter l’analyse de la variance et le test Fisher 5. S’assurer à l’aide d’un test de Student que la propension marginale est significativement différente de zéro. 6. Déterminer l’intervalle de confiance du paramètre a0. 7. Prévision de la variable dépendante pour la valeur x = 34 et l’intervalle de prédiction de cette prévision. Pr. Amale LAHLOU

S5 : Sciences Economiques

149

Annexe

L’utilitaire d’analyse sous Excel • L’Utilitaire d’analyse est un complément (macro complémentaire : programme complémentaire qui ajoute des commandes personnalisées ou des fonctions personnalisées à Microsoft Office.) • Cliquez sur le bouton Microsoft Office

, puis sur Options Excel.

• Cliquez sur Compléments, sur Gérer, puis sur Compléments Excel. • Cliquez sur Ok. •

Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d’analyse, puis cliquez sur OK.

•

Si vous recevez un message vous indiquant qu’il n’est pas installé sur votre ordinateur, cliquez sur Oui pour l’installer.

• Une fois l’Utilitaire d’analyse chargé, la commande Analyse des données apparaît dans le groupe Analyse de l’onglet Données. 151

La régression linéaire et l'utilitaire d'analyse d'Excel Années

xt : revenu moyen par habitant

1 2 3 4 5 6 7 8 9 10

yt : consommation

Étude de la régression linéaire en utilisant « l'utilitaire d'analyse d'Excel »

yt 7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62

xt 8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00

Exercice page 12 du manuel « Économétrie », RÉGIS BORBONNAIS

Pr. Amale LAHLOU

S5 : Sciences Economiques

152

Pr. Amale LAHLOU

S5 : Sciences Economiques

153

Pr. Amale LAHLOU

S5 : Sciences Economiques

154

Variable X 1 Graphique des résidus Résidus

400 200 0 -200

0,00

5 000,00

10 000,00

15 000,00

20 000,00

Variable X 1

Répartition des probabilités 15000 Y

10000 5000

0

Y

Variable X 1 Courbe de régression 16 000,00 14 000,00 12 000,00 10 000,00 8 000,00 6 000,00 4 000,00 2 000,00 0,00

0

20

40

60

80

100

Centile

Y Prévisions pour Y

0,00

5 000,0010 000,0015 000,0020 000,00

Variable X 1

Pr. Amale LAHLOU

S5 : Sciences Economiques

155

B4 : Coefficient de détermination multiple R  R 2  0,99789618672873 En régression linéaire simple, R est exactement le coefficient de corrélation linéaire r B6 : Coefficient de détermination R2 . Il exprime la part de la variation expliquée par le modèle dans la variation totale. C 39130928, 8 SCE SCR R 2  16   0,995796799488 R2   1 C18 39296098,18 SCT SCT B8 : Coefficient de détermination R2 ajusté . Il dépend du nombre de variables explicatives Ra2  1 

n  1 SCR 9 165169, 3825  1  0, 995271399 n  2 SCT 8 39296098,18

B8 : Erreur type, c’est l’estimation par n

B11 : taille de l’échantillon

Pr. Amale LAHLOU

ˆ  

e t 1

2

t

n2



SCR  n2

C17  B11  2

S5 : Sciences Economiques

165169, 3825 =143,6877615265 8

156

B16 : degré de liberté est 1 B17 :degré de liberté est n-2 (n étant la taille de l’échantillon B11) B18 : degré de liberté é est n - 1 = 1+ n - 2

n

ˆt  y C16 : somme des carrés expliquée par la régression SCE=   y n

C17 : somme des carrés résiduelle SCR=   yt  yˆ t  n

t=1

2

2

t=1

C18 : somme des carrés totale SCT=   y t  y  =SCE  SCR 2

t=1

D16 : Moyenne de somme des carrés expliquée C SCE 39130928, 8 MCE   16   39130928, 8 1 B16 1 D17 : Moyenne de somme des carrés résiduelle C SCR 165169, 3825 MCR   17   20646,17282 n2 B17 8

La variable aléatoire F suit la loi de Ficher pour degrés de liberté 1et n-2 E16 : Fischer calculé

D MCE 39130928, 8 F*   16   1895, 311501 MCR D17 20646,17282

R2 F   n  2 1  R2



p-value  2  P Tn  2  ta*ˆ1



p-value  8,5489 10-11

à comparer avec α



Pr. Amale LAHLOU

S5 : Sciences Economiques

157

B22 :

D22 :

aˆ0  1176,089634

t  * aˆ0

B23 :

aˆ0 ˆ aˆ0

B  22 C22

taˆ0  5, 673920575

aˆ1  0,780982745

D23 :

Donc

ˆ

ta*ˆ1  ˆaa1ˆ 

yˆt  aˆ0  aˆ1 xt

1

B23  F* C23

taˆ1  43,53517545



E22 : p  2  P Tn  2  ta*ˆ0



 2  P Tn  2  5, 67   0, 00046



E23 : p  2  P Tn  2  ta*ˆ1

G22 ou I22 :

aˆ0  tn/22ˆ aˆ0

G23 ou I23 :



aˆ1  tn/22ˆ aˆ1

 2  P Tn  2  43,53  8,541011

C22 : écart-type empirique, c’est l’estimation de l’écart type de l’estimateur aˆ0 ou erreur type de aˆ0 1  x2   207, 3920575 ˆ a2ˆ0  ˆ 2   n 2  n  xt  x     t 1   C23 : écart-type empirique, c’est l’estimation de aˆ1 ou erreur type de aˆ1 l’écart type de l’estimateur 2 ˆ   ˆ a2ˆ1  n  0, 01793912 2   xt  x  t 1

Utiles pour déterminer les intervalles de confiances

S5 : Sciences Economiques

158

B29 : les prévisions pour Y donnent les valeurs estimées de la variable expliquée

C29 les résidus sont obtenus par la formule ,

yˆ t  aˆ0  aˆ1 xt

et  yt  yˆt

avec

avec

B22  aˆ0  1176,089634 B23  aˆ1  0,780982745

B22 : B40  yˆt

yt observées 10

xt données

e t 1

ˆ e  t

SCR  ˆ  n 1

t

0

n2  135, 4701208 n 1

D31:D40 Résidus normalisés 

et C31 : C40  ˆ et ˆ et

Test de la normalité des résidus : dans une loi normale, 95 % des observations sont situés à moins de

Pr. Amale LAHLOU

S5 : Sciences Economiques

159

Sortie EVIEWS ˆ aˆ

0

ˆ aˆ

1

t a*ˆ0

ta*ˆ1

n

aˆ0

  P  value  t 

aˆ1

P  value ta*ˆ0

* aˆ1

R2

Ra2

 

ˆ 

y y

SCR

F*

P  value F *

Pr. Amale LAHLOU

S5 : Sciences Economiques

160

Variable X 1 Courbe de régression 15 000,00

Le nuage de point de la série doubles

Y

10 000,00 Y

5 000,00

Prévisions pour Y 0,00 0,00

5 000,0010 000,0015 000,0020 000,00 Variable X 1

Variable X 1 Graphique des résidus

Le nuage de point des résidus autour de leur moyenne nulle

300

Résidus

200 100 0 -100

0,00

5 000,00

-200

10 000,00

15 000,00

20 000,00

Variable X 1

Répartition des probabilités 15000 Y

10000 5000 0 0

20

40

60 Centile

80

100

161

Table de la loi de Laplace-Gauss Probabilité de trouver une valeur inférieure à z P( z )  P  Z  z   1  p

z

Exemple :

P(1,96)  P  Z  1,96   0,975  1  0.025 P(1, 65)  P  Z  1, 65   0,95  1  0.05

Pr. Amale LAHLOU

S5 : Sciences Economiques

162

z

Table bilatérale de la loi T de Student Valeurs de T ayant la probabilité P d’être dépassées en valeur absolue P  T  t   1 p

Exemple:

P T  t  p

P  T8  2,306   0, 05

 PT8  2,306  0,025 Pr. Amale LAHLOU

S5 : Sciences Economiques

P T  t  

p 2 164

Loi de Fisher-Snédécor

P( F  t )  p

Exemple : 05 P( F  3,92)  0,05  F(10,,120 )  3,92

Pr. Amale LAHLOU

S5 : Sciences Economiques

166

Chapitre 2 : Le modèle de régression linéaire multiple I. Le modèle linéaire général A. Présentation B. Forme matricielle

II. Estimation et propriétés des paramètres A. Estimation des coefficients de régression B. Hypothèses et propriétés des estimateurs C. Équations d’analyse de la variance et qualité d’ajustement Pr. Amale LAHLOU

S5 : Sciences Economiques

169

III. Les tests statistiques A. Le rôle des hypothèses B. Conséquences de l’hypothèse de normalité des erreurs

IV. L’analyse de la variance A. Construction du tableau d’analyse de la variance B. Autres tests à partir du tableau d’analyse de la variance

V. L’utilisation des variables indicatrices A. Construction et finalités des variables indicatrices B. Exemples d’utilisation Pr. Amale LAHLOU

S5 : Sciences Economiques

170

VI. La prévision à l’aide du modèle linéaire général et la régression récursive A. Prédiction conditionnelle B. Fiabilité de la prévision et intervalle de prévision C. Les tests de de stabilité par la régression récursive

Exercices récapitulatifs

Pr. Amale LAHLOU

S5 : Sciences Economiques

171

I.

Le modèle linéaire général

Présentation : Le modèle linéaire général s’écrit : pour t  1,

,n

yt  a0  a1 x1t  a2 x2t 

à k variables explicatives

 ak xkt   t

n

:

Nombre d’observations (taille de l’échantillon)

yt

:

Variable quantitative à expliquer au temps t. Elle est entachée d’une erreur additive ɛt

x1t x2t x3t

: : :

Variable certaine quantitative ou binaire explicative 1 au temps t Variable certaine quantitative ou binaire explicative 2 au temps t Variable certaine quantitative ou binaire explicative 3 au temps t ….

xkt

:

Variable certaine quantitative ou binaire explicative k au temps t

a0, a1, …,ak : Paramètres du modèle ɛt

:

Erreur de spécification (différence entre le modèle vrai et le modèle spécifié), cette erreur de nature aléatoire est inconnue et restera inconnue. Elle suit une loi de probabilité.

Pr. Amale LAHLOU

S5 : Sciences Economiques

172

Forme matricielle Pour t  1,

 y1 y  2 ,n     yt     yn



a0  a1 x11  a2 x21 

ak xk 1  1



a0  a1 x12  a2 x22 

ak xk 2   2



a0  a1 x1t  a2 x2 t 

ak xkt   t



a0  a1 x1n  a2 x2 n 

ak xkn   n

Soit sous forme matricielle :

Pr. Amale LAHLOU

 y1   1    y  2  1      y  t  1     y      n  1 Y n ,1 

x11

x21

x12

x22

x1t

x2t

x1n

x2 n X  n , k 1

S5 : Sciences Economiques

xk 1   a0   1      xk 2   a1    2         xkt   at    t               xkn   ak    n   a k 1,1    n ,1

173

II.

Estimation et propriétés des paramètres Soit le modèle linéaire général : pour t  1,

,n

yt  a0  a1 x1t  a2 x2t   ak xkt   t Écrit sous forme matricielle : Y  X a   Le modèle estimé s’écrit : pour t  1,

,n

yt  aˆ0  aˆ1 x1t  aˆ2 x2t  ˆt Ou le résidu et  yt  y Écrit sous forme matricielle

aˆk xkt  et

Yˆ  Xaˆ

On applique la méthode des Moindres Carrés Ordinaires pour estimer le vecteur a   a0 a1

at

minimise la somme des carrés des erreurs : Pr. Amale LAHLOU

S5 : Sciences Economiques

ak  . C’est-à-dire, on T

Min

a0 , a1 ,, ak

2  t 1 t n

174

Géométriquement pour le cas de deux variables explicatives, le modèle de régression présente un hyperplan de dimension 2.

y

et  yt  yˆt

yt : observation yt= a0+a1x1t+a2x2t+εt

yˆt  aˆ0  aˆ1 x1t  aˆ2 x2t

aˆ0

(x1t, x2t)

x2

x1

Pr. Amale LAHLOU

S5 : Sciences Economiques

175

n

Min   t2  Min  1

2

t 1

t

n

Min    Min Y  X a  t 1

 1    2     n     Min  T   t      n 

T

2 t

Y  X a   Min S  a0 , a1 ,

, at ,

, ak 

Or la fonction S peut s’écrire simplement comme : S  Y  X a  Y  X a  T

S  Y T Y  Y T Xa  aT X T Y  aT X T Xa



S Y Y  a X Y T

T

T



T

 aT X T Y  aT X T Xa

S  Y T Y  2aT X T Y  aT X T Xa Pr. Amale LAHLOU

S5 : Sciences Economiques

176

S  e  0 et  x e  0 i  1,..., k Condition Nécessaire d’Optimalité : 0 a Ainsi S  Y T Y  2aT X T Y  aT X T Xa   2 X T Y  2 X T Xa  0  a a n

t 1

C’est-à-dire, Comme

n

t

t 1

it t

X T Xaˆ  X T Y

XT X

la matrice carrée d’ordre (k+1) des produits croisés des

variables explicatives est symétrique semi-définie positive (pas de colinéarité parfaite entre deux variables explicatives), alors elle est inversible et on a :



aˆ  X X T



1

X TY

aˆ0 étant l’ordonnée à l’origine (toute les valeurs xt sont nulles)

aˆ p étant la variation de y suite à une variation unitaire de la variable xp tandis que les autres variables sont maintenues constantes (c’est une propension marginale). Pr. Amale LAHLOU

S5 : Sciences Economiques

177

Remarque importante Les équations normales sont données par : X T Xaˆ  X T Y T T Ce qui implique X  Xaˆ  Y   0  X e  0 puisque Y  Xaˆ  e

Ainsi, il existe (k+1) contraintes,  e1  1 1 1   0  1    e2     n x1t x1n  0 et  0  x11 x12      t 1  x21 x22 x2t x2 n      0    n    et            xti et  0 i  1,  t 1   x  xkt xkn     0   k1 xk 2  en  Pr. Amale LAHLOU

S5 : Sciences Economiques

,k

178

T X Soit la matrice symétrique X donnée comme suit :

XTX

XTX

 1   x11   x21   x  k1

1

1

x12

x1t

x22

x2t

xk 2

xkt

n    x1t    x2t    x   kt

Pr. Amale LAHLOU

x x x x

 1 x11 1    1 x12 x1n   x2 n     1 x1t  xkn    1 x1n x

x

x x x

x

x

x2t

1t 2 1t

2t

2 t 1t

kt 1t

x22 x2t x2 n

xk1   xk 2    xkt    xkn 

x x x

  x 1t kt   2 t xkt   2  x  kt  kt

1t 2 t 2 2t

kt

x21

S5 : Sciences Economiques

179

De plus,

 1   x11 X T Y   x21   x  k1

1

1

x12

x1t

x22

x2t

xk 2

xkt

 y1  1      yt     y2   x1n  x y     1t t  x2 n       x2t yt     yt       xkn      xkt yt   yn 

D’où, X T X aˆ  X T Y

n    x1t   x2t    x   kt Pr. Amale LAHLOU

x x x x

x

x2t

x x x

xkt

x

xkt

1t 2 1t

1t

1t

2t

  aˆ0    yt      ˆ a x x y 1t kt   1    1t t    aˆ2     x2t yt  2 t xkt         2   aˆ   x y  x  kt   k    kt t  kt

1t 2 t 2 2t

2t

x x x

S5 : Sciences Economiques

180

Cas particulier :

• Si les variables sont centrées, alors

1 XTX n

est la matrice de

variance covariance • Si les variables sont centrées réduites, alors la matrice 1 X T X est la n

matrice de corrélation. • Si les variables sont centrées, alors le vecteur 1 X T Y est le vecteur n

des covariances entre Y et X. •

1 T Si les variables sont centrées réduites, alors le vecteur n X Y est le

vecteur des corrélation entre Y et X.

Pr. Amale LAHLOU

S5 : Sciences Economiques

181

En effet, si on travaille avec des données centrées, n    x1t   x2 t      xkt

x x x x

x2 t

x2 t

x x x

xkt

x

xkt

1t 2 1t

1t

1t

x x x

  aˆ0  ˆ x 1t kt   a1   aˆ2 2 t xkt    xkt2   aˆk

2t

1t 2 2t

2t

kt

   yt      x1t yt     x2 t yt          xkt yt

ce système est équivalent à :

ˆ0  a ˆ1  x1t  a ˆ2  x2t  na

ˆk  xkt   yt a

et

  x12t    x1t x2 t    x x 1t kt  Pr. Amale LAHLOU

x x

1t 2 2t

x

2t

x2 t

xkt

xkt   aˆ1    x1t yt    ˆ x2 t yt  2 t xkt   a2          2  xkt   aˆk    xkt yt

x x

1t

S5 : Sciences Economiques

      182

       

Ou encore

ˆ0  y  a ˆ1 x1  a ˆ2 x2  a et

 aˆ1    x ˆ    a2     x1t x2t        aˆk    x1t xkt 2 1t

x x

ˆk xk  y a

x x

xkt   x 2 t kt    2  xkt 

x

1t 2 t 2 2t

x

2t

1

1t

xkt

  x1t yt    x2t yt     xkt yt

     

Si on travaille avec des données centrées, l’estimateur de a s’écrira en fonction des matrices des variances et covariances empiriques :  aˆ1   var  x1  ˆ    a2    cov  x2 , x1         aˆk   cov  xk , x1  Pr. Amale LAHLOU

cov  x1 , x2  var  x2 

cov  xk , x2 

cov  x1 , xk    cov  x2 , xk     var  xk  

S5 : Sciences Economiques

1

 cov  x1 , y     cov x , y   2        cov  xk , y   183

Hypothèses et propriétés des estimateurs Soit le modèle linéaire :

Y  X a 

Les présentes hypothèses permettent de déterminer les estimateurs

qualifiés de Best Linear Unbiaised Estimator (BLUE) (théorème de Gauss Markov) à l’aide de la méthode des moindres carrés ordinaires. Hypothèses stochastiques (de nature probabiliste, liées à l’erreur) Hypothèses structurelles Pr. Amale LAHLOU

S5 : Sciences Economiques

184

Hypothèses stochastiques : (H1) (H2)

(H3) (H4)

(H5)

: Les valeurs xit sont observées sans erreur (non aléatoires)

E  t   0

l’espérance mathématique de l’erreur est nulle : en moyenne le modèle est bien spécifié et donc l’erreur moyenne est nulle 2 2 : E  t     cste la variance de l’erreur est constante pour tout t (homoscédasticité des erreurs) :

 

E  t  t    0 si t  t  les erreurs sont non corrélées (nonautocorrélation des erreurs) : une erreur à un instant t donnée n’a pas d’influence sur les autres erreurs. : cov  x ,    0 l’erreur est indépendante des variables it t explicatives :

Pr. Amale LAHLOU

S5 : Sciences Economiques

185

Hypothèses structurelles : (H6) : Absence de colinéarité entre les variables explicatives, Aucune variable explicative n’est linéairement dépendantes des autres, c’est-à-dire la matrice X T X est T inversible ou régulière ou non singulière (det  X X   0) (H7) : X T X n tend vers une matrice finie inversible ou non singulière pour n assez grand (H8) : n  k 1 le nombre d’observations est supérieur au nombres des séries explicatives

Pr. Amale LAHLOU

S5 : Sciences Economiques

186

Propriétés des estimateurs



Soit l’estimateur aˆ  X X T



1

X TY

L’estimateur aˆ est sans biais E  aˆ   a en effet,

aˆ

aˆ



T X X X   Y



T X X X    Xa   



T X X X Xa  X X X     

T

T

T

1

Y  Xa  

1

1

T

T

 a   X X  X T T

1

1

E    0

E  aˆ   a   X X  X T E    T

1

E  aˆ   a Pr. Amale LAHLOU

S5 : Sciences Economiques

187

L’estimateur aˆ est convergent : Tout d’abord, calculons la matrice des variances et covariances de l’erreur  , noté   :



Pr. Amale LAHLOU



E  T







  1  2   E     n

     1  



  12   2 1  E      n 1

2

1 2  22  n 2

S5 : Sciences Economiques

  n     

 1 n    2 n   n2

    188











D’où,

Pr. Amale LAHLOU

 E   12    E    2 1     E   n 1  

E   1 2  E   22  E   n 2 

  2 0  2 0       0 0   2 I n

0   0    2   

E   1 n    E   2 n      2 E  n    Hypothèse (H3)

 

E  t2   2  cste Hypothèse (H4)

E  t  t    0 si t  t 

    I n 2

S5 : Sciences Economiques

189

la matrice des variances covariances des coefficients de régression  aˆ est symétrique :

 Var  aˆ0  Cov  aˆ0 , aˆ1   Cov  aˆ1 , aˆ0  Var  aˆ1    aˆ     Cov  aˆk , aˆ0  Cov  aˆk , aˆ1 

Pr. Amale LAHLOU

S5 : Sciences Economiques

Cov  aˆ0 , aˆk    ˆ ˆ Cov  a1 , ak     Var  aˆk  

190

Ainsi,

 aˆ  ABC 

T

  AT

T

 C T BT AT

A

 E  aˆ  a  aˆ  a     T



 E XTX 

A symétrique AT  A 

     2 I n

Pr. Amale LAHLOU



aˆ  a  X X





1



X  X X X T

T

T



1

1

T

2

T

2

T

 

T

T

1

T

T

X T

1

T

1

T





1

 

 X X  X E   X  X X  X X  X  X X X    X X   X X  X X    X X  1

T

T

T

1



 

 E  T

1

S5 : Sciences Economiques

191

Nous retenons donc,

Nous supposerons que :

aˆ



aˆ    X X 2

T





1



N  0, aˆ   N 0,   X X 2



ˆ ˆ  ˆ 2 X T X On peut estimer  aˆ par  a 

T





1



1

avec

n

ˆ 2

2 e  t

T e e t 1 (voir diapositive suivant)   n  k 1 n  k 1

Où, e  Y  Yˆ

Remarquons que lorsque n est assez grand,

ˆ 2

tend vers 0 et par

ˆest convergent. suite l’estimateur a Pr. Amale LAHLOU

S5 : Sciences Economiques

192

T e e 2 Montrons que ˆ   n  k 1 e  Y  Yˆ   Xa     Xaˆ

 

  Xa     X  a   X



  X X X 



I  X   n 





 Xa     X

T



T

T



1

T



1

a X X

1

X X



X

 

X T XT

X T 1

X T   

Donc, e   1 T X T est une matrice carrée Avec   I n  X X X symétrique d’ordre n et idempotente  2     en effet,



Pr. Amale LAHLOU



S5 : Sciences Economiques

193

    2







In  X X X T

 In

X

   2X  X X  X  X X X  X

 In  2 X X X T

 In

1

T

T

1





In  X X X T

   X X X 

X X X X

1

1

T

T

T

T

T

1

1



1

T

XT



 T

X X X X



1

XT

XT

T

  Ainsi,

eT e          T    T  T

Et par suite

E eT e  E  T     2 tr    Pr. Amale LAHLOU

S5 : Sciences Economiques

194

E eT e   2 tr   

On a

Trace de la matrice

 :

 n  tr  X  X X  X  n  tr  X X  X X   



tr     tr I n  X X X Variance de l’erreur

 

Ainsi,

T

1

T

T



1

T

XT T

1

 n  tr  I k 1 

tr     n  k  1

E e e     n  k  1 T

2

n

Alors,

Pr. Amale LAHLOU

2 e t

T T e e SCR Y Y 2 t 1 ˆ     n  k 1 n  k 1 n  k 1 n  k 1 S5 : Sciences Economiques

195

Équation d’analyse de la variance et qualité d’un ajustement Comme pour la régression linéaire simple, les deux équations : n

e t 1

t

0

et

y  yˆ

nous permettent d’établir l’équation fondamentale d’analyse de la variance en but de juger la qualité de l’ajustement : n

  yt  y 

2



t 1

n

  yˆt  y 

2



t 1

n

2 e  t t 1

SCT  SCE  SCR On introduit des indicateurs de qualité du modèle sans dimension : n

SCE R   SCT 2

  yˆt

 y

 y

 y

t 1 n

t 1

Pr. Amale LAHLOU

t

n

2 e  t

2

 1 2

t 1

n

 y t 1

S5 : Sciences Economiques

t

 y

2

SCR  1 SCT 196

Coefficient de détermination R2 Coefficient de corrélation multiple R et coefficient de détermination R2a

R2 mesure la proportion de la variance de Y expliquée par la régression de Y sur X. n

SCE R   SCT 2

  yˆt  y 

2

 y  y 

2

t 1 n

t 1

t

n

SCR  1  1 SCT

  yt  yˆt  t 1 n

 y  y  t 1

t

n

2 e t

2

2

 1

t 1

n

 y  y  t 1

2

t

Dans le cas des données centrées, ce coefficient s’écrit : T ˆ T ˆ Y Y e e 2 R  T  1 T Y Y Y Y Pr. Amale LAHLOU

S5 : Sciences Economiques

197

Lorsque le nombre de variables explicatives augmentent (même

s’elles ne sont pas pertinentes), le coefficient de détermination R2 augmente automatiquement. On doit tenir compte du degré de liberté (nombres de facteurs explicatifs), d’où le R2 ajusté un indicateur plus robuste :

R  1 2 a

SCR

n  k 1  1  n 1 1  R2 SCT n  k 1 n 1





Bien noté que Ra2  R 2 mais si n est assez grand Ra2

R2

2 R Attention : ne pas interpréter a en termes de part de variance

expliquée. Pr. Amale LAHLOU

S5 : Sciences Economiques

198

(R.B. C3EX1, eco9, page 56) Soit le modèle à trois variables explicatives :

yt  a0  a1 x1t  a2 x2t  a3 x3t   t

Pr. Amale LAHLOU

t

yt

x1

x2

x3

1

12

2

45

121

2

14

1

43

132

3

10

3

43

154

4

16

6

47

145

5

14

7

42

129

6

19

8

41

156

7

21

8

32

132

8

19

5

33

147

9

21

5

41

128

10

16

8

38

163

11

19

4

32

161

12

21

9

31

172

13

25

12

35

174

14

21

7

29

180

S5 : Sciences Economiques

199

Question 1 : Mettre le modèle sous forme matricielle en spécifiant bien les dimensions de chacune des matrices L’écriture sous forme matricielle : Y  X a  

Avec,

 12  1 2     14  1 1  10  1 3 Y   X     25  1 12     21 14,1 1 7 Pr. Amale LAHLOU

45 121   1     43 132   a0   2     3  a1  43 154   a et       a2        13   a3  4,1 35 174     29 180 14,4  14 14,1 S5 : Sciences Economiques

200

Question 2 : Estimer les paramètres du modèle.





1

X Y D’après le cours, aˆ  X X T Nous devons calculer la matrice symétrique X X d’ordre 4 et 1 son inverse X T X puis X T Y :





1 1  1  3 1 2 T  X X  45 43 43  121 132 154 n  x1t  T  X X   x2t    x3t Pr. Amale LAHLOU

x x x x

T

1 2  1  1 1 1  7  1 3 12  35 29    174 180  1 12  1 7

x x x x

x

1t 2 t

x

1t 3t

45 121   43 132  43 154    35 174   29 180 

x x x x

  14 2094  532 85    x 13132 3126 631 85 1t 3t      532 3126 20666 78683  2 t x3t    2 317950 78683 13132 2094  3t   3t

2t

1t 2 1t

T

x

1t 2 t 2 2t

x

2 t 3t

S5 : Sciences Economiques

201

Ainsi,

X

X

T

T

X

X

1





1

1

85 532 2094   14   85 631 3126 13132    532 3126 20666 78683     2094 13132 78683 317950  0, 015066 0, 231450  20,168645  0, 015066 0, 013205 0, 001194    0, 231450 0, 001194 0, 003635   0, 076175 0, 000940 0, 000575

puis 1 1  1  2 1 3 T  X Y  45 43 43  121 132 154 Pr. Amale LAHLOU

0, 076175   0, 000940  0, 000575   0, 000401 

 12    1 1   14    yt   248       12 7   10    x1t yt   1622        9202  x y 35 29    2t t        x y 174 180  25 37592  3t t        21 

S5 : Sciences Economiques

202

aˆ   X T X  X T Y 1

 20,168645 0, 015066  0, 015066 0, 013205 aˆ    0, 231450 0, 001194   0, 076175 0, 000940  32,89132428    0,80190068  aˆ    0, 38136236     0, 03713243  

0, 231450 0, 001194 0, 003635 0, 000575

Soit donc, aˆ0  32,89132428

aˆ2  0, 38136236 Ainsi,

Pr. Amale LAHLOU

0, 076175   248    0, 000940   1622  0, 000575   9202    0, 000401   37592 

aˆ1  0,80190068 aˆ3  0, 03713243

yˆt  32,89  0,80 x1t  0,38 x2t  0, 04 x3t S5 : Sciences Economiques

203

Question 3 : Calculer l’estimation de la variance de l’erreur ainsi que les écarts types de chacun des coefficients. 2 Calculons tout d’abord ˆ  , soit la formule :

2 ˆ 

avec

e  Y  Yˆ

eT e  n  k 1

Soit donc en calculant les résidus et (voir la diapositive suivante) : n

ˆ 2  Pr. Amale LAHLOU

2 e  t t 1

14  3  1

n



2 e  t t 1

10

S5 : Sciences Economiques

 6,745

204

yˆt  32,89  0,80 x1t  0,38 x2t  0, 04 x3t t

yt

x1

x2

x3

ˆt y

et

et2

1

12

2

45

121

12,84

-0,84

0,71

2

14

1

43

132

12,39

1,61

2,58

3

10

3

43

154

13,18

-3,18

10,11

4

16

6

47

145

14,39

1,61

2,58

5

14

7

42

129

17,70

-3,70

13,67

6

19

8

41

156

17,88

1,12

1,26

7

21

8

32

132

22,20

-1,20

1,44

8

19

5

33

147

18,86

0,14

0,02

9

21

5

41

128

16,51

4,49

20,14

10

16

8

38

163

18,76

-2,76

7,63

11

19

4

32

161

17,92

1,08

1,17

12

21

9

31

172

21,90

-0,90

0,81

13

25

12

35

174

22,71

2,29

5,27

14

21

7

29

180

20,76

0,24

0,06

0,00

67,45

somme Pr. Amale LAHLOU

S5 : Sciences Economiques

205

Maintenant, déterminons la matrice des variances et covariances estimées des coefficients de la régression linéaire : soit la formule



ˆ ˆ  ˆ 2 X T X  a 

Donc

 20,168645  0, 015066  ˆ aˆ  6,745   0, 231450   0, 076175

Ainsi,



1

0, 015066

0, 231450

0, 013205

0, 001194

0, 001194

0, 003635

0, 000940

0, 000575

0, 076175   0, 000940  0, 000575   0, 000401 

ˆ aˆ  6,745  20,168645  11,66 0

ˆ aˆ  6,745  0, 013205  0,30 1

ˆ aˆ  6,745  0, 003635  0,16 2

ˆ aˆ  6,745  0, 000401  0,05 3

Pr. Amale LAHLOU

S5 : Sciences Economiques

206

Question 4 : Calculer le R2 et le R2 ajusté. Soit les deux formules : n

R2 

  yˆt  y  t 1 n

 y

t

t 1

 y

n

2 e t

2

 1 2

t 1

n

 y t 1

t

 y

Ra2  1 

et 2

n 1 1  R2   n  k 1

Par un simple calcul, n

 e  67, 45 2 t

t 1

n

  yt  y 

2

 226, 86

t 1

67,45 R  1  0,7027  70,27% 226,86 13 2 Ra  1  1  R 2   0,6135 10 2

D’où, Pr. Amale LAHLOU

S5 : Sciences Economiques

207

III. Les tests statistiques On suppose que    iid et   N  0,   Donc, 2

Ainsi,

t t 2 aˆ0



t

ˆ ˆ  ˆ  2  2  2   n  aˆ  aˆ 2

ˆ  2  aˆ

2 aˆk

2 aˆ1

et



 N  0,1 n

ˆ 2 

2 e  t t 1

Donc, n  k 1 2 2 e 2  2 t n ˆ aˆi  et  ˆ  2 t 1    n  k  1  n  k  1          n  k 1 2 2 2     t 1      aˆi On est en présence d’une somme au carré de (n-k-1) variables aléatoires indépendantes normales centrées réduites (on a k+1 n n contraintes e  0 et x e 0 0

 t 1

ˆi  ai a  ˆ aˆi

t

1



k

it t

t 1

ˆi  ai a

 aˆ

 Tn  k 1

i

ˆ  n  k  1 

2 ˆi a 2 ˆi a

 n  k  1 208

On montre facilement, 2

 aˆ  a 

T

 aˆ0  a0    aˆ  a       ˆ aˆ  0   1 aˆ

 aˆk  ak   ˆ aˆ k 

2

 2    k 1  

la somme au carré de (k+1) variables aléatoires normales centrées réduites, en effet :

aˆ  a T  aˆ1 aˆ  a   aˆ0  a0

 aˆ0  a0   ˆ a 0 

 ˆ a0   aˆ k  ak    ˆ ak    0 

Pr. Amale LAHLOU

 aˆ0  a0    1  aˆ k  ak  aˆ     aˆ  a  k   k 0   ˆ a0       1        aˆ      0 ˆ ak   0 0



S5 : Sciences Economiques

0  aˆ0  a0    ˆ a0              aˆ  a k   k ˆ ak   0 ˆ ak   0



209

Avec, D une matrice diagonale :  aˆ 0  a0 aˆ  a   aˆ  a     ˆ a0 T

Or,

1 aˆ

1 aˆ





1

D  D  D aˆ D

 ˆ aˆ01 0 0  ˆ a2ˆ0 cov  aˆ1 , aˆk     0  cov  aˆ1 , aˆk   0     1  0  cov  aˆ0 , aˆk  ˆ 0  ˆ a k  

1



 aˆ 0  a0  ˆ a0  aˆ k  ak  1  D aˆ D   ˆ ak   aˆ k  ak  ˆ ak 

1

cov  aˆ0 , aˆk   ˆ aˆ01 0 0     0   I k 1   cov  aˆk 1 , aˆk  0   2  1  0  ˆ ˆ aˆk 0  ˆ a k  

1 1 D  D  I k 1 D’où, aˆ Pr. Amale LAHLOU

S5 : Sciences Economiques

210

      

Ainsi,

 aˆ  a 

T

 aˆ0  a0 ˆ aˆ0   aˆk  ak     ˆ aˆk    ˆ ˆ a  a  ˆ k k a k  

 aˆ0  a0   aˆ  a     ˆ aˆ 0  1 aˆ

2

 aˆ  a 

T

 aˆ0  a0    aˆ  a       ˆ aˆ  0   1 aˆ

 aˆk  ak   ˆ aˆ k 

2

 2    k 1  

En remplaçant  aˆ la matrice des variances covariances théoriques 1 2 T ˆ des coefficients par son estimateur   ˆ X X on obtient : aˆ







1 T ˆ 1 ˆ a  a   aˆ aˆ  a   Fk 1,nk 1 k 1 Pr. Amale LAHLOU

S5 : Sciences Economiques

211

En effet,

1 T  aˆ  a  ˆ aˆ 1  aˆ  a  k 1

  

1 1 1 T  2 T  aˆ  a  ˆ  X X   aˆ  a  k 1 1 1 T T ˆ a  a X X  aˆ  a    2 k  1 ˆ 



1  2 T 1 T ˆ a  a X X  aˆ  a    2 2 k  1 ˆ  

 aˆ  a 

T



2 k 1

 n2 k 1



k 1

n  k 1



 2 X T X  



1

ˆ 2  n  k  1 2 

 aˆ  a   aˆ 1  aˆ  a 

 

1

 aˆ  a  k 1

n  k 1

T



Pr. Amale LAHLOU



ˆ 2  n  k  1 2 

S5 : Sciences Economiques

k 1  F

 k 1, n  k 1

n  k 1

212

Construction des tests Test de conformité à un standard bilatéral ou unilatéral Comparaison d’une valeur ai à une valeur fixée a

Soit le test d’hypothèse bilatéral : aˆi  ai On a  Tn  k 1 ˆ aˆi aˆi  ai Sous l’hypothèse nulle,  ˆ aˆi Critère de décision : si t

* aˆi

H0   H1

:

ai  a

:

ai  a

aˆi  a  ta*ˆi ˆ aˆi



 tn2 k 1 ou encore   p  value nous rejetons l’hypothèse H0,

ai est significativement différent de a au seuil de α 

2 Si t  tnk 1 ou encore  p  value nous acceptons l’hypothèse H0,

* aˆi

ai n’est pas significativement différent de a au seuil de α Pr. Amale LAHLOU

S5 : Sciences Economiques

213

Test de signification : comparaison d’une valeur ai à la valeur nulle

L’hypothèse nulle d’un test bilatéral : H 0 : ai  0 pas la constante a0 ). Sous l’hypothèse nulle, aˆi  ai aˆi   ta*ˆi ˆ aˆi ˆ aˆi Critère de décision :

(on ne prend

le ratio de Student.



Si t  tn2 k 1 alors, ai est réellement significativement contributive  * pour expliquer la variable endogène au seuil α Mais si taˆi  tn2 k 1 On doit éliminer cette variable du modèle et ré-estimer les coefficients du modèle (la cause est due soit à l’absence de corrélation avec la variable endogène soit à l’existence d’une forte colinéarité avec une des variables exogènes) * aˆi

Pr. Amale LAHLOU

S5 : Sciences Economiques

214

Intervalle de confiante au niveau (1-α) : On a,

aˆi  ai  Tn  k 1 ˆ aˆi

L’intervalle de confiance est donnée par :





P Tnk 1  tnk 1  1  









P  tn2 k 1  Tnk 1  tn2 k 1  1   Soit encore,

Ainsi,

    aˆi  ai 2 2  P  t n  k 1   t n  k 1   1     ˆ  ˆ a i     2 P aˆi  t n  k 1ˆ aˆi  ai  aˆi  ˆ aˆi t n 2 k 1  1  











IC ai  aˆi  t n  k 1ˆ aˆi ; aˆi  ˆ aˆi t n 2 k 1 Pr. Amale LAHLOU

2

S5 : Sciences Economiques



215

Test de conformité ensembliste : Comparaison d’un ensemble de paramètres à un ensemble de valeurs fixées

On test simultanément l’égalité d’un sous-ensemble de coefficients de régression à des valeurs fixées. Soit le test d’hypothèse bilatéral:

 H0  H   1

:

a q   a q 

:

a q   a q 

Avec q le nombres de coefficients retenus. Comme

Alors,

1 aˆ  a T ˆ aˆ1 aˆ  a   Fk 1,nk 1 k 1 1 T ˆ 1 ˆ aq   aq   aˆq ,q aˆq   aq    Fq,nk 1 q

ˆ ˆ 1 est la matrice des variances covariances au coefficients retenus  a  q  ,q Pr. Amale LAHLOU

S5 : Sciences Economiques

216

Sous l’hypothèse nulle :

1 aˆq   aq  T ˆ aˆ1q ,q aˆq   aq    F*q,nk 1 q

si F*q ,nk 1  Fq ,nk 1 on rejette H0 Intervalle de confiance de la variance de l’erreur un niveau (1-α)%

 (n  k  1)ˆ 2 (n  k  1)ˆ 2    IC 2   ;  2 2  En effet,  nk 1,1 2    n k 1, 2 2   (n  k  1)ˆ 2 ˆ ( n  k  1 )  2     P     1  2 2 Avec,   n k 1;    n  k 1;1 2  2 



P

2  n  k 1



Pr. Amale LAHLOU

2  n  k 1, 2

 2 

et



P

2  n  k 1

S5 : Sciences Economiques



2  n  k 1,1 2

  1 2 

217

(R.B. C3EX1, eco9, page 55) Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21

Soit donc : Pr. Amale LAHLOU

X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7

X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29

X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180

yˆ t  32,89  0,80x1t  0,38x2t  0,03x3t S5 : Sciences Economiques

218

Question 1 : Les variables explicatives sont-elles significativement contributives pour expliquer la variable endogène ? Soit les trois tests d’hypothèses :

 H 0 : a1  0  H 0 : a2  0  H 0 :    H : a  0 H : a  0 1 2  1  1  H1 : Nous calculons les trois ratios de Student empirique :

Les seuils choisis seront de 5 %. Pr. Amale LAHLOU

a3  0 a3  0

t

* aˆ1

aˆ1 0,80    2,75 ˆ aˆ1 0,29

t

* aˆ 2

aˆ 2 0,38    2,53 ˆ aˆ2 0,15

t

* aˆ 3

aˆ3 0,03    0,60 ˆ aˆ3 0,05

S5 : Sciences Economiques

219

t a*ˆ1  2,75  2,228  t100,025  a1  0 t

* aˆ 2

 2,53  2,228  t

0 , 025 10

 a2  0

t a*ˆ3  0,60  2,228  t100,025  a3  0 Donc,

les

deux

variables

explicatives

x1

et

x2

sont

significativement contributives à l’explication de la variable endogène y tandis que la variable explicative x3 n’est pas significativement contributive. On doit retirer cette dernière variable du modèle et ré-estimer les coefficients du modèle.

Pr. Amale LAHLOU

S5 : Sciences Economiques

220

Pour encore mieux voir, déterminons les intervalles de confiances à 95 % de chacun des coefficients :

IC a1 IC a2 IC a3

aˆ  t

 /2 ˆ ˆ ˆ  ; a  t 1 1 n  k 1 aˆ   0,80  2,228 0,29;0,80  2,228 0,29  0,15;1,44 aˆ2  tn/k21ˆ aˆ ; aˆ2  tn/k21ˆ aˆ  0,38  2,228 0,15;0,38  2,228 0,15   0,71;0,04 aˆ3  t n/k21ˆ aˆ ; aˆ3  tn/k21ˆ aˆ 0,03  2,228 0,05;0,03  2,228 0,05   0,14;0,08



 /2 n  k 1 aˆ1



On remarque que :

1

2

2

3

3

0  ICa1



; 0  ICa2

et 0  ICa3

Ce qui confirme le fait que la variable explicative x3 n’est pas contributive . Pr. Amale LAHLOU

S5 : Sciences Economiques

221

Question 2 : Le coefficient a1 est-il significativement inférieur à 1 ? Soit le test d’hypothèse unilatéral à gauche :

H0   H1

:

a1  1

:

a1  1

aˆ1  a1 aˆ1  1 0,80  1    0,68  t100,05  1,812 Sous l’hypothèse nulle : ˆ aˆ1 ˆ aˆ1 0,29

On accepte donc H0 : a1 est bien significativement inférieur à 1

Question 3 : Le coefficient a1 et a2 sont-ils simultanément et significativement différents de 1 et -0,5 ? Soit le test d’hypothèse bilatéral :

Pr. Amale LAHLOU

 H0   H  1 

S5 : Sciences Economiques

: :

 a1   1     a  0, 5   2   a1   1     a  0, 5   2  222

Sous l’hypothèse nulle on a :  1   0,80  q  2 ; aq    ; aˆq     0,5  0,38      0, 013205 0, 001194   11,571983 3,801060  1 ˆ ˆ aˆq  6,745     aˆq    0, 001194 0, 003635  3,801060 42, 034791     Donc, * q ,n  k 1

F

* 2,10 

F

1 T  aˆ q   aq   ˆ aˆ1 q , q aˆ q   aq   q

 11,571983  3,801060 0,80  1  1    0,80  1  0,38  0,5 2   3,801060 42,034791  0,38  0,5 

F*2,10   0,612  F02,,1005  4,10 On accepte l’hypothèse nulle. C’est possible que les coefficients soient simultanément et respectivement égaux à 1 et -0,5. Pr. Amale LAHLOU

S5 : Sciences Economiques

223

Question 4 : Quel est l’intervalle de confiance pour la variance de l’erreur au niveau de confiance 95 % ?



2   (n  k  1)ˆ 2 ˆ (n  k  1)   2   P    2  1 2   n k 1,     n  k  1  , 1  2 2  







P  2n k 1   210 ;0, 025  0,025 et

P  2n k 1   210 ;0,975  0,975

 210 ;0,025  20,483

 210 ;0,975  3,247

IC 2 

  

et

 ( n  k  1)ˆ 2 ( n  k  1)ˆ 2    ;   2 2  n  k 1,1 2     n  k 1, 2 10  6,745 10  6,745  20,483 ; 3,247    3,30;20,75

2  95 % de chance que la variance  appartient à cet intervalle Pr. Amale LAHLOU

S5 : Sciences Economiques

224

Pr. Amale LAHLOU

S5 : Sciences Economiques

225

Tests sur les résidus : valeur anormale, effet de levier et point d’influence La matrice HAT notée H permet de passer du vecteur Y au vecteur Yˆ



Yˆ  X aˆ  X X T X

X YHY H X X X



T

T

Les éléments hi  xi X X la matrice





1



1

T



1

XT

xiT de la diagonale principale de

H sont appelés les leviers, il permettent de

déterminent l’influence de l’observation i sur les estimations obtenues par la régression. On montre que : 0  hi  1  n traceH   h  k  1  i  i 1  Pr. Amale LAHLOU

S5 : Sciences Economiques

226

Tests sur les résidus : valeur anormale, effet de levier et point d’influence Le levier d’une observation i est donc anormalement élevé si :

k 1 hi  n



H X X X T



1

XT

H

H

0  hi  1  n traceH   h  k  1  i 1  T T ˆ Y  X aˆ  X X X X Y  H Y i 1



Pr. Amale LAHLOU



S5 : Sciences Economiques

Y

Yˆ 227

IV. L’analyse de la variance n

n

n

t 1

t 1

2 ˆ ( y  y )  ( y  y )    yt  yˆ t   t  t 2

t 1



SCT Source de variation

Degrés

Sommes des carrés

Moyenne des carrés

k

SCE

SCE MSE  k

n-k-1

SCR

de

liberté

Variables explicatives x1,x2, …,xk Résidus



SCE

MSR 

2

SCR Fisher

F 

  F

MSE SCE k  MSR SCR  n  k  1

SCR n  k 1

n  1 SCT

Total (y)

MSE SCE k R2 k F    MSR SCR  n  k  1 1  R 2  n  k  1 

Pr. Amale LAHLOU



S5 : Sciences Economiques



228

Question : Les trois questions suivantes sont équivalentes, – Signification globale du modèle de la régression ? – l’ensemble des variables explicatives a-t-il une influence globale sur la variable à expliquer ? (ou encore aucune variable exogène n’est pertinente pour expliquer Y) – Existe-t-il au moins une variable explicative significative ?  H 0 : a1  a2  ...  ak  0 Soit le test d’hypothèse :   H1 :  au moins ai  0 SCE / k n  k 1  R2  F   2  SCR / n  k  1 k 1  R   Critère de décision : Si F *  Fk ,nk 1 ou encore   p  value alors on rejette H0. Dans le cas contraire, on accepte H0 et donc il n’existe aucune relation linéaire significative entre la variable à expliquer et les variables explicatives. Pr. Amale LAHLOU

S5 : Sciences Economiques

229

Autres tests à partir de l’analyse de la variance On cite quatre autres tests via exercice page 69 :  Introduction d’une ou plusieurs variables explicatives supplémentaires (question 1)

 Stabilité des coefficients du modèle dans le temps (test CHOW) (question 2)  Test de restrictions et de contraintes sur les coefficients (question 3)  Augmentation de la taille de l’échantillon servant à

estimer le modèle (question 2) Pr. Amale LAHLOU

S5 : Sciences Economiques

230

(R.B. C3EX1, eco9, page 69) Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21 Pr. Amale LAHLOU

X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7

X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29

S5 : Sciences Economiques

X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180 231

On reprend l’exercice page 56 : pour 14 observations on a :

yt  32,89  0,80x1t  0,38x2t  0,03x3t  et ˆ   2,59 ˆ aˆ  0,29

RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 10 Total 13

Constante Variable X 1 Variable X 2 Variable X 3

Somme des carrés 159,4094768 67,44766603 226,8571429

Coefficients Erreur-type Statistique t 32,89132428 11,66331015 2,820067705 0,801900688 0,29843584 2,687012017 -0,381362364 0,156580689 -2,43556448 -0,037132436 0,052023125 -0,71376789

1

0,838264046 0,702686611 0,613492594 2,597068848 14 Moyenne des carrés 53,13649228 6,744766603

Probabilité 0,018158598 0,022816428 0,035114399 0,49169355

F 7,878181026

Limite inférieure pour seuil de confiance = 95% 6,903849912 0,136944201 -0,73024588 -0,153047181

ˆ aˆ  0,15 2

ˆ aˆ  0,05 3

R 2  0,702 Valeur critique de F 0,005452305

Limite supérieure pour seuil de confiance = 95% 58,87879865 1,466857174 -0,032478849 0,078782309 232

Question 1 : L’ajout des variables explicatives x2 et x3 améliore t-il significativement la qualité de l’estimation par rapport à x1 seul ? On testera tout d’abord la signification globale du modèle de régression à 3 variables (test de Fisher) :  H 0 : a1  a2  a3  0   H1 :  au moins ai  0 Soit,

R2 k 0, 702 3 0,05 F    7,852 > F  3,10   3, 71 2 1  R  n  k  1 1  0, 702  10 





F 7,878181026

Valeur critique de F 0,005452305

On rejette H0. La régression est globalement significative Pr. Amale LAHLOU

S5 : Sciences Economiques

233

Le test d’ajout de variables suplémentaires se fait en quatre étapes :

a. Tout d’abord on calcule, sur le modèle complet, les variabilités

suivantes :

14

SCT3    yt  y   226,86 ; 2

t 1 14

SCE3    yˆt  y   159, 41 ; 2

t 1 14

SCR3   et2  67, 45 t 1

Régression Résidus Total Pr. Amale LAHLOU

Degré de liberté 3 10 13

Somme des carrés 159,4094768 67,44766603 226,8571429

S5 : Sciences Economiques

234

b. En suite on calcule, sur le modèle à une seule variable explicative x1, les mêmes variabilités : soit le modèle RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression Résidus Total Coefficients

1 12 13

Somme des carrés 117,6588831 109,1982598 226,8571429

Erreur-type

0,720171833 0,518647469 0,478534759 3,016596589 14 Moyenne des carrés 117,6588831 9,099854982

Statistique t

F 12,92975364

Probabilité

Valeur critique de F 0,003674145

Lim inf à 95%

Lim sup à 95%

Constante

11,57116221 1,889095412 6,125239699 5,13541E-05

7,455176897

15,68714753

Variable X 1

1,011808577 0,281386483 3,595796663 0,003674145

0,398720098

1,624897055

Pr. Amale LAHLOU

S5 : Sciences Economiques

235

le modèle estimé est :

yt  11, 57  1, 01x1t  et

Avec

ˆ 1  3, 0165 et

;

ˆ aˆ

0



1

 1,89 ;

 

SCR1  e e   n  2   ˆ 2 T

SCT1 

1

ˆ   0, 28 aˆ1

1

; R12  0,52

 12   3.01651  109, 20 2

SCR1 109, 20   227, 48 ; 2 1  R1 1  0, 52

SCE1  SCT1  SCR1  227, 48  109, 20  118, 28 ;

Pr. Amale LAHLOU

S5 : Sciences Economiques

236

Soit le test d’hypothèse :

 H 0 : a2  a3  0   H1 : a2  0 ou a3  0 C’est un test d’analyse de la variance : l’ajout de x2 et x3 au modèle implique normalement l’augmentation de SCE1 et la diminution de

SCR1. Ceci est donc équivalent à tester la différence (SCE3- SCE1) estelle significativement

positive

ou

encore

à tester la différence

(SCR1- SCR3) est-elle significativement positive :

 H 0 : SCE3  SCE1  0  H 0 : SCR1  SCR3  0 soit  ou   H1 : SCE3  SCE1  0  H1 : SCR1  SCR3  0

Pr. Amale LAHLOU

S5 : Sciences Economiques

237

c. Tableau d’analyse de la variance pour tester l’ajout d’un bloc de variables explicatives : Source de variation

Variable explicative x1

Degrés de liberté

k’=1

Sommes des carrés

Moyenne des carrés

SCE1 /1

SCE1  118, 28

SCE3

 118.28

Variables explicatives x1,x2, x3

k=3

 159, 41

Résidus

n-k-1 =10

SCR3

 53.14 SCR3 /10

 67, 45

 6.745

Total (y)

n-1 =13

Pr. Amale LAHLOU

SCE3 / 3

Où k est le nombre de variables explicatives du modèle complet Et k’ est le nombre de variables explicatives du modèle sans l’ajout du bloc d’autres variables explicatives

SCT3  226,86 S5 : Sciences Economiques

238

• On calcule

SCE3  SCE1  F* 

SCR3

k  k ' 

n  k 1

159.41  117.65 67.45 10

 2  3.09  F   F  k  k ', n  k 1  2 ,10   4.10

NB. : On compare la différence par rapport à la somme des carrés la plus faible

SCR1  SCR3  F* 

SCR3

k  k ' 

n  k 1

109.20  67.45 67.45 10

 2  3.09  F   F  k  k ', n  k 1  2 ,10   4.10

On accepte donc H0 : l’ajout du bloc de variables explicatives x2 et x3 n’améliore pas de manière significative au seuil α = 5 % le pouvoir

explicatif du modèle Pr. Amale LAHLOU

S5 : Sciences Economiques

239

Question 2 : Peut on considérer le modèle (à trois variables explicatives) comme stable sur l’ensemble de la période, ou doit-on procéder à deux estimations, l’une de la période 1 à 7, et l’autre de la période 8 à 14 ? (test de Chow) • Soit le modèle estimé sur une seule période :

yt  aˆ0  aˆ1 x1t  aˆ2 x2t  aˆ3 x3t  et

t  1,

,14

• Soit les modèles estimés sur deux périodes :

 yt  aˆ01  aˆ11 x1t  aˆ12 x2t  aˆ31 x3t  et t  1, , 7  2 2 2 2 ˆ ˆ ˆ ˆ y  a  a x  a x  a t  8, ,14 0 1 1t 2 2t 3 x3t  et  t Soit le test d’hypothèse : AH0 : les coefficients sont significativement stables sur l’ensemble de la période.

RH0 : scinder en deux échantillon n’améliore pas la qualité du modèle.

 a0  a1  H0 :  a2   a3

 a01  a02  1 2   a1  a1   a12  a22   1 2   a3  a3  240

La question est la suivante :

existe-il une signification entre SCR et (SCR1+SCR2) ? où SCR calculée sur l’ensemble de la période (1,…,14) SCR1 calculée sur la sous période (1,…,7) SCR2 calculée sur la sous période (8,…,14)

Pour répondre à la question on doit suivre les étapes suivantes :

Pr. Amale LAHLOU

S5 : Sciences Economiques

241

a. Estimation du modèle sur la sous période (1,…,7), soit donc : yt  25,27  0,774x1t  0,293x2t  0,012x3t  et

ˆ  1  3,017

ˆ   0,529 ˆ   0,313 ˆ   0,010

RAPPORT DÉTAILLÉ

1

aˆ1

Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations

ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 3 Total 6 Constante Variable X 1 Variable X 2 Variable X 3 Pr. Amale LAHLOU

Coefficients 25,27560344 0,77391607 -0,29317635 -0,01250322

1

aˆ 2

0,832206399 0,69256749 0,385134981 3,017591447 7

1

aˆ 3

SCR1  27,31 SCT1  88,85

R12  0,692

Somme Moyenne des carrés des carrés F 61,53956844 20,51318948 2,252746437 27,31757442 9,105858139 88,85714286 Erreur-type Statistique t 16,66755127 1,516455719 0,529033324 1,462887185 0,313677004 -0,93464406 0,100808684 -0,12402916

SCE1  61,54

Probabilité 0,226670856 0,239683594 0,418918908 0,909135772

S5 : Sciences Economiques

Valeur critique de F 0,261019353

Lim inf à 95% Lim sup à 95% -27,76798351 78,3191904 -0,909704077 2,457536217 -1,291436571 0,705083872 -0,333321438 0,308315007 242

b. Estimation du modèle sur la sous période (8…,14), soit : yt  62,33  1,228x1t  0,620x2t  0,184x3t  et

ˆ  2  2,62

RAPPORT DÉTAILLÉ

ˆ  ˆ  ˆ 

2

Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations

ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 3 Total 6 Constante Variable X 1 Variable X 2 Variable X 3

aˆ1

0,737467155 0,543857804 0,087715608 2,628173531 7

2

 0,522

2

 0,152

aˆ 2

aˆ 3

SCE2  24,70 SCR2  20,72 SCT2  45,43

R12  0,543

Somme Moyenne des carrés des carrés F 24,7066831 8,235561032 1,192298824 20,72188833 6,907296111 45,42857143

Coefficients Erreur-type Statistique t 62,33574076 37,23454453 1,674137325 1,228195674 0,685233191 1,792376215 -0,62083255 0,522362893 -1,18850814 -0,18433866 0,152831028 -1,2061599

Pr. Amale LAHLOU

 0,685

Probabilité 0,192697138 0,170981012 0,320142848 0,314201705

S5 : Sciences Economiques

Valeur critique de F 0,444230201

Lim inf 95% Lim sup 95% -56,16119788 180,8326794 -0,952522164 3,408913512 -2,283224408 1,041559307 -0,670715197 0,302037882 243

c. Calcul du Fisher empirique : on prend au dénominateur la plus faible des sommes des carrés

 SCR   SCR  SCR   1

F  *

Où,

2

ddln

 SCR1  SCR2  ddld

ddln   n  k  1   n1  k  1   n2  k  1   k  1  4 ddld   n1  k  1   n2  k  1  n  2  k  1  6

Ainsi,

67,45  27,31 20,73 F* 

27,31 20,73

4  0,606  F   4,53 4, 6 

6 On accepte H0 : les coefficients sont significativement stable sur l’ensemble de la période. Pr. Amale LAHLOU

S5 : Sciences Economiques

244

Question 3 : Un économiste suggère que dans ce modèle a1=1 et a2=a3, qu’en pensez vous ? On pose l’hypothèse nulle : H 0 : a1  1 et a2  a3 Sous H0,

yt  a0  a1 x1t  a2 x2 t  a3 x3t   t yt  a0  x1t  a2  x2 t  x3t    t yt  x1t  a0  a2  x2 t  x3t    t zt  a0  a2 vt   t Nouvelle variable exogène Nouvelle variable endogène

Pr. Amale LAHLOU

S5 : Sciences Economiques

245

Soit donc,

Pr. Amale LAHLOU

t

zt = yt - x1t

vt = x2t + x3t

1

10

166

2

13

175

3

7

197

4

10

192

5

7

171

6

11

197

7

13

164

8

14

180

9

16

169

10

8

201

11

15

193

12

12

203

13

13

209

14

14

209

S5 : Sciences Economiques

246

z t  13,735  0,011 t  et

t  1,...,14 n  14 ˆ  '  3,010

ˆ '  0,051 R '  0,004 aˆ1

RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 1 Résidus 12 Total 13

Somme des carrés 0,425473883 108,7888118 109,2142857

2

SCE '  0,425 SCR'  108,79 SCT '  109,21

0,062416114 0,003895771 -0,07911291 3,010935788 14 Moyenne des carrés 0,425473883 9,065734319

F 0,046932093

Valeur critique de F 0,832129578

Coefficients Erreur-type Statistique t Probabilité Lim inf à 95% Lim sup à 95% Constante 13,73516878 9,691559481 1,417229994 0,181853025 -7,38092533 34,8512629 Variable X 1 -0,01115475 0,051490217 -0,21663816 0,832129578 -0,123342292 0,1010328 Pr. Amale LAHLOU

S5 : Sciences Economiques

247

Soit le test d’hypothèse :

 H 0 : SCR  SCR   H1 : SCR  SCR

C’est un test d’analyse de la variance : on calcule le Fisher empirique SCR' SCR  ddln * F   SCR ddld

Où,

ddln  n  k '1  n  k  1  k  k '  3  1  2 ddld  n  k  1  14  3  1  10

Ainsi,

108,78  67,45

F* 

2  3.06  F   4,10 2,10 

67,45 10 Donc, on accepte H0 : les contraintes envisagées sur les coefficients sont compatibles avec les données. Pr. Amale LAHLOU

S5 : Sciences Economiques

248

V.

L’utilisation des variables indicatrices (variables auxiliaires, variables muettes, Dummy)

Une variable explicative est une variable indicatrice : les valeurs sont 0 ou 1. Modification structurelle ; Correction des valeurs anormales ; Intégration des facteurs qualitatifs ;

Intégration de la saisonnalité; …

Pr. Amale LAHLOU

S5 : Sciences Economiques

249

Par exemple, soit le modèle à deux variables explicatives x1t et x2t

yt  a0  a1 x1t  a2 x2t  b0 Dt  b1Dt x1t  b2 Dt x2t   t Avec

 Dt  1 le phénomène a lieu   Dt  0 le phénomène n' a pas lieu

Si Dt  0 alors le modèle s’écrit,

yt  a0  a1 x1t  a2 x2t   t

Si Dt  1 alors le modèle s’écrit,

yt  a0  a1 x1t  a2 x2t  b0  b1 x1t  b2 x2t   t  a0  b0   a1  b1 x1t  a2  b2 x2t   t

et si en plus, b1  b2  0 alors,

yt  a0  b0   a1 x1t  a2 x2t   t

Pr. Amale LAHLOU

S5 : Sciences Economiques

250

(R.B. exercice 4, page 76) Correction d’une valeur anormale Un modèle de production de service du secteur du tourisme est spécifié de la manière suivante : QPS t  a0  a1VAt  a2 POPt   t Avec, QPSt : Production du Secteur tourisme pour l’année t ; V At : Valeur Ajoutée du secteur tourisme pour l’année t ; POPt : P0Pulation pour l’année t .

L’économètre chargé de l’estimation de ce modèle sur 18 ans s’interroge sur la perturbation entraînée par l’effet d’une guerre pour l’année 16. Pour répondre à cette question, il intègre à son modèle de base une variable indicatrice Dt tel que :  Dt  0 pour t  1 à 15 et t  17 à 18   Dt  1 pour t  16 Questions : L’effet « guerre » a-t-il une influence significative sur la

production du service du secteur du tourisme ? 251

L’estimation du modèle économétrique est la suivante :

QPS t  2340,4  23,5 VAt  0,3 POPt  120,56 Dt   t

n  18

R 2  0,65

t a*ˆ0  4,5

t a*ˆ1  2,2

t a*ˆ 2  2,9

tb*ˆ  5,8 0

On calcule le ratio de Student empirique de la variable Dt Dummy tb*ˆ  5,8  t180,0531  t140, 05  2,14 0

On rejette H0 : le coefficient de régression de la variable Dummy est significativement différent de 0. la production de service pour l’année 16 est donc anormalement basse (−120,56). Cette baisse est sans doute imputable à l’effet de la guerre. Pr. Amale LAHLOU

S5 : Sciences Economiques

252

(R.B. exercice 5, page 77) Intégration d’une variable qualitative Afin de déterminer les facteurs explicatifs de la réussite de la Licence en Sciences Économiques, on spécifie le modèle suivant :

NLi  a0  a1 NDi  a2 DSi   i Avec, NLi : Note moyenne obtenue en Licence, pour l’étudiant i ; NDt : Note moyenne obtenue en fin de Deuxième année, pour l’étudiant i; DSi : variable indicatrice de genre, pour l’étudiant i.

 DSi  1 pour les hommes   DSi  0 pour les femmes

Question : Le fait d’être homme ou femme a-t-il une influence sur la note obtenue en Licence de Sciences Économiques ? 253

L’estimation du modèle économétrique est la suivante :

NLi  8,5  0,3 NDi  1,2 DSi  et

n  60

R 2  0,72

t a*ˆ0  4,5

t a*ˆ1  7,1

tb*ˆ  2,3 0

On calcule le ratio de Student empirique de la variable Dummy DSi 0 , 05 0 , 05 tb*ˆ  2,3  t60  t  1,96  2 1 57 0

On rejette H0 : le coefficient de régression de la variable Dummy est significativement différent de 0. le facteur sexe est un facteur discriminant de la note obtenue en Licence. Pr. Amale LAHLOU

S5 : Sciences Economiques

254

(R.B. exercice 6, page 79) Analyse de saisonnalité :

Une entreprise cherche à appréhender une relation entre ses ventes et ses dépenses publicitaires. Le directeur du marketing dispose des données de ventes et de dépenses publicitaires sur 5 ans par trimestre. 1. Ce directeur du marketing commence par estimer la relation : Vt  a0  a1 Pubt   t

Commenter les résultats obtenus : La publicité a-t-elle un effet significatif sur les ventes ? 2. Tracer le graphique de la série des ventes, que pouvez-vous en conclure ? 3. Spécifier et estimer le modèle adéquat. 255

Ventes et dépenses publicitaires pendant 5 ans par trimestre

Années 1 2 3

4 5

T1

T2

T3

T4

Vente

164

198

85

179

Pub

34

36

32

29

Vente

168

201

98

197

Pub

45

67

76

75

Vente

197

209

100

216

Pub

75

78

72

75

Vente

223

245

119

260

Pub

78

81

84

83

Vente

298

309

124

267

Pub

89

82

81

83

Pr. Amale LAHLOU

Date T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4

VENTES PUB 164 34 198 36 85 32 179 29 168 45 201 67 98 76 197 75 197 75 209 78 100 72 216 75 223 78 245 81 119 84 260 83 298 89 309 82 124 81 267 83 256

RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations

Vt  104,889  1,29 Pubt  et 0,400542526 0,160434315 0,113791777 61,1586794 20

n  20 R 2  0,16 ˆ aˆ1  1,85

ANALYSE DE VARIANCE Degré Somme Moyenne Valeur de liberté des carrés des carrés F critique de F Régression 1 12865,63682 12865,63682 3,439656622 0,080105841 Résidus 18 67326,91318 3740,384066 Total 19 80192,55

Constante Variable X 1

Coefficients Erreur-type Statistique t Probabilité Lim inf à 95% Lim sup à 95% 104,8959227 49,35643393 2,125273533 0,047665411 1,201903004 208,5899424 1,298215163 0,699985643 1,854631128 0,080105841 -0,1724001 2,768830426

On calcule le ratio de Student empirique de la variable dépenses publicitaires : 0, 05 0, 05 ta*ˆ0  1,85  t20  t  2,10 11 18

On accepte H0 : le coefficient de régression de la variable Pub n’est pas significativement différent de zéro. la publicité n’a pas, a priori, d’impact sur les ventes. 257

On remarque que :  la série des ventes est fortement saisonnière avec un creux très affirmé au troisième trimestre  la variable publicité ne semble pas affectée de variations saisonnières. Ainsi, le mouvement saisonnier vient occulter l’estimation économétrique. Il convient donc d’intégrer ce mouvement saisonnier à l’aide de variables Dummy. 350 300 250 200 Ventes 150

Publicité

100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Pr. Amale LAHLOU

258

En tenant compte du mouvement saisonnier, le modèle s’écrit :

Vt  a0  a1 Pubt  a2 D1t  a3 D2t  a4 D3t   t Avec

.

Pr. Amale LAHLOU

 D1t  1   D1t  0  D2t  1   D2t  0  D3t  1   D3t  0

premier trimestre de l' année t les autres deuxième trimestrede l' année t les autres troisièmetrimestrede l' année t les autres

S5 : Sciences Economiques

259

Avec l’introduction de D4t les vecteurs de la matrice X sont colinéaire :

1 Pubt

1  1  D1t  D2t  D3t  D4t 1 1 La matrice sera non inversible  1 1 On supprime alors D4t  1  1 1  1 1 X   1 1  1  1 1  1 1  1 1  1  Pr. Amale LAHLOU

D1t

D2t

D3t

34

1

0

0

36

0

1

0

32

0

0

1

29

0

0

0

45

1

0

0

67

0

1

0

76

0

0

1

75

0

0

0

75

1

0

0

78

0

1

0

72

0

0

1

75

0

0

0

78

1

0

0

81

0

1

0

84

0

0

1

83

0

0

0

89

1

0

0

82

0

1

0

81

0

0

1

83

0

0

0

S5 : Sciences Economiques

D4t 0  0 0  1 0  0  0 1  0 0  0 1  0  0 0  1 0  0 0  1  260

Introduction des variables indicatrice pour une désaisonnalisation trimestrielle Date T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 Pr. Amale LAHLOU

VENTES 164 198 85 179 168 201 98 197 197 209 100 216 223 245 119 260 298 309 124 267

PUB 34 36 32 29 45 67 76 75 75 78 72 75 78 81 84 83 89 82 81 83

D1t 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0

S5 : Sciences Economiques

D2t 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0

D3t 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 261

Vt  129,101 1,372 Pubt  7,212 D1t  8,874 D2t  118,6 D3t  et n  20 R 2  0,83 RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple 0,912099225 Coefficient de détermination R^2 0,831924996 Coefficient de détermination R^2 0,787104995 Erreur-type 29,97594943 Observations 20 ANALYSE DE VARIANCE Degré de liberté Régression 4 Résidus 15 Total 19

Constante Variable X 1 Variable X 2 Variable X 3 Variable X 4

Coefficients 129,1013935 1,372443573 -7,21227085 8,874488715 -118,6

Pr. Amale LAHLOU

Somme des carrés 66714,18684 13478,36316 80192,55

Erreur-type 27,31974281 0,344993551 19,0306398 18,9585806 18,95845504

Moyenne des carrés 16678,54671 898,5575441

Statistique t 4,725571333 3,978171681 -0,37898205 0,468098794 -6,25578401

t a*ˆ1  3,97

t a*ˆ 2   0,37

t a*ˆ3  0,46

t a*ˆ 4   6,25

F 18,56146757

Valeur critique de F 1,12455E-05

Probabilité Lim inf à 95% Lim sup à 95% 0,000270728 70,87074032 187,3320466 0,001211965 0,63710723 2,107779916 0,710011936 -47,77511921 33,35057751 0,646443204 -31,53476911 49,28374654 1,5395E-05 -159,0089902 -78,1910098

S5 : Sciences Economiques

262

On recalcule

publicitaires :

le ratio de Student empirique de la variable dépenses 0, 05 0, 05 ta*ˆ1  3,97  t20  t  2,13  41 15

On rejette H0 : le coefficient de régression de la variable Pub est significativement différent de zéro. la publicité a un impact sur les ventes. C’est bien une variable explicative des ventes. On remarque que D3t est la seule variable indicatrice explicative. Ainsi, la saisonnalité des ventes est liée essentiellement au creux du troisième trimestre.

t a*ˆ 2  0,37  t150,05  2,13 t a*ˆ3  0,46  t150,05  2,13 t a*ˆ 4  6,25  t150, 05  2,13

Pr. Amale LAHLOU

S5 : Sciences Economiques

263

VI.

La prévision à l’aide du modèle linéaire général et la régression récursive Soit le modèle général estimé : yt  aˆ0  aˆ1 x1t   aˆk xkt  et

La prévision pour un horizon h est donnée par : yˆ h  aˆ0  aˆ1 x1h   aˆk xkh la notation matricielle yˆ h  X h aˆ avec X h  1 x1h

xkh 

T

L’erreur de prévision calculée à l’horizon h est égale à :

eh  yh  yˆ h  X h a   h  X h aˆ  X h  a  aˆ    h

E eh   E  X h  a  aˆ    h   X h E a  aˆ   E  h   0

 e2  Var  X h  a  aˆ    h   X hVar  a  aˆ   2C ov  X h  a  aˆ    h   Var  h  h

Pr. Amale LAHLOU

yˆi*  yˆ  xi*   aˆ0  aˆ1 x1i*  S5 : Sciences Economiques

 aˆk xki*  X i*aˆ 264

(R.B. exercice 7, C3EX1, page 83) On a montré que :

yt  32,89  0,80x1t  0,38x2t  0,03x3t  et Puis on a montré que la variable x3 n’est pas explicative de la variable y. 1. Estimer le modèle à deux variables explicatives :

yt  a0  a1 x1t  a2 x2t   t 2. Calculer une prévision et son intervalle à 95 % pour les périodes 15 et 16, sachant

x115  3;

x116  6;

x215  24;

x216  38

Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21

X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7

X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29

X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180

265

1. n  14 R 2  0,687 ˆ   2,538

yt  25,842  0,715 x1t  0,328 x2t  et ˆ aˆ  0,266 1

ˆ aˆ  0,134 2

0 , 025 t a*ˆ1  2,685  t140,025  t  2,20 2 1 11

t a*ˆ 2   2,438  t110, 025  2,20

RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 2 Résidus 11 Total 13

Somme des carrés 155,973257 70,88388582 226,8571429

Coefficients Erreur-type Constante 25,8421378 6,064674439 Variable X 1 0,714895936 0,26626382 Variable X 2 -0,32811294 0,134561217 Pr. Amale LAHLOU

Les deux variables sont bien explicatives de la variable y

0,829180044 0,687539546 0,630728555 2,538501452 14 Moyenne des carrés 77,98662852 6,44398962

Statistique t 4,261092341 2,684915789 -2,43839158

F 12,10222752

Valeur critique de F 0,001664841

Probabilité Lim inf à 95% Limsup à 95% 0,001340548 12,49387937 39,19039623 0,021221023 0,128853218 1,300938653 0,032916444 -0,624280181 -0,031945698

S5 : Sciences Economiques

266

2. La prévision ponctuelle pour les périodes 15 et 16 : yˆ15

 25,84  0,71 x1t  0,33 x2t

 25,84  0,71 3  0,33 24  20,05

yˆ16

 25,84  0,71 x1t  0,33 x2t

 25,84  0,71 6   0,33 38  17,56

Les variances de l’erreur de prévision sont données par :





ˆ 215  ˆ 2 X 15T X T X  X 15  1 1





ˆ 216  ˆ 2 X 16T X T X  X 16  1 1

    nx1 nx2   14  n 85 532  14 14     T 2 X X   nx1 x1t x1t x2t    85 631 3126    t 1 t 1    532 3126 20666 14 14   2   nx x2 t    2  x1t x2t t 1 t 1   X15T  1 3 24 et X16T  1 6 38

Avec,

Pr. Amale LAHLOU

S5 : Sciences Economiques

267

Et

Ainsi, ˆ

 5,7077  0,1634  0,1222   1 T X X     0,1634 0,0110 0,0025    0,1222 0,0025 0,0028    2  15



 ˆ  X

X X 

1



X 15  1   5,7077  0,1634  0,1222 1       2  2,538 1 3 24  0,1634 0,0110 0,0025  3   1   0,1222 0,0025 0,0028  24         12,4545 2



T 15

T



ˆ 216  ˆ 2 X 16T X T X  X 16  1   5,7077  0,1634  0,1222 1       2  2,538 1 6 38  0,1634 0,0110 0,0025  6   1   0,1222 0,0025 0,0028  38        6,6920 Pr. Amale LAHLOU

1

S5 : Sciences Economiques

268

Ainsi les écarts type de l’erreur de prévision sont donnés par : ˆ 215  12,4545  ˆ  15  3,5290 ˆ 216  6,6920  ˆ  16  2,5869

Les intervalles de prévision sont donnés par : 



y h  yˆ h  t n k 1ˆ  h  yˆ h  t nk 1ˆ  Ainsi,

IP15

2

  

IP16

  

Pr. Amale LAHLOU



2



X

T h

X

T

X



yˆ15  t142 21ˆ  15 ; yˆ15  t142 21ˆ  15



1

X h 1



20,05  2,201(3,5290) ; 20,05  2,201(3,5290) 12,28 ; 27,82

yˆ

16





 t142 21ˆ  16 ; yˆ16  t142 21ˆ  16



17,56  2,201(2,5689) ; 17,56  2,201(2,5689) 11,90 ; 23,21 S5 : Sciences Economiques

269

Les tests de stabilité par la régression récursive Le test de Ramsey, aussi appelé le test de RESET (Regression Error Specification Test), porte sur la pertinence de la forme fonctionnelle du modèle, telle que : – une relation fonctionnelle non adaptée (passage aux logarithmes, fonctions inverses…) entre la variable à expliquer et les variables explicatives ; – l’absence d’une variable explicative dans le modèle ; – la corrélation entre la variable explicative et le terme d’erreur ; –… Plutôt que d’estimer des spécifications alternatives (par exemple linéaire ou non linéaire), le test porte sur la significativité d’un ou des coefficients d’une équation intermédiaire dans laquelle figure la série à expliquer ajustée et élevée à la puissance 2, 3, 4… Le test RESET est mené en trois étapes :

Pr. Amale LAHLOU

S5 : Sciences Economiques

270

Pr. Amale LAHLOU

S5 : Sciences Economiques

271