32 0 6MB
Filière de Sciences Économiques et de Gestion Licence d’Études Fondamentales Département de Sciences Économiques
Économétrie I À l’usage des étudiants inscrits en S5 Parcours : Économie Option : Sciences-Économiques
Enseignante : Amale LAHLOU
Année Universitaire : 2015 - 2016
1
Support de cours : le manuel Économétrie Cours et exercices corrigés 9ème édition RÉGIS BORBONNAIS Maître de conférence à l’université de Paris-Dauphine
Logiciels informatiques recommandés : SPSS, EVIEWS, EXCEL On utilisera EXCEL et EVIEWS pour la résolution des exercices
Introduction L’économétrie prend la part du lion dans toute analyse économique. Elle a trait au traitement mathématique des données statistiques relevant des phénomènes économiques. Économie
&
Métrique &
Informatique
Économétrique
économétrie
L’économétrie est un outil à la disposition de l’économiste lui permettant d’infirmer ou de confirmer les théories qu’il construit. Un modèle est une présentation formalisée d’un phénomène économique réel sous forme d’équations dont les variables sont des grandeurs économiques. On distingue entre : Un modèle économique Un modèle économétrique Pr. Amale LAHLOU
S5 : Sciences Economiques
3
Méthodologie économétrique Théorie économique
Spécification ou confection du modèle
Estimation des paramètres(MCO=OLS) Vérification ou validation du modèle. Modèle conforme à la réalité ?
non
Prévision ou prédiction
Utilisation pour des fins de politique économique Pr. Amale LAHLOU
4
Si on s’intéresse à
établir une relation entre deux
variables sous forme d’un modèle, on parlera de régression simple en exprimant une variable en fonction de l’autre. Si la relation porte entre une variable et
plusieurs autres variables, on parlera de régression multiple. La mise en œuvre d’une régression impose l’existence d’une relation de cause à effet entre les variables prises en compte dans le modèle. Pr. Amale LAHLOU
S5 : Sciences Economiques
5
Chapitre 1 (manuel de Régis Bourbonnais) : Le modèle de régression linéaire simple I. Présentation du modèle A. Exemple introductif B. Rôle du terme aléatoire C. Conséquence du terme aléatoire
II. Estimation des paramètres A. Modèle et hypothèse B. Formulation des estimateurs (Méthode du Moindre Carrés Ordinaires) C. Les différentes écritures du modèle : erreur et résidu D. Propriétés et caractéristiques des estimateurs Pr. Amale LAHLOU
S5 : Sciences Economiques
6
III. Conséquences des hypothèses A. B. C.
Hypothèse de normalité des erreurs Conséquences de l’hypothèse de normalité des erreurs Test bilatéral, test unilatéral et probabilité critique d’un test
IV. Equation et tableau d’analyse de variance A. B.
Équation d’analyse de la variance Tableau d’analyse de la variance
V. La prévision à l’aide du modèle de régression linéaire simple A. B.
Prévision Ponctuelle Intervalle de prédiction
III. Applications Pr. Amale LAHLOU
S5 : Sciences Economiques
7
Introduction Variable Y à expliquer
Variable X explicative Quantitatif
Qualitatif
Quantitatif
Régression linéaire Corrélation simple
Analyse de la variance à un facteur
Qualitatif
Régression logistique
Test du Khi deux D’indépendance
La régression linéaire simple (le nom est du à Galton) est un outil fréquemment utilisé pour étudier la linéarité entre deux variables quantitatives ayant un rôle asymétrique : une variable Y à expliquer (à prédire ou encore variable dépendante, variable endogène ou variable réponse)
et une variable X explicative (prédictive ou encore variable indépendante, variable exogène). Pr. Amale LAHLOU
S5 : Sciences Economiques
8
Les objectifs de la régression linéaire simple Description d’une éventuelle relation de cause à effet entre deux variables (études non-expérimentales) ;
Explications et confrontations des hypothèses en se basant sur des études expérimentales contrôlées ;
Prédiction d’une variable à partir de l’autre. Pr. Amale LAHLOU
S5 : Sciences Economiques
9
Exemple Introductif Soit la fonction de consommation Keynésienne : Avec,
C a0 a1 R
C : Consommation par habitant R : revenu a1 : propension marginale à consommer a0 : consommation autonome ou incompressible On a : La consommation C est une variable « à expliquer » et le revenu R est une variable « explicative ». a1 et a0 sont les paramètres du
modèle ou coefficients de la régression linéaire simple. Pr. Amale LAHLOU
S5 : Sciences Economiques
10
Spécification Modèle en série temporelle : par exemple, la consommation et le revenu annuel pour le Maroc de 2000 à 2013 Ct a0 a1 Rt
t 2000,..., 2013
Ct : Consommation au temps t (cas du Maroc) Rt : revenu au temps t (cas du Maroc)
Modèle en coupe instantanée : par exemple, la consommation et le revenu pour 15 pays en 2013 (date fixe)
Ci a0 a1 Ri
i 1,...,15
Ci : Consommation relative au payé i en 2013 Ri : revenu relatif au payé i en 2013
Modèle en panel : par exemple, la consommation et le revenu pour 15 pays de 2000 à 2013
Ci ,t a0 a1Ri ,t
Pr. Amale LAHLOU
i 1,...,15 ; t 2000,..., 2013
S5 : Sciences Economiques
11
Rôle du terme aléatoire Le revenu est-il l’unique variable explicative de la consommation? Sûrement NON ! d’où, l’ajout du terme ɛ qui résumera toutes les fluctuations non observables attribuables à un ensemble de facteurs ou de variables non prises en compte dans le modèle :
Ct a0 a1 Rt t
ou
Ci a0 a1Ri i
La variable aléatoire ɛt (ou ɛi) regroupe trois types d’erreur : – Erreur de spécification – Erreur de mesure – Erreur de fluctuation d’échantillonnage Pr. Amale LAHLOU
S5 : Sciences Economiques
12
Exemple Introductif (C2EX1, eco9) Revenu 1
8000
2
9000
3
9500
4
9500
5
9800
6
11000
7
12000
8
13000
9
15000 16000
10
Sachant que la propension marginale à consommer est de 0,8 et la consommation incompressible est 1000 UM, 1. Calculons la consommation théorique estimée durant les dix ans: ˆ 1000 0,8 Y C t t 2. On suppose dans cet exemple que :
t N 0, 20000 Générer cette variable aléatoire et puis calculer la consommation observée tenant compte de cette erreur : Ct 1000 0,8 Rt t Cˆt t
Évolution du Revenu moyen par habitant pour 10 ans Pr. Amale LAHLOU
S5 : Sciences Economiques
13
Cliquer ici
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille exemple introductif)
Cˆt 1000 0,8 Rt Année
Utilitaire d’analyse sous Excel
Cˆ t t
C’est un exemple Revenu Disponible
Consommation Théorique
Aléa ɛt
Consommation observée
1
8000
7400
-10,01
7389,99
2
9000
8200
-30,35
8169,65
3
9500
8600
231,71
8831,71
4
9500
8600
52,84
8652,84
5
9800
8840
-51,92
8788,08
6
11000
9800 -183,79
9616,21
7
12000
10600
-6,55
10593,45
8
13000
11400 -213,89
11186,11
9
15000
13000 -241,91
12758,09
13800
69,62
13869,62
Moyenne
-38,43
10
16000
Ecart type 137,2486
Pr. Amale LAHLOU
S5 : Sciences Economiques
14
Conséquence du terme aléatoire En général, les coefficients a0 et a1 sont inconnues et on les estime par échantillonnage. On pose :
aˆ0 estimateur de a0 aˆ1 estimateur de a1
aˆ0 et aˆ1 sont des variables aléatoires qui suivent les mêmes loi de probabilité que celle de ɛt (les erreurs sont supposées
indépendantes et identiquement distribuées par une loi normale) N.B. : L’estimation de aˆ1 est la valeur de l’estimateur aˆ1 de a1 pour un échantillon. Pr. Amale LAHLOU
S5 : Sciences Economiques
15
Modèle et hypothèses Le modèle théorique de régression simple s’écrit : pour
t 1,
,n
yt a0 a1 xt t n
: Nombre d’observations (taille de l’échantillon)
yt
: Variable à expliquer au temps t, variable dépendante ou variable endogène. Elle est entachée d’une erreur additive ɛt
xt
: Variable certaine explicative au temps t, variable indépendante ou variable exogène
a1 : Paramètre du modèle, c’est le coefficient de régression. Il représente la pente de la droite (variation de Y due à une variation unitaire de X) a0 : Paramètre du modèle, c’est l’ordonnée à l’origine.
ɛt
: Erreur de spécification de nature aléatoire et inconnue (différence entre le modèle vrai et le modèle spécifié), appelée encore bruit blanc ou facteur de perturbation cette erreur et restera inconnue.
Pr. Amale LAHLOU
S5 : Sciences Economiques
16
Les hypothèses suivantes permettent de déterminer les estimateurs des coefficients du modèle ayant de bonnes propriétés et de construire des tests statistiques (tests et intervalles de confiance).
xt
ou f xt
(H1)
: Le modèle est linéaire en
(H2)
: Les valeurs
(H3)
: E t 0 l’espérance mathématique de l’erreur est nulle : en moyenne le modèle est bien spécifié et donc l’erreur moyenne est nulle
(H4)
(H5)
xt sont observées sans erreur ( xt non aléatoire)
: E ( t ) cste la variance de l’erreur est constante : le risque de l’amplitude de l’erreur est le même quelle que soit la période 2
2
: E t t 0 si t t les erreurs sont non corrélées (ou encore indépendantes) : une erreur à l’instant t n’a pas d’influence sur les erreurs suivantes.
(H6)
: Cov xt , t 0 l’erreur est indépendante de la variable explicative
(H7)
: t N 0, 2 hypothèse supplémentaire pour les inférences.
Pr. Amale LAHLOU
S5 : Sciences Economiques
17
(H1) :
Le modèle est linéaire en xt ou f xt On suppose l’existence d’une relation linéaire entre X et Y
Y
Y
Linéarité X Pr. Amale LAHLOU
S5 : Sciences Economiques
Non-linéarité X 18
Linéarisation de certaines fonctions avec des transformations β0
0< β t 80,025 2, 306 ˆ ˆ aˆ1 aˆ1 0,01793912 Sur la table de Student donnée en annexe on lit :
P( T8 2,306) 0,05 Ou encore, on calcule la p-value :
P( T8 43,53) 8,557 10-11 0,05 On rejette H0 : la propension marginale à consommer est significativement différente de 0. La variable revenu est bien explicative de la variable consommation. Notez bien : sous Excel, LOI .STUDENT .INVERSE (0,05;8) 2,306 t *aˆ 1 43,53
LOI .STUDENT (43,53;8;2) 8,55710-11 0,05 Pr. Amale LAHLOU
S5 : Sciences Economiques
72
Q2. Quel est l’intervalle de confiance au niveau de confiance de 95 % pour la propension marginale à consommer ?
aˆ1 a1 Tn 2 Comme ˆ aˆ1
P Tn 2
Ainsi, l’intervalle de confiance nous est donné par :
aˆ1 a1 2 2 tn 2 1 P tn 2 tn 2 0,95 ˆ ˆ a 1
I a1 aˆ1 tn/22ˆ aˆ1 , aˆ1 tn/22ˆ aˆ1 0, 74;0,82 On a un risque de 5 % pour que la variable a1 se trouve à l’extérieur de l’intervalle de confiance 0, 74;. 0,82 comme 0 0, 74;0,82 . , on rejette H0
Pr. Amale LAHLOU
S5 : Sciences Economiques
73
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille test de signification)
Cliquer ici Année
yt
1 2 3 4 5 6 7 8 9 10
7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62
yt y xt x yt y xt x
xt 8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00
-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05
Somme 99 855,75 112 800,00 Moyenne 9 985,58
-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00
8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00
yt y
2
6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18
11 280,00
xt
x
2
10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00
et yt yˆt
ˆt y 7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81
64 156 000,00
et2
-33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00
1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38
SCT
aˆ1
SCR
= 0,78
t théorique (bilatéral à risque α=5 %) :
ddl 8
ˆ aˆ = 0,01793912 1
tn22 t80,025 2,306004133
LOI .STUDENT .INVERSE 0,05;8 2,306004133
t
* aˆ1
Pr. Amale LAHLOU
aˆ1 ˆ aˆ1
43,535175 >t80,025 S5 : Sciences Economiques
On rejette (H0 : a1 = 0) 74
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)
Cliquer ici
Extrait du Rapport détaillé par une analyse sur Excel Coefficients
Erreur-type
Statistique t
Probabilité
Limite inférieure Limite supérieure pour seuil de pour seuil de confiance = 95% confiance = 95%
Constante
1176,089634
207,3920575
5,670851856
0,000469936
697,8426925
1654,336576
Variable X 1
0,780982745
0,01793912
43,53517545
8,5489E-11
0,73961506
0,822350431
aˆ0
aˆ1
ˆ aˆ
0
ˆ aˆ
1
taˆ0
aˆ0 ˆ aˆ0
taˆ1
aˆ0 tn/22ˆ aˆ0
aˆ1 ˆ aˆ1
aˆ1 tn/22ˆ aˆ1
Probabilité ou p-valeur :
p 2 P Tn 2 taˆ
p 2 P Tn 2 t aˆ Pr. Amale LAHLOU
aˆ0 tn 2ˆ aˆ0 /2
aˆ1 tn/ 22ˆ aˆ1
S5 : Sciences Economiques
On rejette H0 : a1 = 0 Puisque p-valeur est inférieur à α 75
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)
Cliquer ici
Extrait du rapport détaillé par une analyse sous EVIEWS
ˆ aˆ
0
ˆ aˆ
1
t aˆ 0
taˆ1
n
aˆ0
P value t
aˆ1
P value taˆ0
aˆ1
ˆ
Pr. Amale LAHLOU
S5 : Sciences Economiques
76
IV. Qualité de l’ajustement La régression est-elle globalement de bonne qualité ? Le test de Fisher s’intéresse à la significativité globale d’un modèle. Dans le cas de la régression simple, seul le paramètre a1 est concerné
A. Équation fondamentale d’analyse de la variance B. Tableau d’analyse de la variance (ANalysis Of Variance - ANOVA) Pr. Amale LAHLOU
S5 : Sciences Economiques
77
Équation fondamentale de l’analyse de la variance La somme des résidus est nulle puisque la droite de régression passe par le n point moyen :
e t 1
n
e
t
t 1
t
0
n
yt yˆ t
t 1
n
y t 1
aˆ0 aˆ1 xt
t
ny naˆ0 naˆ1 x ny n y aˆ1 x naˆ1 x
0
La moyenne de la série à expliquer est égale à la moyenne de la série ajustée :
y yˆ n
En effet,
e t 1
Pr. Amale LAHLOU
t
n
n
n
t 1
t 1
t 1
0 yt yˆ t 0 yt yˆ t S5 : Sciences Economiques
78
n
ainsi
(y t 1
t
y)
2
n
(y t 1
n
yˆ t 1
yˆ
En effet, n
y t 1
t
t
yˆ n
t 1
t
n
t 1
t
t
yˆ n
t 1
ˆ t y ˆt y y
t
ˆt y ˆt y ) 2 y n
2
t 1
Pr. Amale LAHLOU
t 1
n
ˆt )2 y ( yt y 2
t 1
ˆ y ˆ y
2
n
et2
Terme nul
t 1
2
n
(et e ) 2 t 1
n
e yˆ t
t 1 n
t
y n
n
et yˆ t y et t 1 n
t 1
e aˆ t
t 1
n
ˆ t ) 2 ( yt y ˆt ) y ˆt y y ( yt y 2
0
ˆ1 xt a
n
n
t 1
t 1
Car et
0
t 1
n
xe t 1
t t
0
ˆ 0 et a ˆ1 et xt a 0
S5 : Sciences Economiques
79
n
2 ( y y ) t t 1
n
n
t 1
t 1
2 ˆ ( y y ) yt yˆ t t
SCT
SCE
2
SCR
Somme des Carrés Totaux
Somme des Carrés Expliqués par le modèle
Somme des Carrés Résiduels Non expliqués par le modèle
(TSS :Total Sum of Squares)
(RSS: Regression Sum of Squares)
(ESS: Error Sum of Squares)
SCT SCE SCR
la variabilité totale des yt. C’est la somme des carrés des écarts des observations yt par rapport à la moyenne y la variabilité expliquée par le modèle. C’est la dispersion totale - la dispersion résiduelle la variabilité résiduelle. C’est la Somme des carrés des écarts des observations yt par rapport aux valeurs estimés par le modèle yˆ t n
yt t 1
Pr. Amale LAHLOU
ˆt y 2
n
e t 1
2 t
S5 : Sciences Economiques
n
et
e
2
t 1
80
yt yt yˆ
ˆ 1x t a ˆ0 a ˆt y
SCR : yt yˆt
SCT : yt y
SCE : yˆt y
y
xt
0 Ecart total yt y = écart dû au modèle n
n
SCT ( yt y ) 2 n 1
(y
t
t 1
yˆt y
y )2
n 1
t 1
n
n
SCE ( yˆ t y ) n 1 aˆ
(x
2 t 1 1
2
t 1
t
+ écart résiduel
yt yˆt
n 1 y2
x )2
n 1
n 1
Cov 2 ( x, y )
x2
n
n
n
t 1
t 1
SCR ( yt yˆt ) 2 et 2 n 2
e t 1
2
t
n2
n 2 ˆ 2 81
n
2 ( y y ) t t 1
SCT
n
n
t 1
t 1
2 2 ˆ ( y y ) e t t
SCE
SCR
permet de juger la qualité de l’ajustement d’un modèle : Plus la variance expliquée SCE est proche de la variance totale SCT (respectivement, plus la variance résiduelle est petite) meilleur est l’ajustement du nuage de points par la droite des Moindres Carrés.
D’où, l’introduction des indicateurs de la qualité d’ajustement Pr. Amale LAHLOU
S5 : Sciences Economiques
82
Coefficient de détermination R2: R2 est un indicateur de la qualité de l’ajustement de la droite aux données. Autrement dit, il mesure l’adéquation entre le modèle et les données observées. Il nous indique le pourcentage de l’information restituée par le modèle par rapport à la qualité d’information initiale. n
R
2
SCE SCT
2 ˆ ( y y ) t t 1 n
(y
t
t 1
0 R2 1
y )2
n
R2 1 Pr. Amale LAHLOU
SCR 1 SCT
( yt yˆt )
n
t 1 n
( yt y ) t 1
2 e t
2
1
2
S5 : Sciences Economiques
t 1
n
2 ( y y ) t t 1
83
y
y
yˆt y
0 R2 1
yˆt yt
2 se rapproche Plus le R x x 2 R 1 de 0, plus le nuage de R2 0 points est diffusé autour l'équation de la droite de l'équation de la droite de de la droite de régression. régression est capable de régression détermine 0% déterminer 100% de la de la distribution des Plus le R² tend vers 1, distribution des points. points. Autrement dit, la plus le nuage de points se Autrement dit, la droite droite de régression rapproche de la droite de de régression déterminée n'explique absolument régression. et les paramètres a0 et a1 pas la distribution des calculés sont ceux qui points. La variable déterminent parfaitement explicative x est donc la distribution des points. inutile. Pr. Amale LAHLOU
S5 : Sciences Economiques
84
Coefficient de corrélation multiple R : R est aussi un indicateur de la qualité de la représentation : R
R2
On note par rXY le coefficient de corrélation linéaire simple de Pearson entre deux variables statistiques X et Y : rXY
E X E X Y E Y var X
var Y
cov X , Y
1 r 1
XY
Il sert à mesurer l’intensité de la relation linéaire entre ces deux variables. Étant donné un échantillon aléatoire de n couples d’observations, le coefficient empirique est donné par : n
XY
( x x )( y y ) t 1
t
t
n
( xt x ) t 1
Pr. Amale LAHLOU
n
n
2
( yt y ) t 1
x y n x y
2
t 1
t t
n
x n x
S5 : Sciences Economiques
t 1
2 t
n
2
2 2 y n y t t 1
85
Remarquons que le coefficient de corrélation linéaire simple s’écrit : r
Ce qui implique :
cov X , Y
XY
t 1
Pr. Amale LAHLOU
X2
y
X X 2 r aˆ1 r aˆ1 Y Y
En plus : 2 n 2 aˆ1 xt x 2 nt 1 2 y y t
Donc,
cov X , Y X
2 R2
n
aˆ1 xt aˆ1 x n
2 y y t
t 1
et
X Y
2
n
2
t 1
aˆ1
2 ˆ y y t t 1 n
2 y y t
SCE R2 SCT
t 1
signe aˆ1 R
S5 : Sciences Economiques
86
Corrélation linéaire
Nulle Aucune relation entre les variations des valeurs de l’une des variables et les valeurs des autres variables
-1 Pr. Amale LAHLOU
nulle
faible
faible -0,5
0 S5 : Sciences Economiques
Très forte 0,5
parfaite
Très forte
Positive Augmentation ou diminution simultanée des valeurs des deux variables
forte
forte
parfaite
Négative Les valeurs de l’une des variables augmentent, les valeurs de l’autre variable diminuent
1 87
y
y
y
v
x
x Relation parfaite
x
Relation forte
y
Relation modérée
y
x Relation faible
Pr. Amale LAHLOU
x Pas de relation S5 : Sciences Economiques
88
Y
Y
Y
v
v
X
X
X
r 1
r 0
r 1
il existe une corrélation linéaire négative parfaite entre X et Y : droite de régression décroissante.
corrélation linéaire nulle. Alors, aucune dépendance linéaire entre X et Y.
il existe une corrélation linéaire positive parfaite entre X et Y : droite de régression croissante.
Plus la valeur de r s’éloigne de 0 pour s’approcher de 1 plus l’intensité du lien linéaire entre X et Y grandit de façon croissante ou décroissante. Bien noté que la corrélation n’indique aucun effet de causalité Pr. Amale LAHLOU
S5 : Sciences Economiques
89
Coefficient de détermination ajusté : En cas de régression linéaire simple, il est donné par les formules : Il peut être négatif
2 1 R SCR n 2 n 1 Ra2 1 R2 1 1 R2 SCT n 1 n2 n2
Lorsque l’on ajoute des variables explicatives au modèle le R2 peut seulement croître même si ces nouvelles variables sont très liées à la variable à expliquer. Il peut être ainsi amplifié artificiellement par l’addition de n’importe quelle variable
explicative. Tandis que le R2 ajusté peut croître ou décroître. Il est préférable de comparer les valeurs des R2 ajustés pour déterminer si l’introduction d’une variable supplémentaire est utile Pr. Amale LAHLOU
S5 : Sciences Economiques
90
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille coefficient de détermination)
Cliquer ici
yt y xt x yt y xt x
xt
Année
yt
1 2 3 4 5 6 7 8 9 10
7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62
8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00
Somme
99 855,75
112 800,00
Moyenne 9 985,58
Estimation de
-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05
-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00
8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00
xt
2
6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18
11 280,00
aˆ1 aˆ0
yt y
x
2
10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00
ˆt y 7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81
64 156 000,00
et yt yˆt -33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00
SCT
et2 1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38 SCR
SCT = 39 296 098,18 SCR = 165 169,38
= 0,780982745 = 1176,089634
SCE = SCT – SCR = 39 130 928,80
yˆt aˆ1 xt aˆ0 0, 78 x 1176, 08
Coefficient de détermination R2 = 0,995796799 Coefficient de détermination Ra2 ajusté = 0,995271399 Coefficient de corrélation linéaire multiple R = 0,997896187
n
n
SCR yt yˆ t et2 t 1
Pr. Amale LAHLOU
2
t 1
n
n
SCT ( yt y ) 2 SCE ( yˆt y ) 2 R 2 SCE t 1
t 1
S5 : Sciences Economiques
SCT
Ra2 1
SCR n 2 SCT n 1 R
R2 91
Cliquer ici
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)
Extrait du Rapport détaillé par une analyse sur Excel R Statistiques de la régression Coefficient de détermination multiple R Coefficient de détermination
R2
0,997896187
R2
0,995796799
Coefficient de détermination ajusté
0,995271399
Erreur-type
143,6877615
Observations
10
Ra2
ˆ
n 99,58% de la variabilité dans la consommation peut s’expliquer par la variabilité du revenu. Seulement 0,42% restants s’expliquent très mal : parfaite corrélation Pr. Amale LAHLOU
S5 : Sciences Economiques
92
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)
Cliquer ici
Extrait du rapport détaillé par une analyse sous EVIEWS
ˆ aˆ
0
n
ˆ aˆ
1
t a*ˆ0
ta*ˆ1
aˆ0 aˆ1
P value t P value ta*ˆ0
* aˆ1
R2
ˆ
Ra2
Pr. Amale LAHLOU
93
Tableau d’analyse de la variance pour un modèle de régression simple Source de variation Régression linéaire Variables explicatives
Degrés de liberté
Sommes des carrés
Moyenne des carrés
Fisher F
SCE n
k 1
( yˆ t y ) 2 MCE SCE t 1 k
MCE F MCR
n
SCR et2
Résidu
SCR MCR n k 1 2 n k 1 ( yt yˆt ) n
t 1
t 1
Total
n 1
k nombre de facteurs. Pour la régression simple k = 1
SCT n
2 ( y y ) t t 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
94
Source de variation Régression linéaire Variable explicative x
Degrés de liberté
Sommes des carrés
( yˆ
y)
t
t 1
2
2 ˆ ( y y ) t
F
t 1
( yˆ
n2
(y t 1
n 1
yˆ t ) 2
t
e n 2 2 t
2 e t t 1
n
2 t
n2 Dans la variance
n
(y
t
y)
n
(y
2
t 1
n
2 Dans la variance ( yt y ) t 1
Il y a une seule variable explicative. D’où, le degré de liberté est : 1
n
e
t 1
F
y )2 1
t
t 1 n
t 1
t 1
Total
n
1
n
Résidu
Fisher
n
n
1
Moyenne des carrés
(y t 1
t
y) 0
D’où, le degré de liberté est : n 1
ˆt ) y
n
e t 1
2 t
Il y a n écart et deux contraintes connues : n
Il y a n écart et une contrainte connue : n
t
2
e t 1
t
0
n
et
e x t 1
t
t
0
D’où, le degré de liberté est :
n2
Source de variation Régression Variable explicative (x)
Résidus
Total (y)
Degrés de
liberté
1 n2
n 1
Sommes des carrées
Moyenne des carrées
SCE
SCE MCE 1
SCR
SCR MCR n2
SCT
Fisher
F
F
MCE SCE 1 MCR SCR n 2
Fisher de degrés de liberté 1 et n-2
SCE SCE 2 2 MCE R R SCT (n 2) 1 (n 2) F 2 SCR SCR MCR 1 R (1 R 2 ) (n 2) n2 SCT
Si la variance expliquée par le modèle est significativement supérieure à la variance résiduelle, alors la variable X est réellement explicative. Pr. Amale LAHLOU
S5 : Sciences Economiques
96
Le test de Fisher (analyse de la variance) permet d’intégrer la taille de l’échantillon n dans l’appréciation de la qualité de la représentation. Soit le test d’hypothèses : H : SCE SCR 0
H1 : SCE SCR SCE
1 Calculer le Fisher empirique : F SCR n2 F Comparer F avec 1, n 2 , le Fisher tabulé à (1,n-2) degré de liberté
et au seuil Conclure : si F F1, n 2 ou la p-valeur associée est inférieur à α on rejette l’hypothèse nulle d’égalité des variances et donc la variable X est
significative et explicative de la variable Y Pr. Amale LAHLOU
S5 : Sciences Economiques
97
Équivalence des tests dans un modèle de régression linéaire simple Test sur le coefficient de régression linéaire (pente de la droite de régression)
H 0 : a1 0 1 H1 : a1 0
Test sur le coefficient de corrélation linéaire entre les variables x et y
H 0 : rxy 0 2 H : r 0 xy 1
Test de signification de la Somme des Carrés Expliqués
H 0 : SCE 0 3 H1 : SCE 0
Test de signification du coefficient de détermination
H0 : R2 0 4 2 H1 : R 0
Pr. Amale LAHLOU
S5 : Sciences Economiques
98
Démonstration Le test (1) se fait au moyen de la statistique de Student Tn 2 : H 0 : a1 0 1 H1 : a1 0
aˆ1 sous H0 et au risque : Tn 2 ˆ aˆ1 Le test (2) se fait au moyen de la statistique de Student Tn 2 : H0 : r 0 2 H1 : r 0
sous H0 et au risque :
r
1
1 r
Tn 2
2
Pr. Amale LAHLOU
n2
S5 : Sciences Economiques
99
Le test (3) se fait au moyen de la statistique de Fisher F1, n 2 : H 0 3 H1
sous H0 et au risque :
:
SCE 0
:
SCE 0
SCE
1
SCR
F1, n 2
n2 Le test (4) se fait au moyen de la statistique de Fisher F1, n 2 : H 0 4 H1
sous H0 et au risque :
:
R2 0
:
R2 0
R2
1
1 R 2
Pr. Amale LAHLOU
F1, n 2
n2
S5 : Sciences Economiques
100
En effet, sous l’hypothèse H 0 : a1 0 aˆ1 * Tn 2 Déjà montré t aˆ1 ˆ aˆ1 De même : r 1
1 r
n2
1 r
r
n2
2
n2
n
y t 1
aˆ1
x
t
t 1
x
n
et2
aˆ1
n
x t 1
ˆ
t
y
t
x
n2
t
x
y
y
t 1 n
2
n
y t 1
n
x t 1
2
y aˆ 2
t
x
t
2 1
n
x t 1
x
2
t
2
t
x
2
aˆ1 Tn 2 ˆ aˆ1
t 1
n2 Pr. Amale LAHLOU
aˆ1
2
n
t 1
2
x2
t 1
1
n
Cov( x, y )
2 x x t
n2
1 r 2
x y
n
aˆ1 1
Cov( x, y )
aˆ1
Tn 2
2
r
r
S5 : Sciences Economiques
Équation fondamentale de l’analyse de la variance
yˆ t y aˆ1 xt x 101
De même,
SCE SCR
1
F1, n 2
n2
n
SCE SCR
1
n 2
n 2
yˆ t y t 1 n
y t 1
n 2
n
2
yˆ t
aˆ
t 1
n
e
2
t
n
2 1
n 2
2 ˆ ˆ ˆ ˆ a a x a a x 0 1t 0 1
x
x
2
t
t 1
n
e t 1
t 1
2 t
n 2
2 t
ˆ t aˆ0 aˆ1 xt y y aˆ0 aˆ1 x
2 aˆ a2ˆ 2 1
1
n
n
e t 1
n
2 ˆ ( y y ) e t t t
2 t
2
t 1
t 1
2
aˆ n 2
2 1 2 aˆ1
n
e t 1
2 t
2
SCE SCR
1
n 2
12
2 n2
1
n2
aˆ1 a1 2 aˆ1 aˆ 2 n 1 aˆ 2 1 xt x 2 n 2 1 2 2 aˆ1 n n t 1 et et t 1 t 1 n 2
F1, n 2 S5 : Sciences Economiques
102
puisque,
t
N 0, 2
aˆ1 a1 aˆ 1 SCE
Donc,
SCR
et N 0,1 t 1 n
et
2
1
2
n2 2
Une seule normale centrée réduite au carré
2 1
Le rapport (de deux variables indépendantes) d’un Chi-deux divisé par son degré de liberté (1) à un Chi-deux divisé par son degré de liberté (n-2) suit une loi de Fisher de degrés de liberté (1, n-2)
F1,n 2
n2
Il est à noter qu’en régression linéaire simple, on se ramène à un test par analyse de la variance où le Fisher empirique est le carré de Student empirique : n
F
SCE
*
SCR
1
n 2
n 2
yˆ y t
t 1
n
2 e t
n
aˆ 1 xt x 2
n 2
t 1 n
t 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
2 e t
2
aˆ1 t a*ˆ 2 1 ˆ aˆ1 ˆ aˆ1 aˆ 12
2
t 1
103
De même,
R2
1
1 R
F1,n 2
2
n
r 2 aˆ12
n2
xt x t 1 n
n
2
yt y
2
t 1
aˆ1 xt aˆ1 x
n
2
t 1
n
2 y y t
t 1
2 ˆ y y t t 1 n
2 y y t
SCE R2 SCT
t 1
Donc, le carré du coefficient de corrélation linéaire simple est égal au coefficient de détermination : r 2 R 2 r signe aˆ1 R 1 1 2 2 1 R 1 r n2 n2 R2
2
r2
Pr. Amale LAHLOU
1 F1, n 2 2 1 r n2 r
S5 : Sciences Economiques
104
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille ANOVA)
Cliquer ici
yt y xt x yt y xt x
xt
Année
yt
1 2 3 4 5 6 7 8 9 10
7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62
8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00
Somme
99 855,75
112 800,00
Moyenne 9 985,58
Estimation de
-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05
-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00
yt y
8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00
6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18
11 280,00
aˆ1 aˆ0
xt
2
x
2
10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00 64 156 000,00
ˆt y
et yt yˆt
7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81
-33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00
SCT
= 0,780982745 = 1176,089634
yˆt aˆ1 xt aˆ0 0, 78 x 1176, 08
1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38 SCR
Source de variation
ddl
Sommes des carrées
Moyenne des carrées
Fisher
x
1
39130928,80
39130928,80
1895,311501
Résidus
8
165169,38
20646,17282
Total
9
39296098,18
F théorique (1,8) (risque α=5 %) : F 1895,311501>F1,8
et2
F1,8 5,317655063
On rejette (H0 : a1 = 0) La variable Xt est significative
L’analyse de la variance confirme que la variance expliquée est significativement plus 105 élevée que la résiduelle.
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)
Cliquer ici
Extrait du Rapport détaillé par une analyse sur Excel ANALYSE DE VARIANCE Degré de Somme des carrés liberté
Régression
1
39130928,8
Résidus
8
165169,3825
Total
9
39296098,18
SCE
Moyenne des carrés
SCT = SCE + SCR
Pr. Amale LAHLOU
Valeur critique de F
39130928,8 1895,311501
8,5489E-11
20646,17282
MCE=SCE/1 MCR = SCR/8
SCR
F
MCR ˆ2
ˆ MCR
S5 : Sciences Economiques
F
MCE MCR
P-valeur :
P F1,n 2 F
106
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.wf1, feuille rapport)
Cliquer ici
Extrait du rapport détaillé par une analyse sous EVIEWS
ˆ aˆ
0
n
ˆ aˆ
1
t a*ˆ0
ta*ˆ1
aˆ0 aˆ1
P value t P value ta*ˆ0
* aˆ1
R2
ˆ
P value F
*
F
*
Pr. Amale LAHLOU
Ra2
y y
SCR
107
R.B Exercice 4, page 36 Un agronome cherche à estimer la relation liant la production de maϊs yi au taux de bauxite xi se trouvant dans la terre en formalisant la relation :
yi a0 a1 xi i
Le modèle est spécifié en coupe instantanée. À partir d’une étude statistique portant sur 85 parcelles de terre, un économètre lui fournit les résultats suivants :
yi 132,80 1,1 xi ei les ratios empiriques de Student Et on a :
85
e i 1
Pr. Amale LAHLOU
2 i
i 1,...,85
ta*ˆ1 10, 2 et ta*ˆ0 4,3
6234, 32
S5 : Sciences Economiques
108
Question 1: Montrer que tester l’hypothèse H0 : a1 = 0 revient à tester l’hypothèse r = 0 où r est le coefficient de corrélation linéaire simple entre yi et xi ; le calculer. Soit l’hypothèse nulle (H0 : a1 = 0). Soit l’erreur du premier espèce 5% * 0, 025 0, 05 t 10 , 2 t z 1,96 Comme aˆ1
(approximation avec une
nous rejetons H0, c’est-à-dire,
loi normale centrée réduite)
a1 est
significativement différent de 0 : le taux de bauxite est un facteur explicatif négatif (puisque aˆ1 est négatif) de la production de maїs. On a déjà montré l’équivalence de ce test avec (H0 : r = 0). Du fait de r
aˆ1
1
1 r
2
n2
n
x
x
t
t 1
n
e t 1
aˆ1
2
2 t
n
x t 1
ˆ
t
x
2
aˆ1 t a*ˆ1 ˆ aˆ1
n2 Pr. Amale LAHLOU
S5 : Sciences Economiques
109
Calculons
r
1
1 r 2
r: rappelons que le signe de rest celui de a ˆ1 ta*ˆ1 r 2
n2
t n 2 t * 2 aˆ1
* 2 aˆ1
10,22 0,556 r 0,746 r 0,746 2 83 10,2
Question 2: Construire le tableau d’analyse de la variance et vérifier les résultats obtenus en question 1 à partir du test de Fisher. Pour construire le tableau d’analyse de la variance, il faut connaître : 85
SCE ( yˆ i y )
85
85
i 1
i 1
SCR ( yi yˆ i ) 2 ei2
2
i 1
85
SCT ( yi y ) 2 i 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
110
85
Or,
SCE 1 SCT
R2
2 e i
1
ti 1
85
(y
t
i 1
y )2
SCR SCT
2 2 et R r 0,556.
85
la connaissance de SCR ei2 6234, 32 permet de déterminer i 1
SCT
SCR 2 SCE SCT r 7806, 941 14041, 261 ainsi que 2 1 r
On construit le tableau d’analyse de la variance : Source de variation
Degrés de liberté
Sommes des carrées
Moyenne des carrées
x
1
SCE = 7806,94
SCE/1 = 7806,94
Résidus
85-2 = 83
SCR = 6234,32
SCR/83 = 75,11
Total
85-1 = 84
SCT = 14041,26
Pr. Amale LAHLOU
S5 : Sciences Economiques
Fisher F* = 103,94
111
SCE
F N.B. :
SCR
1
n2
7806,94 0,05 103,94 F1,83 3,96 75,11
F 103,94 F 10,195 10, 2 ta*ˆ1
Notez bien : sous Excel,
INVERSE .LOI .F (0,05;1;83) 3,95596086 F * 103,94 LOI .F (103,94;1;83) 2,69563 10-16 0,05
Question 3 : le coefficient a1 est-il significativement inférieur à (-1) ? Soit le test unilatéral à gauche suivant :
Pr. Amale LAHLOU
H 0 : a1 1 H1 : a1 1
S5 : Sciences Economiques
112
Tout d’abord calculons l’écart type : aˆ1 aˆ1 1,1 * ˆ taˆ 10, 2 aˆ * 0,10784 ˆ aˆ 10, 2 taˆ aˆ1 a1 1,1 (1) Puis, sous H0, nous avons : * 1
1
1
1
t aˆ1
ˆ aˆ
1
0,10784
0,9273
Comme le test est unilatéral, on doit travailler avec la table de Student unilatéral au seuil α. Toutefois, on peut travailler avec la table de Student bilatérale avec un seuil 2 α. Puisque aˆ1 a1 1,1 (1) * 0 , 05 0 , 01 t aˆ1
ˆ aˆ
1
0,10784
0,9273 t
z
1,65
Nous acceptons l’hypothèse H0, c’est-à-dire, a1 n’est pas significativement inférieur à (-1). Notez bien : sous Excel, LOI .STUDENT .INVERSE (0,10;83) 1,66342018 t *aˆ 1 0,9273
LOI .STUDENT (0,9273;83;1) 0,178229748 0,05 Pr. Amale LAHLOU
S5 : Sciences Economiques
113
V. Prévision dans le modèle de régression simple
A. Prévision ponctuelle B. Intervalle de prédiction
Pr. Amale LAHLOU
S5 : Sciences Economiques
114
V. Prévision dans le modèle de régression simple Prévision ponctuelle : Le modèle estimé sur la période t 1,..., n
ˆ0 a ˆ1 xt et yt a ˆ n 1 aˆ0 aˆ1 xn 1 Pour xn 1connue la prévision est donnée par : y La prévision est sans biais : ˆ n 1 L’erreur de prévision est : en 1 yn 1 y en 1 a0 a1 xn 1 n 1 aˆ0 aˆ1 xn 1 Or,
E en 1
a0 aˆ0 a1 aˆ1 xn 1 n 1 E a0 aˆ0 xn 1 E a1 aˆ1 E n 1
Donc, E en 1 0 et en général, pour un horizon h, E en h 0 Pr. Amale LAHLOU
S5 : Sciences Economiques
115
Covaˆ0 , aˆ1 x Var (aˆ1 )
Prévision par un intervalle : on calcule la variance de l’erreur
Var en 1 Var aˆ0
Var yn 1 yˆ n 1 Var a0 aˆ0 a1 aˆ1 xn 1 n 1
Var aˆ0 xn21Var aˆ1 2 xn 1Cov aˆ0 , aˆ1 Var n 1
2 2 x Var aˆ1 n
2 n
x 2Var aˆ1 xn21Var aˆ1 2 xn 1 xVar aˆ1 2
2 1 1 xn 1 x Var aˆ1 n 2 1 2 2 1 xn 1 x n n x x
Pr. Amale LAHLOU
Var n 1 2
2
t 1
Var en 1
xn+1 est certaine
1 2 n
xn 1 x 1 n 2 x x t t 1 S5 : Sciences Economiques
t
2
2
116
L’intervalle de prédiction de niveau de confiance (1 - α) % :
2 1 N 0, ˆ n
en 1 yn 1 yˆ n 1
Soit,
yn 1 yˆ n 1
ˆ
1 n
xn 1 x n 2 x x t
xn 1 x 2 n 2 x x t t 1
1
Tn 2
2
1
t 1
Donc, les deux bornes de l’intervalle de prédiction est donné par :
yn 1 yˆ n 1 t n 2 2ˆ
1 n
xn 1 x 2 n 2 xt x
1
t 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
117
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille prévision)
Cliquer ici
yt y xt x yt y xt x
xt
Année
yt
1 2 3 4 5 6 7 8 9 10
7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62
8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00
Somme
99 855,75
112 800,00
Moyenne 9 985,58
Estimation de
-2 595,59 -1 815,93 -1 153,87 -1 332,74 -1 197,50 -369,37 607,88 1 200,54 2 772,52 3 884,05
-3 280,00 -2 280,00 -1 780,00 -1 780,00 -1 480,00 -280,00 720,00 1 720,00 3 720,00 4 720,00
yt y
8 513 518,80 4 140 309,00 2 053 879,70 2 372 268,30 1 772 292,60 103 422,20 437 670,00 2 064 920,20 10 313 755,80 18 332 692,40 50 104 729,00
6 737 061,49 3 297 583,61 1 331 404,44 1 776 182,58 1 433 994,28 136 430,50 369 512,02 1 441 284,29 7 686 839,43 15 085 805,56 39 296 098,18
11 280,00
aˆ1 aˆ0
= 0,780982745 = 1176,089634
xt
2
x
ˆt y
2
10 758 400,00 5 198 400,00 3 168 400,00 3 168 400,00 2 190 400,00 78 400,00 518 400,00 2 958 400,00 13 838 400,00 22 278 400,00
7 423,95 8 204,93 8 595,43 8 595,43 8 829,72 9 766,90 10 547,88 11 328,87 12 890,83 13 671,81
64 156 000,00
et yt yˆt -33,96 -35,28 236,28 57,41 -41,64 -150,69 45,57 -142,76 -132,74 197,81 0,00
SCT
et2 1 153,39 1 244,98 55 830,26 3 296,40 1 733,93 22 707,43 2 076,39 20 379,08 17 620,12 39 127,39 165 169,38
SCR
yˆt aˆ1 xt aˆ0 0, 78 x 1176, 08
2 xn 1 x 2 1 Var (et * ) ˆ n 1 18 352,15 Consommation pour un revenu xt*=10 000 n xt x 2 t 1 yˆt* aˆ0 aˆ1xt* 1176,08 0,78 10000 yˆ t 985,917086 Prédiction ponctuelle : *
l’intervalle de prédiction yn 1 yˆ n 1 t n 2ˆ
2
1 n
xn 1 x 2 n 2 xt x
1
t 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
118
(R.B. C2EX1, eco9) (LAHLOU-Régression-Linéaire.xls, feuille rapport)
Cliquer ici
Extrait du Rapport détaillé par une analyse sur Excel et yt yˆt
yˆt aˆ1 xt aˆ0
et ˆ et
ˆ et Pr. Amale LAHLOU
SCR ˆ n 1
n2 135,4701208 n 1 119
R.B. Exercice 5, CEX2, page 41 Nous reprenons le modèle consommation-revenu spécifié série temporelle :
yt 1176, 08 0, 78 xt et Les ratios de Student empiriques sont :
t 1,...,10 ta*ˆ1 43,53 et ta*ˆ0 0,21
Question 1 : Calculer le coefficient de détermination et effectuer le test de Fisher permettant de déterminer si la régression est globalement significative. Comme
F
R2
1 R n 2 1 r 2
n 2 r2
2
t
aˆ1
2
43, 53
2
t a2ˆ1
2 43 , 53 Alors, r 2 0,99579 et puisque 2 2 n 2 t aˆ1 8 43,53
F * 1894,86 F10,,805 5,32 la variable explicative revenu est significative Pr. Amale LAHLOU
S5 : Sciences Economiques
120
Question 2 : Quelle est la conséquence sur la consommation de l’augmentation du revenu de 8 % ?
Soit une augmentation du 8 % du revenu, de combien augmente la consommation ? Soit la formule :
yˆt aˆ0 aˆ1 xt yˆt aˆ1xt Ainsi, yˆt aˆ1xt 0, 78 0, 08 0,0624 Pour une augmentation du revenu de 8%, la consommation augmente de 6,24 % Question 3 : pour les années 11 et 12, on prévoit 16 800 et 17 000 UM de revenu par habitant. Déterminer la prévision de consommation pour ces deux années ainsi que l’intervalle de prédiction au seuil de 95 %.
Soit le modèle estimé : yˆt 1176, 08 0, 78 xt En supposant x11 16800 et x12 17000 Pr. Amale LAHLOU
S5 : Sciences Economiques
121
Alors, les prévisions ponctuelles sont de :
yˆ11 1176, 08 0, 78 16800 14280,08 yˆ12 1176, 08 0, 78 17000 14436,08 Déterminons IC11 l’intervalle de prédiction à l’année 11 (la réalisation à 95% de se trouver dans cet intervalle) : ˆ11 tn/ 22ˆ y11 y
1 n
x11 x n
x t 1
t
2
x
1 2
Comme, yˆ11 14280,08 ; tn/22 2,306 ; ˆ 143, 69 ; x11 16800 n
xt x 6415600 ; x 11280 ; n 10 Alors,
2
t 1
y11 14280, 08 2, 306 143, 69 y11 14280, 08 415,81792
1 10
16800 11280 64156000
2
1 122
Déterminons IC12 l’intervalle de prédiction à l’année 12 (la réalisation à 95% de se trouver dans cet intervalle) : ˆ12 tn/ 22ˆ y12 y
1 n
x12 x n
2
xt x
1 2
t 1
Comme, yˆ 14436,08 ; t /2 2,306 ; ˆ 143, 69 ; x 17000 12 n2 12 n
x x t 1
Alors:
t
2
6415600 ; x 11280 ; n 10
1 17000 11280 y12 14436,08 2,306 143,69 1 10 64156000 y12 14436,08 420,42992 2
D’où, IC11 13864,26;14695,90 et IC12 14015,65;14856,51 Pr. Amale LAHLOU
S5 : Sciences Economiques
123
R.B. Exercice 6, page 43 Un économiste spécialisé en économie du travail s’intéresse à la relation liant la rémunération et la durée des études (théorie du capital humain). Pour ce faire, il dispose d’un échantillon de 40 hommes et 25 femmes ayant le même âge, dont il relève la rémunération annuelle (yi), exprimé en milliers de francs, et le nombre d’années d’études (xi). Les estimations économétriques conduisent aux résultats suivants : Pour les hommes (n1 = 40)
yi 18, 60 1,8 xi ei les ratios de Student empiriques
t 5,2 et Rh2 0, 42 * haˆ1
Pr. Amale LAHLOU
t
* haˆ 0
Pour les femmes (n2 = 25)
yi 14,50 0, 7 xi ei les ratios de Student empirques
9,3
t *faˆ1 2,5 et
t *faˆ0 12,8
R 2f 0, 22
S5 : Sciences Economiques
124
Question 1 : L’influence de la durée des études sur la rémunération vous semble-t-elle significative ?
analyse avec les ratios empiriques de Student Pour les hommes
t
* haˆ1
haˆ1 5,2 t380,025 t0,025 z 0,05 1,96 ˆ haˆ1
L’écart type est
ˆ haˆ
1
et
Pour les femmes
t *faˆ1
faˆ1 2,5 t230,025 2,069 ˆ faˆ1
L’écart type est
haˆ 1,8 1 0,35 5, 2 5, 2
PT38 5,2 7,10 10-6
ˆ faˆ
1
et
faˆ1 0, 7 0,28 2, 5 2, 5
PT28 2,5 0,02
• Les deux coefficients de régression sont significativement différents de 0. • le coefficient de pondération des années d’études pour les femmes est plus faible et moins significatif que celui des hommes. 125
Question 2 : Existe-il une différence significative entre la rémunération des hommes et des femmes ? On se ramène à un test de différence de moyennes de variables aléatoires normales indépendantes et de variances inégales :
H 0 : ha1 fa1 Ou encore H 0 : d ha1 fa1 0 H1 : d ha1 fa1 0 H1 : ha1 fa1 Soit donc la distribution haˆ1 faˆ1 ha1 fa1 Tn1 n2 4 ˆ haˆ1 faˆ1 On pose dˆ haˆ faˆ donc 1 2 dˆ
ˆ ˆ dˆ
Sous H0:
ˆ dˆ
1 2 haˆ1 faˆ1
t * dˆ
2 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ ha 2 cov( ha , fa ) ˆ1 faˆ1 1 1 haˆ1 faˆ1
1,8 0,7 0,342 0,282
0 , 025 2,49 t61 t0, 025 z 0, 05 1,96
Nous rejetons l’hypothèse H0 ; c’est-à-dire, il existe une différence significative des coefficients de régression : la durée des études des femmes a moins d’impact sur la rémunération que la durée des études des hommes. Pr. Amale LAHLOU
S5 : Sciences Economiques
126
R.B. Exercice 7, page 44 Soit les résultats d’une estimation économétrique :
yt 32,95 1, 251xt et
n 20 R 2 0, 23
ˆ 10, 66
Pr. Amale LAHLOU
S5 : Sciences Economiques
127
Question 1 : À partir des informations connues, on demande de retrouver les statistiques suivantes : la Somme des Carrés de Résidus (SCR), la Somme des Carrés Totaux (SCT), la Somme des Carrés Expliqués (SCE), la valeur de la statistique du Fisher empirique (F*) et l’écart type du coefficient aˆ1 ˆ aˆ1 ? SCR 2 ˆ 10, 66 SCR 10, 66 18 2045, 44 n2 SCR SCR 2045, 44 2 R 1 0, 23 SCT 2656, 42 2 SCT 1 R 1 0, 23 SCT SCE SCR SCE SCT SCR 2656, 42 2045, 44 610,98 R2
F *
F
*
SCE 610,98 18 5, 40 2045, 44 n 2 SCR n 2
1 R t 5, 40 t
ˆ aˆ1
2
* aˆ1
2
* aˆ1
aˆ1 1, 251 0,54 * taˆ1 2,32
5, 40 2,32
S5 : Sciences Economiques
128
Question 2 : Le coefficient de la variable x est-il significativement supérieur à 1 ?
On pose le test d’hypothèse unilatéral à droite : H0 : H1 :
a1
1
a1
1
Sous H0, nous pouvons écrire :
t
* ˆ1 a
aˆ1 a1
aˆ
1
Valeur lue sur la table bilatérale de Student
1,25 1 0 ,10 0,46 t18 1,734 0,54
On accepte H0: le coefficient a1 n’est pas significativement supérieur à 1.
Pr. Amale LAHLOU
S5 : Sciences Economiques
129
R.B. Exercice 8, page 45 À partir d’un échantillon de 190 observations, on étudie la relation entre la variable à expliquer yi et la variable explicative xi . À l’aide des informations fournies ci-dessous reconstituez les huit valeurs manquantes signalées par VM1, ...VM8. 3,447 et x 38,416 x
Dependent variable : Y Method: Least Squares Sample: 1 190 Included Observations; 190
n
ˆ aˆ ˆ aˆ 0
1
t
* aˆ 0
t
* aˆ1
P value ta*ˆ0
aˆ0
Variable
Coefficient
STD. Error
T-Statistic
Prob.
aˆ1
C
-4364,928
VM1
-16,61141
0,0000
X
VM4
VM3
VM2
0,0000
R2
R-Squard
VM5
Mean dependent var
VM6
y
ˆ
S.E. of regression
322,8850
S. D. dependent var
VM8
y
Sum squard resid
VM7
F-statistic
778,9623
F*
SCR Pr. Amale LAHLOU
P value ta*ˆ1
S5 : Sciences Economiques
130
aˆ0 - 4364,928 VM . 1 ˆ aˆ0 * 262,7669 t aˆ0 - 16,61141 * * VM 4 ? VM 2 t F 778,9623 27,9099 VM 2 t ou encore . aˆ1 VM 3 ? VM 4 ? VM . 3 ˆ aˆ ou encore 1 VM 2 27,9099 ˆ 322,88 322,8850 322,8850 VM 3 ˆ aˆ1 6,8136 190 190 x n 1 3,447 189 2 2 xt x xt x * aˆ1
t 1
t 1
* ˆ ˆ VM 4 a t . 1 aˆ1 aˆ1 VM 2 VM 3 27,9099 6,8136 190,1669
* F 778,9623 2 0,8056 .VM 5 R * F n 2 778,9623 188
Pr. Amale LAHLOU
S5 : Sciences Economiques
131
.VM 6 y aˆ0 aˆ1 x -4364,928 VM4 x -4364,928 190,166938,416 2940,5236 190
2 .VM 7 et2 (n 2)ˆ 2 188322,8850 19599888 t 1
190
.VM 8 y
yt y
2
t 1
n 1
SCR 2 SCT 1 R n 1 n 1
19599888 VM 7 1 0,850 1 VM 5 831,4770 n 1 189
Pr. Amale LAHLOU
S5 : Sciences Economiques
132
Exercice On cherche à appréhender une relation entre deux variables quantitatives : Variable à expliquer Y
Variable explicative X
1
22
20
2
18
20
3
17
16
4
27
32
5
32
27
6
28
18
7
40
28
8
18
11
Pr. Amale LAHLOU
S5 : Sciences Economiques
133
Questions 1. Représenter graphiquement le nuage des points et donner le modèle de régression yˆi aˆ0 aˆ1 xi par le méthode des moindres carrées. Interpréter le résultat. 2. Calculer les différents dispersions selon la loi des écarts. 3. Déterminer le coefficient de détermination et le coefficient de corrélation. 4. Représenter l’analyse de la variance et le test Fisher 5. S’assurer à l’aide d’un test de Student que la propension marginale est significativement différente de zéro. 6. Déterminer l’intervalle de confiance du paramètre a0. 7. Prévision de la variable dépendante pour la valeur x9 = 34 et l’intervalle de prédiction de cette prévision. Pr. Amale LAHLOU
S5 : Sciences Economiques
134
1. Influence de la variable X sur la variable Y
la production
45 40 35
y = 0,8206x + 7,6074
30 25 20
15 10 5 0 0
Pr. Amale LAHLOU
5
10
15
20
S5 : Sciences Economiques
25
30 35 les déchets 135
ˆt yt y
et
10,56
24,019
-2,02
4,08
2,25
52,56
24,019
-6,02
36,23
45,375
30,25
68,06
20,737
-3,74
13,96
1,75
18,375
110,25
3,06
33,866
-6,87
47,14
5,50
6,75
37,125
30,25
45,56
29,763
2,24
5,00
28
-3,50
2,75
-9,625
12,25
7,56
22,378
5,62
31,61
28
40
6,50
14,75
95,875
42,25
217,56
30,584
9,42
88,66
11
18
-10,50
-7,25
76,125
110,25
52,56
16,634
1,37
1,87
279
340,00
457,50
228,56
SCT
SCR
xt x yt y xt x yt y xt x yt y 2
xt
yt
1
20
22
-1,50
-3,25
4,875
2,25
2
20
18
-1,50
-7,25
10,875
3
16
17
-5,50
-8,25
4
32
27
10,50
5
27
32
6
18
7 8 Somme Moyenne
21,50
25,25
2
et2
Toutes les colonnes du tableau sont nécessaires pour estimer tous les paramètres.
Pr. Amale LAHLOU
S5 : Sciences Economiques
136
Calculons tout d’abord les deux estimations de aˆ0 et aˆ1 : 8
aˆ1
Cov X , Y Var X
x x y y t 1
t
8
x x t 1
et
t
2
279 0,82 340
t
aˆ0 y aˆ1 x 25,25 0,82×21,25 7,62
Donc, l’équation de la droite qui représente le mieux les relations entre le pourcentage de déchets et la production est : yˆi 7,62 + 0,82 xi Ce résultat peut être interprété comme suit :
À l’origine (x = 0), la variation de y s’élève à 7,62 ; Une unité supplémentaire de x génère un supplément de y de 0,82 Pr. Amale LAHLOU
S5 : Sciences Economiques
137
2. Loi des écarts ou encore la relation fondamentale d’analyse de la variance met l’accent sur la relation entre :
l’erreur associée à l’hypothèse nulle (mesurée par SCT) : SCT est la dispersion totale des yi (somme des carrés des écart des observations yi 8
par rapport à la moyenne y ) SCT yi y 457,50 2
i 1
l’erreur associée à l’hypothèse alternée «Y dépend de X » (mesurée par SCR) : SCR est la dispersion résiduelle (somme des carrés des écart des observations yiet les valeurs estimées yˆ i par le modèle) 8
8
SCR yi yˆi et2 228,56 i 1
2
i 1
Ainsi, la dispersion expliquée somme des carrés des écart des valeurs estimées yˆ i par le modèle par rapport à la moyenne y s’élève à 228,94 en effet,
8
SCE yˆi y SCT SCR 228,94 2
i 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
138
3. Coefficient de détermination (indicateur de la qualité de la représentation) : mesure le pouvoir explicatif du modèle en évaluant le pourcentage de l’information restituée par le modèle par rapport à la qualité d’information initiale, R2
SCE SCR 228,56 1 R2 1 SCT SCT 457,50
R 2 0,5004
Le modèle yˆi 7,62 + 0,82 xi restitue 50,04 % de l’information totale sur la variable Y. Coefficient de détermination multiple (coefficient de corrélation) : indicateur couramment utilisé. Il existe plusieurs formules pour le calcul Cov X , Y de R R R2 ; R ; R aˆ1 X ; r signe aˆ1 R XY Y R R 2 R 0,5004
Selon l’exemple : R 0, 7074 Ce qui implique l’existence d’une forte relation linéaire positive sur les données observées entre les deux variables traitées. Mais attention : un coefficient très élevé calculé sur un peu de données est moins significatif qu’un coefficient plus faible mais calculé sur un grand nombres de données ! Pr. Amale LAHLOU
S5 : Sciences Economiques
139
• Coefficient de détermination ajusté : Sur un échantillon de petite taille, il est préférable d’introduire le nombre de variable explicatives k dans la
formule de R2, soit donc
Ra2 l’indicateur qui élimine l’explication du
phénomène dû au hasard par les variables explicatives. SCR n k 2 228,56 6 Ra2 1 Ra2 1 Ra2 0, 4171 SCT n 1 457,50 7 Le pouvoir explicatif du modèle yˆi 7,62 + 0,82 xi est seulement 41,71 %. Sortie EXCEL :
Pr. Amale LAHLOU
S5 : Sciences Economiques
140
4. Validité globale du modèle, Analyse de la variance pour la régression et le test de Fisher : Permet d’introduire la taille de l’échantillon dans l’appréciation de la qualité de l’ajustement : Source de variation
Degrés de liberté
Sommes des carrées 8
1
Régression linéaire
( yˆ
t
t 1
228,94 8
Résidu
y )2
(y n2 6 t 1
t
yˆt ) 2
Moyenne des carrées
la valeur Fisher théorique lue sur la table de MCE R2 F n 2 Fisher-Snédécor MCR 1 R2 228,94 228, 94 à un seuil de F 6,01 38,10 confiance α : F1,n2 F10,,605 5,99
38,10
il y’a 5 chances sur 100 de trouver un F 8 observé supérieur à 5,99 lorsque, dans la 2 ( yt y ) population totale des observations n 1 7 Total t 1 possibles, aucune relation n’existe entre 457, 50 les deux variables. * Ainsi, on compare la valeur empirique F avec la valeur théorique : Pour α = 5%, F * 6,01 F10,,605 5,99 c’est-à-dire, dans l’ensemble le modèle 228,56
est significatif. Mais attention, les deux valeurs sont proches ! Pr. Amale LAHLOU
S5 : Sciences Economiques
141
Tests de signification global e du modèle
yˆi 7,62 + 0,82 xi
pour 5% on a : F10,,605 5,99
F * 6,01 t6 2
2
,8
On rejette l’hypothèse nulle :
F * F10,,605
2,4848
2
0,025 0,05 6,01 5,99 0,05 8,81 5,99 p value 0,049822 5 % p value
i 1,
p value Mais attention : p value
! Pr. Amale LAHLOU
S5 : Sciences Economiques
142
5. Validité de la propension marginale et Test de Student : On définit l’écart-type des erreurs du modèle avec : ˆ ˆ2 1 n 2 SCR 228,56 2 ˆ ˆ e 38, 09 t n2 n 2 t 1 6 2
ˆ 6,17
2 On définit l’erreurs standard sur aˆ0 avec : ˆ aˆ ˆ aˆ 0
0
1 21,502 x2 2 2 1 2 ˆ aˆ0 38, 09 ˆ aˆ0 ˆ n 56,55 2 340 n 8 x x t t 1
ˆ aˆ 7,52 0
On définit l’erreurs standard sur aˆ1 avec : ˆ aˆ ˆ a2ˆ 1
ˆ 2 aˆ1
ˆ2 n
x x t 1
Pr. Amale LAHLOU
2
ˆ a2ˆ1
38, 09 0,11 340
1
ˆ aˆ 0,33 1
t
S5 : Sciences Economiques
143
Sous l’hypothèse nulle H 0 : a1 0 on a : ta*ˆ1
aˆ1 a1 0,82 t 2, 4848 ˆ aˆ1 0,33 * aˆ1
est le nombre d’écarts-type qui séparent la valeur observée de 0.
pour 5%
on compare ta*ˆ avec la valeur de Student tabulée : 1
ta*ˆ1 2,4848 t6 2 2,447 On rejette ainsi H0.
On peut calculer la p-value par interpolation linéaire :
p value ta*ˆ1 2 P T ta*ˆ1
0, 02 0, 05 2, 4848 2, 447 0, 05 0, 048 0, 05 3,143 2, 447
On peut encore calculer l’intervalle de confiance : il y a 95% de chance pour que le coefficient a1 soit dans cet intervalle : a1 0 IC aˆ1 Pr. Amale LAHLOU
aˆ
2 2 ˆ ˆ ˆ 0,01;1,62 1 aˆ1 t 6 ; a1 aˆ1 t 6
S5 : Sciences Economiques
144
6. Sous l’hypothèse nulle H 0 : a0 0 on a t a*ˆ0
aˆ0 a0 7,62 1,0133 :t ˆ aˆ0 7,52 * aˆ0
est le nombre d’écarts-type qui séparent la valeur observée de 0.
pour 5%
on compare ta*ˆ avec la valeur de Student tabulée : 0
t
* aˆ0
1,0133 t6 2 2,447
On accepte ainsi H0.
On peut calculer la p-value par interpolation linéaire :
p value ta*ˆ0 2 P T ta*ˆ0
0,30 0,50 1.0133 0, 718 0,50 0,358 0, 05 1,134 0, 718
On peut encore calculer l’intervalle de confiance : il y a 95% de chance pour que le coefficient a0 soit dans cet intervalle : a0 0 IC aˆ0 Pr. Amale LAHLOU
aˆ
0
ˆ aˆ0 t6 2 ; aˆ 0 ˆ aˆ0 t6 2 10,78;26,02 S5 : Sciences Economiques
145
Sortie EXCEL
Légère différence de calcul due au arrondies
7. Le modèle est globalement significatif (mais on se trouve dans une zone critique). Pour x9 = 34 on aura :
yˆ39 7,62 + 0,82 34 35,5
Pr. Amale LAHLOU
S5 : Sciences Economiques
146
Espérance nulle et normalité
et ˆ et
Le modèle estimé de régression linéaire simple est : yˆi 7, 61 0,82 xi i 1,8 Il suffit de remplacer les xi dans l’équation pour calculer les valeurs prédites. Le résidu est calculé via la formule : Soit ˆ e t
SCR ˆ n 1
et yt yˆt
n2 5, 71409138 n 1
variance des et. On suppose la normalité des résidus Pr. Amale LAHLOU
S5 : Sciences Economiques
un estimateur sans biais de la
et ˆ et
N 0,1 147
Exercice On cherche à appréhender une relation entre deux variables quantitatives à savoir le PIB (en tant que variable à expliquer) et le montant des dépenses de la dette (en tant que variable explicative) : Années
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 Pr. Amale LAHLOU
PIB (Millions de DH) 426 402,00 397 781,90 419 485,20 505 015,00 527 679,00 577 344,00 616 254,00 688 843,00 732 449,00 764 031,00 808 607,00 828 169,00
Montant des dépenses de la dette (Millions de DH) 20 467,30 18 297,97 15 520,95 17 170,51 17 413,41 18 475,01 19 103,87 18 598,76 17 578,78 17 572,71 18 597,96 19 876,06
S5 : Sciences Economiques
148
Questions 1. Représenter graphiquement le nuage des points et donner le modèle de régression y a0 a1 x par le méthode des moindres carrées. Interpréter le résultat. 2. Calculer les différents dispersions selon la loi des écarts. 3. Déterminer le coefficient de détermination et le coefficient de corrélation. 4. Représenter l’analyse de la variance et le test Fisher 5. S’assurer à l’aide d’un test de Student que la propension marginale est significativement différente de zéro. 6. Déterminer l’intervalle de confiance du paramètre a0. 7. Prévision de la variable dépendante pour la valeur x = 34 et l’intervalle de prédiction de cette prévision. Pr. Amale LAHLOU
S5 : Sciences Economiques
149
Annexe
L’utilitaire d’analyse sous Excel • L’Utilitaire d’analyse est un complément (macro complémentaire : programme complémentaire qui ajoute des commandes personnalisées ou des fonctions personnalisées à Microsoft Office.) • Cliquez sur le bouton Microsoft Office
, puis sur Options Excel.
• Cliquez sur Compléments, sur Gérer, puis sur Compléments Excel. • Cliquez sur Ok. •
Dans la zone Macros complémentaires disponibles, activez la case à cocher Utilitaire d’analyse, puis cliquez sur OK.
•
Si vous recevez un message vous indiquant qu’il n’est pas installé sur votre ordinateur, cliquez sur Oui pour l’installer.
• Une fois l’Utilitaire d’analyse chargé, la commande Analyse des données apparaît dans le groupe Analyse de l’onglet Données. 151
La régression linéaire et l'utilitaire d'analyse d'Excel Années
xt : revenu moyen par habitant
1 2 3 4 5 6 7 8 9 10
yt : consommation
Étude de la régression linéaire en utilisant « l'utilitaire d'analyse d'Excel »
yt 7 389,99 8 169,65 8 831,71 8 652,84 8 788,08 9 616,21 10 593,45 11 186,11 12 758,09 13 869,62
xt 8 000,00 9 000,00 9 500,00 9 500,00 9 800,00 11 000,00 12 000,00 13 000,00 15 000,00 16 000,00
Exercice page 12 du manuel « Économétrie », RÉGIS BORBONNAIS
Pr. Amale LAHLOU
S5 : Sciences Economiques
152
Pr. Amale LAHLOU
S5 : Sciences Economiques
153
Pr. Amale LAHLOU
S5 : Sciences Economiques
154
Variable X 1 Graphique des résidus Résidus
400 200 0 -200
0,00
5 000,00
10 000,00
15 000,00
20 000,00
Variable X 1
Répartition des probabilités 15000 Y
10000 5000
0
Y
Variable X 1 Courbe de régression 16 000,00 14 000,00 12 000,00 10 000,00 8 000,00 6 000,00 4 000,00 2 000,00 0,00
0
20
40
60
80
100
Centile
Y Prévisions pour Y
0,00
5 000,0010 000,0015 000,0020 000,00
Variable X 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
155
B4 : Coefficient de détermination multiple R R 2 0,99789618672873 En régression linéaire simple, R est exactement le coefficient de corrélation linéaire r B6 : Coefficient de détermination R2 . Il exprime la part de la variation expliquée par le modèle dans la variation totale. C 39130928, 8 SCE SCR R 2 16 0,995796799488 R2 1 C18 39296098,18 SCT SCT B8 : Coefficient de détermination R2 ajusté . Il dépend du nombre de variables explicatives Ra2 1
n 1 SCR 9 165169, 3825 1 0, 995271399 n 2 SCT 8 39296098,18
B8 : Erreur type, c’est l’estimation par n
B11 : taille de l’échantillon
Pr. Amale LAHLOU
ˆ
e t 1
2
t
n2
SCR n2
C17 B11 2
S5 : Sciences Economiques
165169, 3825 =143,6877615265 8
156
B16 : degré de liberté est 1 B17 :degré de liberté est n-2 (n étant la taille de l’échantillon B11) B18 : degré de liberté é est n - 1 = 1+ n - 2
n
ˆt y C16 : somme des carrés expliquée par la régression SCE= y n
C17 : somme des carrés résiduelle SCR= yt yˆ t n
t=1
2
2
t=1
C18 : somme des carrés totale SCT= y t y =SCE SCR 2
t=1
D16 : Moyenne de somme des carrés expliquée C SCE 39130928, 8 MCE 16 39130928, 8 1 B16 1 D17 : Moyenne de somme des carrés résiduelle C SCR 165169, 3825 MCR 17 20646,17282 n2 B17 8
La variable aléatoire F suit la loi de Ficher pour degrés de liberté 1et n-2 E16 : Fischer calculé
D MCE 39130928, 8 F* 16 1895, 311501 MCR D17 20646,17282
R2 F n 2 1 R2
p-value 2 P Tn 2 ta*ˆ1
p-value 8,5489 10-11
à comparer avec α
Pr. Amale LAHLOU
S5 : Sciences Economiques
157
B22 :
D22 :
aˆ0 1176,089634
t * aˆ0
B23 :
aˆ0 ˆ aˆ0
B 22 C22
taˆ0 5, 673920575
aˆ1 0,780982745
D23 :
Donc
ˆ
ta*ˆ1 ˆaa1ˆ
yˆt aˆ0 aˆ1 xt
1
B23 F* C23
taˆ1 43,53517545
E22 : p 2 P Tn 2 ta*ˆ0
2 P Tn 2 5, 67 0, 00046
E23 : p 2 P Tn 2 ta*ˆ1
G22 ou I22 :
aˆ0 tn/22ˆ aˆ0
G23 ou I23 :
aˆ1 tn/22ˆ aˆ1
2 P Tn 2 43,53 8,541011
C22 : écart-type empirique, c’est l’estimation de l’écart type de l’estimateur aˆ0 ou erreur type de aˆ0 1 x2 207, 3920575 ˆ a2ˆ0 ˆ 2 n 2 n xt x t 1 C23 : écart-type empirique, c’est l’estimation de aˆ1 ou erreur type de aˆ1 l’écart type de l’estimateur 2 ˆ ˆ a2ˆ1 n 0, 01793912 2 xt x t 1
Utiles pour déterminer les intervalles de confiances
S5 : Sciences Economiques
158
B29 : les prévisions pour Y donnent les valeurs estimées de la variable expliquée
C29 les résidus sont obtenus par la formule ,
yˆ t aˆ0 aˆ1 xt
et yt yˆt
avec
avec
B22 aˆ0 1176,089634 B23 aˆ1 0,780982745
B22 : B40 yˆt
yt observées 10
xt données
e t 1
ˆ e t
SCR ˆ n 1
t
0
n2 135, 4701208 n 1
D31:D40 Résidus normalisés
et C31 : C40 ˆ et ˆ et
Test de la normalité des résidus : dans une loi normale, 95 % des observations sont situés à moins de
Pr. Amale LAHLOU
S5 : Sciences Economiques
159
Sortie EVIEWS ˆ aˆ
0
ˆ aˆ
1
t a*ˆ0
ta*ˆ1
n
aˆ0
P value t
aˆ1
P value ta*ˆ0
* aˆ1
R2
Ra2
ˆ
y y
SCR
F*
P value F *
Pr. Amale LAHLOU
S5 : Sciences Economiques
160
Variable X 1 Courbe de régression 15 000,00
Le nuage de point de la série doubles
Y
10 000,00 Y
5 000,00
Prévisions pour Y 0,00 0,00
5 000,0010 000,0015 000,0020 000,00 Variable X 1
Variable X 1 Graphique des résidus
Le nuage de point des résidus autour de leur moyenne nulle
300
Résidus
200 100 0 -100
0,00
5 000,00
-200
10 000,00
15 000,00
20 000,00
Variable X 1
Répartition des probabilités 15000 Y
10000 5000 0 0
20
40
60 Centile
80
100
161
Table de la loi de Laplace-Gauss Probabilité de trouver une valeur inférieure à z P( z ) P Z z 1 p
z
Exemple :
P(1,96) P Z 1,96 0,975 1 0.025 P(1, 65) P Z 1, 65 0,95 1 0.05
Pr. Amale LAHLOU
S5 : Sciences Economiques
162
z
Table bilatérale de la loi T de Student Valeurs de T ayant la probabilité P d’être dépassées en valeur absolue P T t 1 p
Exemple:
P T t p
P T8 2,306 0, 05
PT8 2,306 0,025 Pr. Amale LAHLOU
S5 : Sciences Economiques
P T t
p 2 164
Loi de Fisher-Snédécor
P( F t ) p
Exemple : 05 P( F 3,92) 0,05 F(10,,120 ) 3,92
Pr. Amale LAHLOU
S5 : Sciences Economiques
166
Chapitre 2 : Le modèle de régression linéaire multiple I. Le modèle linéaire général A. Présentation B. Forme matricielle
II. Estimation et propriétés des paramètres A. Estimation des coefficients de régression B. Hypothèses et propriétés des estimateurs C. Équations d’analyse de la variance et qualité d’ajustement Pr. Amale LAHLOU
S5 : Sciences Economiques
169
III. Les tests statistiques A. Le rôle des hypothèses B. Conséquences de l’hypothèse de normalité des erreurs
IV. L’analyse de la variance A. Construction du tableau d’analyse de la variance B. Autres tests à partir du tableau d’analyse de la variance
V. L’utilisation des variables indicatrices A. Construction et finalités des variables indicatrices B. Exemples d’utilisation Pr. Amale LAHLOU
S5 : Sciences Economiques
170
VI. La prévision à l’aide du modèle linéaire général et la régression récursive A. Prédiction conditionnelle B. Fiabilité de la prévision et intervalle de prévision C. Les tests de de stabilité par la régression récursive
Exercices récapitulatifs
Pr. Amale LAHLOU
S5 : Sciences Economiques
171
I.
Le modèle linéaire général
Présentation : Le modèle linéaire général s’écrit : pour t 1,
,n
yt a0 a1 x1t a2 x2t
à k variables explicatives
ak xkt t
n
:
Nombre d’observations (taille de l’échantillon)
yt
:
Variable quantitative à expliquer au temps t. Elle est entachée d’une erreur additive ɛt
x1t x2t x3t
: : :
Variable certaine quantitative ou binaire explicative 1 au temps t Variable certaine quantitative ou binaire explicative 2 au temps t Variable certaine quantitative ou binaire explicative 3 au temps t ….
xkt
:
Variable certaine quantitative ou binaire explicative k au temps t
a0, a1, …,ak : Paramètres du modèle ɛt
:
Erreur de spécification (différence entre le modèle vrai et le modèle spécifié), cette erreur de nature aléatoire est inconnue et restera inconnue. Elle suit une loi de probabilité.
Pr. Amale LAHLOU
S5 : Sciences Economiques
172
Forme matricielle Pour t 1,
y1 y 2 ,n yt yn
a0 a1 x11 a2 x21
ak xk 1 1
a0 a1 x12 a2 x22
ak xk 2 2
a0 a1 x1t a2 x2 t
ak xkt t
a0 a1 x1n a2 x2 n
ak xkn n
Soit sous forme matricielle :
Pr. Amale LAHLOU
y1 1 y 2 1 y t 1 y n 1 Y n ,1
x11
x21
x12
x22
x1t
x2t
x1n
x2 n X n , k 1
S5 : Sciences Economiques
xk 1 a0 1 xk 2 a1 2 xkt at t xkn ak n a k 1,1 n ,1
173
II.
Estimation et propriétés des paramètres Soit le modèle linéaire général : pour t 1,
,n
yt a0 a1 x1t a2 x2t ak xkt t Écrit sous forme matricielle : Y X a Le modèle estimé s’écrit : pour t 1,
,n
yt aˆ0 aˆ1 x1t aˆ2 x2t ˆt Ou le résidu et yt y Écrit sous forme matricielle
aˆk xkt et
Yˆ Xaˆ
On applique la méthode des Moindres Carrés Ordinaires pour estimer le vecteur a a0 a1
at
minimise la somme des carrés des erreurs : Pr. Amale LAHLOU
S5 : Sciences Economiques
ak . C’est-à-dire, on T
Min
a0 , a1 ,, ak
2 t 1 t n
174
Géométriquement pour le cas de deux variables explicatives, le modèle de régression présente un hyperplan de dimension 2.
y
et yt yˆt
yt : observation yt= a0+a1x1t+a2x2t+εt
yˆt aˆ0 aˆ1 x1t aˆ2 x2t
aˆ0
(x1t, x2t)
x2
x1
Pr. Amale LAHLOU
S5 : Sciences Economiques
175
n
Min t2 Min 1
2
t 1
t
n
Min Min Y X a t 1
1 2 n Min T t n
T
2 t
Y X a Min S a0 , a1 ,
, at ,
, ak
Or la fonction S peut s’écrire simplement comme : S Y X a Y X a T
S Y T Y Y T Xa aT X T Y aT X T Xa
S Y Y a X Y T
T
T
T
aT X T Y aT X T Xa
S Y T Y 2aT X T Y aT X T Xa Pr. Amale LAHLOU
S5 : Sciences Economiques
176
S e 0 et x e 0 i 1,..., k Condition Nécessaire d’Optimalité : 0 a Ainsi S Y T Y 2aT X T Y aT X T Xa 2 X T Y 2 X T Xa 0 a a n
t 1
C’est-à-dire, Comme
n
t
t 1
it t
X T Xaˆ X T Y
XT X
la matrice carrée d’ordre (k+1) des produits croisés des
variables explicatives est symétrique semi-définie positive (pas de colinéarité parfaite entre deux variables explicatives), alors elle est inversible et on a :
aˆ X X T
1
X TY
aˆ0 étant l’ordonnée à l’origine (toute les valeurs xt sont nulles)
aˆ p étant la variation de y suite à une variation unitaire de la variable xp tandis que les autres variables sont maintenues constantes (c’est une propension marginale). Pr. Amale LAHLOU
S5 : Sciences Economiques
177
Remarque importante Les équations normales sont données par : X T Xaˆ X T Y T T Ce qui implique X Xaˆ Y 0 X e 0 puisque Y Xaˆ e
Ainsi, il existe (k+1) contraintes, e1 1 1 1 0 1 e2 n x1t x1n 0 et 0 x11 x12 t 1 x21 x22 x2t x2 n 0 n et xti et 0 i 1, t 1 x xkt xkn 0 k1 xk 2 en Pr. Amale LAHLOU
S5 : Sciences Economiques
,k
178
T X Soit la matrice symétrique X donnée comme suit :
XTX
XTX
1 x11 x21 x k1
1
1
x12
x1t
x22
x2t
xk 2
xkt
n x1t x2t x kt
Pr. Amale LAHLOU
x x x x
1 x11 1 1 x12 x1n x2 n 1 x1t xkn 1 x1n x
x
x x x
x
x
x2t
1t 2 1t
2t
2 t 1t
kt 1t
x22 x2t x2 n
xk1 xk 2 xkt xkn
x x x
x 1t kt 2 t xkt 2 x kt kt
1t 2 t 2 2t
kt
x21
S5 : Sciences Economiques
179
De plus,
1 x11 X T Y x21 x k1
1
1
x12
x1t
x22
x2t
xk 2
xkt
y1 1 yt y2 x1n x y 1t t x2 n x2t yt yt xkn xkt yt yn
D’où, X T X aˆ X T Y
n x1t x2t x kt Pr. Amale LAHLOU
x x x x
x
x2t
x x x
xkt
x
xkt
1t 2 1t
1t
1t
2t
aˆ0 yt ˆ a x x y 1t kt 1 1t t aˆ2 x2t yt 2 t xkt 2 aˆ x y x kt k kt t kt
1t 2 t 2 2t
2t
x x x
S5 : Sciences Economiques
180
Cas particulier :
• Si les variables sont centrées, alors
1 XTX n
est la matrice de
variance covariance • Si les variables sont centrées réduites, alors la matrice 1 X T X est la n
matrice de corrélation. • Si les variables sont centrées, alors le vecteur 1 X T Y est le vecteur n
des covariances entre Y et X. •
1 T Si les variables sont centrées réduites, alors le vecteur n X Y est le
vecteur des corrélation entre Y et X.
Pr. Amale LAHLOU
S5 : Sciences Economiques
181
En effet, si on travaille avec des données centrées, n x1t x2 t xkt
x x x x
x2 t
x2 t
x x x
xkt
x
xkt
1t 2 1t
1t
1t
x x x
aˆ0 ˆ x 1t kt a1 aˆ2 2 t xkt xkt2 aˆk
2t
1t 2 2t
2t
kt
yt x1t yt x2 t yt xkt yt
ce système est équivalent à :
ˆ0 a ˆ1 x1t a ˆ2 x2t na
ˆk xkt yt a
et
x12t x1t x2 t x x 1t kt Pr. Amale LAHLOU
x x
1t 2 2t
x
2t
x2 t
xkt
xkt aˆ1 x1t yt ˆ x2 t yt 2 t xkt a2 2 xkt aˆk xkt yt
x x
1t
S5 : Sciences Economiques
182
Ou encore
ˆ0 y a ˆ1 x1 a ˆ2 x2 a et
aˆ1 x ˆ a2 x1t x2t aˆk x1t xkt 2 1t
x x
ˆk xk y a
x x
xkt x 2 t kt 2 xkt
x
1t 2 t 2 2t
x
2t
1
1t
xkt
x1t yt x2t yt xkt yt
Si on travaille avec des données centrées, l’estimateur de a s’écrira en fonction des matrices des variances et covariances empiriques : aˆ1 var x1 ˆ a2 cov x2 , x1 aˆk cov xk , x1 Pr. Amale LAHLOU
cov x1 , x2 var x2
cov xk , x2
cov x1 , xk cov x2 , xk var xk
S5 : Sciences Economiques
1
cov x1 , y cov x , y 2 cov xk , y 183
Hypothèses et propriétés des estimateurs Soit le modèle linéaire :
Y X a
Les présentes hypothèses permettent de déterminer les estimateurs
qualifiés de Best Linear Unbiaised Estimator (BLUE) (théorème de Gauss Markov) à l’aide de la méthode des moindres carrés ordinaires. Hypothèses stochastiques (de nature probabiliste, liées à l’erreur) Hypothèses structurelles Pr. Amale LAHLOU
S5 : Sciences Economiques
184
Hypothèses stochastiques : (H1) (H2)
(H3) (H4)
(H5)
: Les valeurs xit sont observées sans erreur (non aléatoires)
E t 0
l’espérance mathématique de l’erreur est nulle : en moyenne le modèle est bien spécifié et donc l’erreur moyenne est nulle 2 2 : E t cste la variance de l’erreur est constante pour tout t (homoscédasticité des erreurs) :
E t t 0 si t t les erreurs sont non corrélées (nonautocorrélation des erreurs) : une erreur à un instant t donnée n’a pas d’influence sur les autres erreurs. : cov x , 0 l’erreur est indépendante des variables it t explicatives :
Pr. Amale LAHLOU
S5 : Sciences Economiques
185
Hypothèses structurelles : (H6) : Absence de colinéarité entre les variables explicatives, Aucune variable explicative n’est linéairement dépendantes des autres, c’est-à-dire la matrice X T X est T inversible ou régulière ou non singulière (det X X 0) (H7) : X T X n tend vers une matrice finie inversible ou non singulière pour n assez grand (H8) : n k 1 le nombre d’observations est supérieur au nombres des séries explicatives
Pr. Amale LAHLOU
S5 : Sciences Economiques
186
Propriétés des estimateurs
Soit l’estimateur aˆ X X T
1
X TY
L’estimateur aˆ est sans biais E aˆ a en effet,
aˆ
aˆ
T X X X Y
T X X X Xa
T X X X Xa X X X
T
T
T
1
Y Xa
1
1
T
T
a X X X T T
1
1
E 0
E aˆ a X X X T E T
1
E aˆ a Pr. Amale LAHLOU
S5 : Sciences Economiques
187
L’estimateur aˆ est convergent : Tout d’abord, calculons la matrice des variances et covariances de l’erreur , noté :
Pr. Amale LAHLOU
E T
1 2 E n
1
12 2 1 E n 1
2
1 2 22 n 2
S5 : Sciences Economiques
n
1 n 2 n n2
188
D’où,
Pr. Amale LAHLOU
E 12 E 2 1 E n 1
E 1 2 E 22 E n 2
2 0 2 0 0 0 2 I n
0 0 2
E 1 n E 2 n 2 E n Hypothèse (H3)
E t2 2 cste Hypothèse (H4)
E t t 0 si t t
I n 2
S5 : Sciences Economiques
189
la matrice des variances covariances des coefficients de régression aˆ est symétrique :
Var aˆ0 Cov aˆ0 , aˆ1 Cov aˆ1 , aˆ0 Var aˆ1 aˆ Cov aˆk , aˆ0 Cov aˆk , aˆ1
Pr. Amale LAHLOU
S5 : Sciences Economiques
Cov aˆ0 , aˆk ˆ ˆ Cov a1 , ak Var aˆk
190
Ainsi,
aˆ ABC
T
AT
T
C T BT AT
A
E aˆ a aˆ a T
E XTX
A symétrique AT A
2 I n
Pr. Amale LAHLOU
aˆ a X X
1
X X X X T
T
T
1
1
T
2
T
2
T
T
T
1
T
T
X T
1
T
1
T
1
X X X E X X X X X X X X X X X X X X X X X 1
T
T
T
1
E T
1
S5 : Sciences Economiques
191
Nous retenons donc,
Nous supposerons que :
aˆ
aˆ X X 2
T
1
N 0, aˆ N 0, X X 2
ˆ ˆ ˆ 2 X T X On peut estimer aˆ par a
T
1
1
avec
n
ˆ 2
2 e t
T e e t 1 (voir diapositive suivant) n k 1 n k 1
Où, e Y Yˆ
Remarquons que lorsque n est assez grand,
ˆ 2
tend vers 0 et par
ˆest convergent. suite l’estimateur a Pr. Amale LAHLOU
S5 : Sciences Economiques
192
T e e 2 Montrons que ˆ n k 1 e Y Yˆ Xa Xaˆ
Xa X a X
X X X
I X n
Xa X
T
T
T
1
T
1
a X X
1
X X
X
X T XT
X T 1
X T
Donc, e 1 T X T est une matrice carrée Avec I n X X X symétrique d’ordre n et idempotente 2 en effet,
Pr. Amale LAHLOU
S5 : Sciences Economiques
193
2
In X X X T
In
X
2X X X X X X X X
In 2 X X X T
In
1
T
T
1
In X X X T
X X X
X X X X
1
1
T
T
T
T
T
1
1
1
T
XT
T
X X X X
1
XT
XT
T
Ainsi,
eT e T T T
Et par suite
E eT e E T 2 tr Pr. Amale LAHLOU
S5 : Sciences Economiques
194
E eT e 2 tr
On a
Trace de la matrice
:
n tr X X X X n tr X X X X
tr tr I n X X X Variance de l’erreur
Ainsi,
T
1
T
T
1
T
XT T
1
n tr I k 1
tr n k 1
E e e n k 1 T
2
n
Alors,
Pr. Amale LAHLOU
2 e t
T T e e SCR Y Y 2 t 1 ˆ n k 1 n k 1 n k 1 n k 1 S5 : Sciences Economiques
195
Équation d’analyse de la variance et qualité d’un ajustement Comme pour la régression linéaire simple, les deux équations : n
e t 1
t
0
et
y yˆ
nous permettent d’établir l’équation fondamentale d’analyse de la variance en but de juger la qualité de l’ajustement : n
yt y
2
t 1
n
yˆt y
2
t 1
n
2 e t t 1
SCT SCE SCR On introduit des indicateurs de qualité du modèle sans dimension : n
SCE R SCT 2
yˆt
y
y
y
t 1 n
t 1
Pr. Amale LAHLOU
t
n
2 e t
2
1 2
t 1
n
y t 1
S5 : Sciences Economiques
t
y
2
SCR 1 SCT 196
Coefficient de détermination R2 Coefficient de corrélation multiple R et coefficient de détermination R2a
R2 mesure la proportion de la variance de Y expliquée par la régression de Y sur X. n
SCE R SCT 2
yˆt y
2
y y
2
t 1 n
t 1
t
n
SCR 1 1 SCT
yt yˆt t 1 n
y y t 1
t
n
2 e t
2
2
1
t 1
n
y y t 1
2
t
Dans le cas des données centrées, ce coefficient s’écrit : T ˆ T ˆ Y Y e e 2 R T 1 T Y Y Y Y Pr. Amale LAHLOU
S5 : Sciences Economiques
197
Lorsque le nombre de variables explicatives augmentent (même
s’elles ne sont pas pertinentes), le coefficient de détermination R2 augmente automatiquement. On doit tenir compte du degré de liberté (nombres de facteurs explicatifs), d’où le R2 ajusté un indicateur plus robuste :
R 1 2 a
SCR
n k 1 1 n 1 1 R2 SCT n k 1 n 1
Bien noté que Ra2 R 2 mais si n est assez grand Ra2
R2
2 R Attention : ne pas interpréter a en termes de part de variance
expliquée. Pr. Amale LAHLOU
S5 : Sciences Economiques
198
(R.B. C3EX1, eco9, page 56) Soit le modèle à trois variables explicatives :
yt a0 a1 x1t a2 x2t a3 x3t t
Pr. Amale LAHLOU
t
yt
x1
x2
x3
1
12
2
45
121
2
14
1
43
132
3
10
3
43
154
4
16
6
47
145
5
14
7
42
129
6
19
8
41
156
7
21
8
32
132
8
19
5
33
147
9
21
5
41
128
10
16
8
38
163
11
19
4
32
161
12
21
9
31
172
13
25
12
35
174
14
21
7
29
180
S5 : Sciences Economiques
199
Question 1 : Mettre le modèle sous forme matricielle en spécifiant bien les dimensions de chacune des matrices L’écriture sous forme matricielle : Y X a
Avec,
12 1 2 14 1 1 10 1 3 Y X 25 1 12 21 14,1 1 7 Pr. Amale LAHLOU
45 121 1 43 132 a0 2 3 a1 43 154 a et a2 13 a3 4,1 35 174 29 180 14,4 14 14,1 S5 : Sciences Economiques
200
Question 2 : Estimer les paramètres du modèle.
1
X Y D’après le cours, aˆ X X T Nous devons calculer la matrice symétrique X X d’ordre 4 et 1 son inverse X T X puis X T Y :
1 1 1 3 1 2 T X X 45 43 43 121 132 154 n x1t T X X x2t x3t Pr. Amale LAHLOU
x x x x
T
1 2 1 1 1 1 7 1 3 12 35 29 174 180 1 12 1 7
x x x x
x
1t 2 t
x
1t 3t
45 121 43 132 43 154 35 174 29 180
x x x x
14 2094 532 85 x 13132 3126 631 85 1t 3t 532 3126 20666 78683 2 t x3t 2 317950 78683 13132 2094 3t 3t
2t
1t 2 1t
T
x
1t 2 t 2 2t
x
2 t 3t
S5 : Sciences Economiques
201
Ainsi,
X
X
T
T
X
X
1
1
1
85 532 2094 14 85 631 3126 13132 532 3126 20666 78683 2094 13132 78683 317950 0, 015066 0, 231450 20,168645 0, 015066 0, 013205 0, 001194 0, 231450 0, 001194 0, 003635 0, 076175 0, 000940 0, 000575
puis 1 1 1 2 1 3 T X Y 45 43 43 121 132 154 Pr. Amale LAHLOU
0, 076175 0, 000940 0, 000575 0, 000401
12 1 1 14 yt 248 12 7 10 x1t yt 1622 9202 x y 35 29 2t t x y 174 180 25 37592 3t t 21
S5 : Sciences Economiques
202
aˆ X T X X T Y 1
20,168645 0, 015066 0, 015066 0, 013205 aˆ 0, 231450 0, 001194 0, 076175 0, 000940 32,89132428 0,80190068 aˆ 0, 38136236 0, 03713243
0, 231450 0, 001194 0, 003635 0, 000575
Soit donc, aˆ0 32,89132428
aˆ2 0, 38136236 Ainsi,
Pr. Amale LAHLOU
0, 076175 248 0, 000940 1622 0, 000575 9202 0, 000401 37592
aˆ1 0,80190068 aˆ3 0, 03713243
yˆt 32,89 0,80 x1t 0,38 x2t 0, 04 x3t S5 : Sciences Economiques
203
Question 3 : Calculer l’estimation de la variance de l’erreur ainsi que les écarts types de chacun des coefficients. 2 Calculons tout d’abord ˆ , soit la formule :
2 ˆ
avec
e Y Yˆ
eT e n k 1
Soit donc en calculant les résidus et (voir la diapositive suivante) : n
ˆ 2 Pr. Amale LAHLOU
2 e t t 1
14 3 1
n
2 e t t 1
10
S5 : Sciences Economiques
6,745
204
yˆt 32,89 0,80 x1t 0,38 x2t 0, 04 x3t t
yt
x1
x2
x3
ˆt y
et
et2
1
12
2
45
121
12,84
-0,84
0,71
2
14
1
43
132
12,39
1,61
2,58
3
10
3
43
154
13,18
-3,18
10,11
4
16
6
47
145
14,39
1,61
2,58
5
14
7
42
129
17,70
-3,70
13,67
6
19
8
41
156
17,88
1,12
1,26
7
21
8
32
132
22,20
-1,20
1,44
8
19
5
33
147
18,86
0,14
0,02
9
21
5
41
128
16,51
4,49
20,14
10
16
8
38
163
18,76
-2,76
7,63
11
19
4
32
161
17,92
1,08
1,17
12
21
9
31
172
21,90
-0,90
0,81
13
25
12
35
174
22,71
2,29
5,27
14
21
7
29
180
20,76
0,24
0,06
0,00
67,45
somme Pr. Amale LAHLOU
S5 : Sciences Economiques
205
Maintenant, déterminons la matrice des variances et covariances estimées des coefficients de la régression linéaire : soit la formule
ˆ ˆ ˆ 2 X T X a
Donc
20,168645 0, 015066 ˆ aˆ 6,745 0, 231450 0, 076175
Ainsi,
1
0, 015066
0, 231450
0, 013205
0, 001194
0, 001194
0, 003635
0, 000940
0, 000575
0, 076175 0, 000940 0, 000575 0, 000401
ˆ aˆ 6,745 20,168645 11,66 0
ˆ aˆ 6,745 0, 013205 0,30 1
ˆ aˆ 6,745 0, 003635 0,16 2
ˆ aˆ 6,745 0, 000401 0,05 3
Pr. Amale LAHLOU
S5 : Sciences Economiques
206
Question 4 : Calculer le R2 et le R2 ajusté. Soit les deux formules : n
R2
yˆt y t 1 n
y
t
t 1
y
n
2 e t
2
1 2
t 1
n
y t 1
t
y
Ra2 1
et 2
n 1 1 R2 n k 1
Par un simple calcul, n
e 67, 45 2 t
t 1
n
yt y
2
226, 86
t 1
67,45 R 1 0,7027 70,27% 226,86 13 2 Ra 1 1 R 2 0,6135 10 2
D’où, Pr. Amale LAHLOU
S5 : Sciences Economiques
207
III. Les tests statistiques On suppose que iid et N 0, Donc, 2
Ainsi,
t t 2 aˆ0
t
ˆ ˆ ˆ 2 2 2 n aˆ aˆ 2
ˆ 2 aˆ
2 aˆk
2 aˆ1
et
N 0,1 n
ˆ 2
2 e t t 1
Donc, n k 1 2 2 e 2 2 t n ˆ aˆi et ˆ 2 t 1 n k 1 n k 1 n k 1 2 2 2 t 1 aˆi On est en présence d’une somme au carré de (n-k-1) variables aléatoires indépendantes normales centrées réduites (on a k+1 n n contraintes e 0 et x e 0 0
t 1
ˆi ai a ˆ aˆi
t
1
k
it t
t 1
ˆi ai a
aˆ
Tn k 1
i
ˆ n k 1
2 ˆi a 2 ˆi a
n k 1 208
On montre facilement, 2
aˆ a
T
aˆ0 a0 aˆ a ˆ aˆ 0 1 aˆ
aˆk ak ˆ aˆ k
2
2 k 1
la somme au carré de (k+1) variables aléatoires normales centrées réduites, en effet :
aˆ a T aˆ1 aˆ a aˆ0 a0
aˆ0 a0 ˆ a 0
ˆ a0 aˆ k ak ˆ ak 0
Pr. Amale LAHLOU
aˆ0 a0 1 aˆ k ak aˆ aˆ a k k 0 ˆ a0 1 aˆ 0 ˆ ak 0 0
S5 : Sciences Economiques
0 aˆ0 a0 ˆ a0 aˆ a k k ˆ ak 0 ˆ ak 0
209
Avec, D une matrice diagonale : aˆ 0 a0 aˆ a aˆ a ˆ a0 T
Or,
1 aˆ
1 aˆ
1
D D D aˆ D
ˆ aˆ01 0 0 ˆ a2ˆ0 cov aˆ1 , aˆk 0 cov aˆ1 , aˆk 0 1 0 cov aˆ0 , aˆk ˆ 0 ˆ a k
1
aˆ 0 a0 ˆ a0 aˆ k ak 1 D aˆ D ˆ ak aˆ k ak ˆ ak
1
cov aˆ0 , aˆk ˆ aˆ01 0 0 0 I k 1 cov aˆk 1 , aˆk 0 2 1 0 ˆ ˆ aˆk 0 ˆ a k
1 1 D D I k 1 D’où, aˆ Pr. Amale LAHLOU
S5 : Sciences Economiques
210
Ainsi,
aˆ a
T
aˆ0 a0 ˆ aˆ0 aˆk ak ˆ aˆk ˆ ˆ a a ˆ k k a k
aˆ0 a0 aˆ a ˆ aˆ 0 1 aˆ
2
aˆ a
T
aˆ0 a0 aˆ a ˆ aˆ 0 1 aˆ
aˆk ak ˆ aˆ k
2
2 k 1
En remplaçant aˆ la matrice des variances covariances théoriques 1 2 T ˆ des coefficients par son estimateur ˆ X X on obtient : aˆ
1 T ˆ 1 ˆ a a aˆ aˆ a Fk 1,nk 1 k 1 Pr. Amale LAHLOU
S5 : Sciences Economiques
211
En effet,
1 T aˆ a ˆ aˆ 1 aˆ a k 1
1 1 1 T 2 T aˆ a ˆ X X aˆ a k 1 1 1 T T ˆ a a X X aˆ a 2 k 1 ˆ
1 2 T 1 T ˆ a a X X aˆ a 2 2 k 1 ˆ
aˆ a
T
2 k 1
n2 k 1
k 1
n k 1
2 X T X
1
ˆ 2 n k 1 2
aˆ a aˆ 1 aˆ a
1
aˆ a k 1
n k 1
T
Pr. Amale LAHLOU
ˆ 2 n k 1 2
S5 : Sciences Economiques
k 1 F
k 1, n k 1
n k 1
212
Construction des tests Test de conformité à un standard bilatéral ou unilatéral Comparaison d’une valeur ai à une valeur fixée a
Soit le test d’hypothèse bilatéral : aˆi ai On a Tn k 1 ˆ aˆi aˆi ai Sous l’hypothèse nulle, ˆ aˆi Critère de décision : si t
* aˆi
H0 H1
:
ai a
:
ai a
aˆi a ta*ˆi ˆ aˆi
tn2 k 1 ou encore p value nous rejetons l’hypothèse H0,
ai est significativement différent de a au seuil de α
2 Si t tnk 1 ou encore p value nous acceptons l’hypothèse H0,
* aˆi
ai n’est pas significativement différent de a au seuil de α Pr. Amale LAHLOU
S5 : Sciences Economiques
213
Test de signification : comparaison d’une valeur ai à la valeur nulle
L’hypothèse nulle d’un test bilatéral : H 0 : ai 0 pas la constante a0 ). Sous l’hypothèse nulle, aˆi ai aˆi ta*ˆi ˆ aˆi ˆ aˆi Critère de décision :
(on ne prend
le ratio de Student.
Si t tn2 k 1 alors, ai est réellement significativement contributive * pour expliquer la variable endogène au seuil α Mais si taˆi tn2 k 1 On doit éliminer cette variable du modèle et ré-estimer les coefficients du modèle (la cause est due soit à l’absence de corrélation avec la variable endogène soit à l’existence d’une forte colinéarité avec une des variables exogènes) * aˆi
Pr. Amale LAHLOU
S5 : Sciences Economiques
214
Intervalle de confiante au niveau (1-α) : On a,
aˆi ai Tn k 1 ˆ aˆi
L’intervalle de confiance est donnée par :
P Tnk 1 tnk 1 1
P tn2 k 1 Tnk 1 tn2 k 1 1 Soit encore,
Ainsi,
aˆi ai 2 2 P t n k 1 t n k 1 1 ˆ ˆ a i 2 P aˆi t n k 1ˆ aˆi ai aˆi ˆ aˆi t n 2 k 1 1
IC ai aˆi t n k 1ˆ aˆi ; aˆi ˆ aˆi t n 2 k 1 Pr. Amale LAHLOU
2
S5 : Sciences Economiques
215
Test de conformité ensembliste : Comparaison d’un ensemble de paramètres à un ensemble de valeurs fixées
On test simultanément l’égalité d’un sous-ensemble de coefficients de régression à des valeurs fixées. Soit le test d’hypothèse bilatéral:
H0 H 1
:
a q a q
:
a q a q
Avec q le nombres de coefficients retenus. Comme
Alors,
1 aˆ a T ˆ aˆ1 aˆ a Fk 1,nk 1 k 1 1 T ˆ 1 ˆ aq aq aˆq ,q aˆq aq Fq,nk 1 q
ˆ ˆ 1 est la matrice des variances covariances au coefficients retenus a q ,q Pr. Amale LAHLOU
S5 : Sciences Economiques
216
Sous l’hypothèse nulle :
1 aˆq aq T ˆ aˆ1q ,q aˆq aq F*q,nk 1 q
si F*q ,nk 1 Fq ,nk 1 on rejette H0 Intervalle de confiance de la variance de l’erreur un niveau (1-α)%
(n k 1)ˆ 2 (n k 1)ˆ 2 IC 2 ; 2 2 En effet, nk 1,1 2 n k 1, 2 2 (n k 1)ˆ 2 ˆ ( n k 1 ) 2 P 1 2 2 Avec, n k 1; n k 1;1 2 2
P
2 n k 1
Pr. Amale LAHLOU
2 n k 1, 2
2
et
P
2 n k 1
S5 : Sciences Economiques
2 n k 1,1 2
1 2
217
(R.B. C3EX1, eco9, page 55) Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21
Soit donc : Pr. Amale LAHLOU
X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7
X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29
X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180
yˆ t 32,89 0,80x1t 0,38x2t 0,03x3t S5 : Sciences Economiques
218
Question 1 : Les variables explicatives sont-elles significativement contributives pour expliquer la variable endogène ? Soit les trois tests d’hypothèses :
H 0 : a1 0 H 0 : a2 0 H 0 : H : a 0 H : a 0 1 2 1 1 H1 : Nous calculons les trois ratios de Student empirique :
Les seuils choisis seront de 5 %. Pr. Amale LAHLOU
a3 0 a3 0
t
* aˆ1
aˆ1 0,80 2,75 ˆ aˆ1 0,29
t
* aˆ 2
aˆ 2 0,38 2,53 ˆ aˆ2 0,15
t
* aˆ 3
aˆ3 0,03 0,60 ˆ aˆ3 0,05
S5 : Sciences Economiques
219
t a*ˆ1 2,75 2,228 t100,025 a1 0 t
* aˆ 2
2,53 2,228 t
0 , 025 10
a2 0
t a*ˆ3 0,60 2,228 t100,025 a3 0 Donc,
les
deux
variables
explicatives
x1
et
x2
sont
significativement contributives à l’explication de la variable endogène y tandis que la variable explicative x3 n’est pas significativement contributive. On doit retirer cette dernière variable du modèle et ré-estimer les coefficients du modèle.
Pr. Amale LAHLOU
S5 : Sciences Economiques
220
Pour encore mieux voir, déterminons les intervalles de confiances à 95 % de chacun des coefficients :
IC a1 IC a2 IC a3
aˆ t
/2 ˆ ˆ ˆ ; a t 1 1 n k 1 aˆ 0,80 2,228 0,29;0,80 2,228 0,29 0,15;1,44 aˆ2 tn/k21ˆ aˆ ; aˆ2 tn/k21ˆ aˆ 0,38 2,228 0,15;0,38 2,228 0,15 0,71;0,04 aˆ3 t n/k21ˆ aˆ ; aˆ3 tn/k21ˆ aˆ 0,03 2,228 0,05;0,03 2,228 0,05 0,14;0,08
/2 n k 1 aˆ1
On remarque que :
1
2
2
3
3
0 ICa1
; 0 ICa2
et 0 ICa3
Ce qui confirme le fait que la variable explicative x3 n’est pas contributive . Pr. Amale LAHLOU
S5 : Sciences Economiques
221
Question 2 : Le coefficient a1 est-il significativement inférieur à 1 ? Soit le test d’hypothèse unilatéral à gauche :
H0 H1
:
a1 1
:
a1 1
aˆ1 a1 aˆ1 1 0,80 1 0,68 t100,05 1,812 Sous l’hypothèse nulle : ˆ aˆ1 ˆ aˆ1 0,29
On accepte donc H0 : a1 est bien significativement inférieur à 1
Question 3 : Le coefficient a1 et a2 sont-ils simultanément et significativement différents de 1 et -0,5 ? Soit le test d’hypothèse bilatéral :
Pr. Amale LAHLOU
H0 H 1
S5 : Sciences Economiques
: :
a1 1 a 0, 5 2 a1 1 a 0, 5 2 222
Sous l’hypothèse nulle on a : 1 0,80 q 2 ; aq ; aˆq 0,5 0,38 0, 013205 0, 001194 11,571983 3,801060 1 ˆ ˆ aˆq 6,745 aˆq 0, 001194 0, 003635 3,801060 42, 034791 Donc, * q ,n k 1
F
* 2,10
F
1 T aˆ q aq ˆ aˆ1 q , q aˆ q aq q
11,571983 3,801060 0,80 1 1 0,80 1 0,38 0,5 2 3,801060 42,034791 0,38 0,5
F*2,10 0,612 F02,,1005 4,10 On accepte l’hypothèse nulle. C’est possible que les coefficients soient simultanément et respectivement égaux à 1 et -0,5. Pr. Amale LAHLOU
S5 : Sciences Economiques
223
Question 4 : Quel est l’intervalle de confiance pour la variance de l’erreur au niveau de confiance 95 % ?
2 (n k 1)ˆ 2 ˆ (n k 1) 2 P 2 1 2 n k 1, n k 1 , 1 2 2
P 2n k 1 210 ;0, 025 0,025 et
P 2n k 1 210 ;0,975 0,975
210 ;0,025 20,483
210 ;0,975 3,247
IC 2
et
( n k 1)ˆ 2 ( n k 1)ˆ 2 ; 2 2 n k 1,1 2 n k 1, 2 10 6,745 10 6,745 20,483 ; 3,247 3,30;20,75
2 95 % de chance que la variance appartient à cet intervalle Pr. Amale LAHLOU
S5 : Sciences Economiques
224
Pr. Amale LAHLOU
S5 : Sciences Economiques
225
Tests sur les résidus : valeur anormale, effet de levier et point d’influence La matrice HAT notée H permet de passer du vecteur Y au vecteur Yˆ
Yˆ X aˆ X X T X
X YHY H X X X
T
T
Les éléments hi xi X X la matrice
1
1
T
1
XT
xiT de la diagonale principale de
H sont appelés les leviers, il permettent de
déterminent l’influence de l’observation i sur les estimations obtenues par la régression. On montre que : 0 hi 1 n traceH h k 1 i i 1 Pr. Amale LAHLOU
S5 : Sciences Economiques
226
Tests sur les résidus : valeur anormale, effet de levier et point d’influence Le levier d’une observation i est donc anormalement élevé si :
k 1 hi n
H X X X T
1
XT
H
H
0 hi 1 n traceH h k 1 i 1 T T ˆ Y X aˆ X X X X Y H Y i 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
Y
Yˆ 227
IV. L’analyse de la variance n
n
n
t 1
t 1
2 ˆ ( y y ) ( y y ) yt yˆ t t t 2
t 1
SCT Source de variation
Degrés
Sommes des carrés
Moyenne des carrés
k
SCE
SCE MSE k
n-k-1
SCR
de
liberté
Variables explicatives x1,x2, …,xk Résidus
SCE
MSR
2
SCR Fisher
F
F
MSE SCE k MSR SCR n k 1
SCR n k 1
n 1 SCT
Total (y)
MSE SCE k R2 k F MSR SCR n k 1 1 R 2 n k 1
Pr. Amale LAHLOU
S5 : Sciences Economiques
228
Question : Les trois questions suivantes sont équivalentes, – Signification globale du modèle de la régression ? – l’ensemble des variables explicatives a-t-il une influence globale sur la variable à expliquer ? (ou encore aucune variable exogène n’est pertinente pour expliquer Y) – Existe-t-il au moins une variable explicative significative ? H 0 : a1 a2 ... ak 0 Soit le test d’hypothèse : H1 : au moins ai 0 SCE / k n k 1 R2 F 2 SCR / n k 1 k 1 R Critère de décision : Si F * Fk ,nk 1 ou encore p value alors on rejette H0. Dans le cas contraire, on accepte H0 et donc il n’existe aucune relation linéaire significative entre la variable à expliquer et les variables explicatives. Pr. Amale LAHLOU
S5 : Sciences Economiques
229
Autres tests à partir de l’analyse de la variance On cite quatre autres tests via exercice page 69 : Introduction d’une ou plusieurs variables explicatives supplémentaires (question 1)
Stabilité des coefficients du modèle dans le temps (test CHOW) (question 2) Test de restrictions et de contraintes sur les coefficients (question 3) Augmentation de la taille de l’échantillon servant à
estimer le modèle (question 2) Pr. Amale LAHLOU
S5 : Sciences Economiques
230
(R.B. C3EX1, eco9, page 69) Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21 Pr. Amale LAHLOU
X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7
X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29
S5 : Sciences Economiques
X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180 231
On reprend l’exercice page 56 : pour 14 observations on a :
yt 32,89 0,80x1t 0,38x2t 0,03x3t et ˆ 2,59 ˆ aˆ 0,29
RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 10 Total 13
Constante Variable X 1 Variable X 2 Variable X 3
Somme des carrés 159,4094768 67,44766603 226,8571429
Coefficients Erreur-type Statistique t 32,89132428 11,66331015 2,820067705 0,801900688 0,29843584 2,687012017 -0,381362364 0,156580689 -2,43556448 -0,037132436 0,052023125 -0,71376789
1
0,838264046 0,702686611 0,613492594 2,597068848 14 Moyenne des carrés 53,13649228 6,744766603
Probabilité 0,018158598 0,022816428 0,035114399 0,49169355
F 7,878181026
Limite inférieure pour seuil de confiance = 95% 6,903849912 0,136944201 -0,73024588 -0,153047181
ˆ aˆ 0,15 2
ˆ aˆ 0,05 3
R 2 0,702 Valeur critique de F 0,005452305
Limite supérieure pour seuil de confiance = 95% 58,87879865 1,466857174 -0,032478849 0,078782309 232
Question 1 : L’ajout des variables explicatives x2 et x3 améliore t-il significativement la qualité de l’estimation par rapport à x1 seul ? On testera tout d’abord la signification globale du modèle de régression à 3 variables (test de Fisher) : H 0 : a1 a2 a3 0 H1 : au moins ai 0 Soit,
R2 k 0, 702 3 0,05 F 7,852 > F 3,10 3, 71 2 1 R n k 1 1 0, 702 10
F 7,878181026
Valeur critique de F 0,005452305
On rejette H0. La régression est globalement significative Pr. Amale LAHLOU
S5 : Sciences Economiques
233
Le test d’ajout de variables suplémentaires se fait en quatre étapes :
a. Tout d’abord on calcule, sur le modèle complet, les variabilités
suivantes :
14
SCT3 yt y 226,86 ; 2
t 1 14
SCE3 yˆt y 159, 41 ; 2
t 1 14
SCR3 et2 67, 45 t 1
Régression Résidus Total Pr. Amale LAHLOU
Degré de liberté 3 10 13
Somme des carrés 159,4094768 67,44766603 226,8571429
S5 : Sciences Economiques
234
b. En suite on calcule, sur le modèle à une seule variable explicative x1, les mêmes variabilités : soit le modèle RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression Résidus Total Coefficients
1 12 13
Somme des carrés 117,6588831 109,1982598 226,8571429
Erreur-type
0,720171833 0,518647469 0,478534759 3,016596589 14 Moyenne des carrés 117,6588831 9,099854982
Statistique t
F 12,92975364
Probabilité
Valeur critique de F 0,003674145
Lim inf à 95%
Lim sup à 95%
Constante
11,57116221 1,889095412 6,125239699 5,13541E-05
7,455176897
15,68714753
Variable X 1
1,011808577 0,281386483 3,595796663 0,003674145
0,398720098
1,624897055
Pr. Amale LAHLOU
S5 : Sciences Economiques
235
le modèle estimé est :
yt 11, 57 1, 01x1t et
Avec
ˆ 1 3, 0165 et
;
ˆ aˆ
0
1
1,89 ;
SCR1 e e n 2 ˆ 2 T
SCT1
1
ˆ 0, 28 aˆ1
1
; R12 0,52
12 3.01651 109, 20 2
SCR1 109, 20 227, 48 ; 2 1 R1 1 0, 52
SCE1 SCT1 SCR1 227, 48 109, 20 118, 28 ;
Pr. Amale LAHLOU
S5 : Sciences Economiques
236
Soit le test d’hypothèse :
H 0 : a2 a3 0 H1 : a2 0 ou a3 0 C’est un test d’analyse de la variance : l’ajout de x2 et x3 au modèle implique normalement l’augmentation de SCE1 et la diminution de
SCR1. Ceci est donc équivalent à tester la différence (SCE3- SCE1) estelle significativement
positive
ou
encore
à tester la différence
(SCR1- SCR3) est-elle significativement positive :
H 0 : SCE3 SCE1 0 H 0 : SCR1 SCR3 0 soit ou H1 : SCE3 SCE1 0 H1 : SCR1 SCR3 0
Pr. Amale LAHLOU
S5 : Sciences Economiques
237
c. Tableau d’analyse de la variance pour tester l’ajout d’un bloc de variables explicatives : Source de variation
Variable explicative x1
Degrés de liberté
k’=1
Sommes des carrés
Moyenne des carrés
SCE1 /1
SCE1 118, 28
SCE3
118.28
Variables explicatives x1,x2, x3
k=3
159, 41
Résidus
n-k-1 =10
SCR3
53.14 SCR3 /10
67, 45
6.745
Total (y)
n-1 =13
Pr. Amale LAHLOU
SCE3 / 3
Où k est le nombre de variables explicatives du modèle complet Et k’ est le nombre de variables explicatives du modèle sans l’ajout du bloc d’autres variables explicatives
SCT3 226,86 S5 : Sciences Economiques
238
• On calcule
SCE3 SCE1 F*
SCR3
k k '
n k 1
159.41 117.65 67.45 10
2 3.09 F F k k ', n k 1 2 ,10 4.10
NB. : On compare la différence par rapport à la somme des carrés la plus faible
SCR1 SCR3 F*
SCR3
k k '
n k 1
109.20 67.45 67.45 10
2 3.09 F F k k ', n k 1 2 ,10 4.10
On accepte donc H0 : l’ajout du bloc de variables explicatives x2 et x3 n’améliore pas de manière significative au seuil α = 5 % le pouvoir
explicatif du modèle Pr. Amale LAHLOU
S5 : Sciences Economiques
239
Question 2 : Peut on considérer le modèle (à trois variables explicatives) comme stable sur l’ensemble de la période, ou doit-on procéder à deux estimations, l’une de la période 1 à 7, et l’autre de la période 8 à 14 ? (test de Chow) • Soit le modèle estimé sur une seule période :
yt aˆ0 aˆ1 x1t aˆ2 x2t aˆ3 x3t et
t 1,
,14
• Soit les modèles estimés sur deux périodes :
yt aˆ01 aˆ11 x1t aˆ12 x2t aˆ31 x3t et t 1, , 7 2 2 2 2 ˆ ˆ ˆ ˆ y a a x a x a t 8, ,14 0 1 1t 2 2t 3 x3t et t Soit le test d’hypothèse : AH0 : les coefficients sont significativement stables sur l’ensemble de la période.
RH0 : scinder en deux échantillon n’améliore pas la qualité du modèle.
a0 a1 H0 : a2 a3
a01 a02 1 2 a1 a1 a12 a22 1 2 a3 a3 240
La question est la suivante :
existe-il une signification entre SCR et (SCR1+SCR2) ? où SCR calculée sur l’ensemble de la période (1,…,14) SCR1 calculée sur la sous période (1,…,7) SCR2 calculée sur la sous période (8,…,14)
Pour répondre à la question on doit suivre les étapes suivantes :
Pr. Amale LAHLOU
S5 : Sciences Economiques
241
a. Estimation du modèle sur la sous période (1,…,7), soit donc : yt 25,27 0,774x1t 0,293x2t 0,012x3t et
ˆ 1 3,017
ˆ 0,529 ˆ 0,313 ˆ 0,010
RAPPORT DÉTAILLÉ
1
aˆ1
Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations
ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 3 Total 6 Constante Variable X 1 Variable X 2 Variable X 3 Pr. Amale LAHLOU
Coefficients 25,27560344 0,77391607 -0,29317635 -0,01250322
1
aˆ 2
0,832206399 0,69256749 0,385134981 3,017591447 7
1
aˆ 3
SCR1 27,31 SCT1 88,85
R12 0,692
Somme Moyenne des carrés des carrés F 61,53956844 20,51318948 2,252746437 27,31757442 9,105858139 88,85714286 Erreur-type Statistique t 16,66755127 1,516455719 0,529033324 1,462887185 0,313677004 -0,93464406 0,100808684 -0,12402916
SCE1 61,54
Probabilité 0,226670856 0,239683594 0,418918908 0,909135772
S5 : Sciences Economiques
Valeur critique de F 0,261019353
Lim inf à 95% Lim sup à 95% -27,76798351 78,3191904 -0,909704077 2,457536217 -1,291436571 0,705083872 -0,333321438 0,308315007 242
b. Estimation du modèle sur la sous période (8…,14), soit : yt 62,33 1,228x1t 0,620x2t 0,184x3t et
ˆ 2 2,62
RAPPORT DÉTAILLÉ
ˆ ˆ ˆ
2
Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations
ANALYSE DE VARIANCE Degré de liberté Régression 3 Résidus 3 Total 6 Constante Variable X 1 Variable X 2 Variable X 3
aˆ1
0,737467155 0,543857804 0,087715608 2,628173531 7
2
0,522
2
0,152
aˆ 2
aˆ 3
SCE2 24,70 SCR2 20,72 SCT2 45,43
R12 0,543
Somme Moyenne des carrés des carrés F 24,7066831 8,235561032 1,192298824 20,72188833 6,907296111 45,42857143
Coefficients Erreur-type Statistique t 62,33574076 37,23454453 1,674137325 1,228195674 0,685233191 1,792376215 -0,62083255 0,522362893 -1,18850814 -0,18433866 0,152831028 -1,2061599
Pr. Amale LAHLOU
0,685
Probabilité 0,192697138 0,170981012 0,320142848 0,314201705
S5 : Sciences Economiques
Valeur critique de F 0,444230201
Lim inf 95% Lim sup 95% -56,16119788 180,8326794 -0,952522164 3,408913512 -2,283224408 1,041559307 -0,670715197 0,302037882 243
c. Calcul du Fisher empirique : on prend au dénominateur la plus faible des sommes des carrés
SCR SCR SCR 1
F *
Où,
2
ddln
SCR1 SCR2 ddld
ddln n k 1 n1 k 1 n2 k 1 k 1 4 ddld n1 k 1 n2 k 1 n 2 k 1 6
Ainsi,
67,45 27,31 20,73 F*
27,31 20,73
4 0,606 F 4,53 4, 6
6 On accepte H0 : les coefficients sont significativement stable sur l’ensemble de la période. Pr. Amale LAHLOU
S5 : Sciences Economiques
244
Question 3 : Un économiste suggère que dans ce modèle a1=1 et a2=a3, qu’en pensez vous ? On pose l’hypothèse nulle : H 0 : a1 1 et a2 a3 Sous H0,
yt a0 a1 x1t a2 x2 t a3 x3t t yt a0 x1t a2 x2 t x3t t yt x1t a0 a2 x2 t x3t t zt a0 a2 vt t Nouvelle variable exogène Nouvelle variable endogène
Pr. Amale LAHLOU
S5 : Sciences Economiques
245
Soit donc,
Pr. Amale LAHLOU
t
zt = yt - x1t
vt = x2t + x3t
1
10
166
2
13
175
3
7
197
4
10
192
5
7
171
6
11
197
7
13
164
8
14
180
9
16
169
10
8
201
11
15
193
12
12
203
13
13
209
14
14
209
S5 : Sciences Economiques
246
z t 13,735 0,011 t et
t 1,...,14 n 14 ˆ ' 3,010
ˆ ' 0,051 R ' 0,004 aˆ1
RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 1 Résidus 12 Total 13
Somme des carrés 0,425473883 108,7888118 109,2142857
2
SCE ' 0,425 SCR' 108,79 SCT ' 109,21
0,062416114 0,003895771 -0,07911291 3,010935788 14 Moyenne des carrés 0,425473883 9,065734319
F 0,046932093
Valeur critique de F 0,832129578
Coefficients Erreur-type Statistique t Probabilité Lim inf à 95% Lim sup à 95% Constante 13,73516878 9,691559481 1,417229994 0,181853025 -7,38092533 34,8512629 Variable X 1 -0,01115475 0,051490217 -0,21663816 0,832129578 -0,123342292 0,1010328 Pr. Amale LAHLOU
S5 : Sciences Economiques
247
Soit le test d’hypothèse :
H 0 : SCR SCR H1 : SCR SCR
C’est un test d’analyse de la variance : on calcule le Fisher empirique SCR' SCR ddln * F SCR ddld
Où,
ddln n k '1 n k 1 k k ' 3 1 2 ddld n k 1 14 3 1 10
Ainsi,
108,78 67,45
F*
2 3.06 F 4,10 2,10
67,45 10 Donc, on accepte H0 : les contraintes envisagées sur les coefficients sont compatibles avec les données. Pr. Amale LAHLOU
S5 : Sciences Economiques
248
V.
L’utilisation des variables indicatrices (variables auxiliaires, variables muettes, Dummy)
Une variable explicative est une variable indicatrice : les valeurs sont 0 ou 1. Modification structurelle ; Correction des valeurs anormales ; Intégration des facteurs qualitatifs ;
Intégration de la saisonnalité; …
Pr. Amale LAHLOU
S5 : Sciences Economiques
249
Par exemple, soit le modèle à deux variables explicatives x1t et x2t
yt a0 a1 x1t a2 x2t b0 Dt b1Dt x1t b2 Dt x2t t Avec
Dt 1 le phénomène a lieu Dt 0 le phénomène n' a pas lieu
Si Dt 0 alors le modèle s’écrit,
yt a0 a1 x1t a2 x2t t
Si Dt 1 alors le modèle s’écrit,
yt a0 a1 x1t a2 x2t b0 b1 x1t b2 x2t t a0 b0 a1 b1 x1t a2 b2 x2t t
et si en plus, b1 b2 0 alors,
yt a0 b0 a1 x1t a2 x2t t
Pr. Amale LAHLOU
S5 : Sciences Economiques
250
(R.B. exercice 4, page 76) Correction d’une valeur anormale Un modèle de production de service du secteur du tourisme est spécifié de la manière suivante : QPS t a0 a1VAt a2 POPt t Avec, QPSt : Production du Secteur tourisme pour l’année t ; V At : Valeur Ajoutée du secteur tourisme pour l’année t ; POPt : P0Pulation pour l’année t .
L’économètre chargé de l’estimation de ce modèle sur 18 ans s’interroge sur la perturbation entraînée par l’effet d’une guerre pour l’année 16. Pour répondre à cette question, il intègre à son modèle de base une variable indicatrice Dt tel que : Dt 0 pour t 1 à 15 et t 17 à 18 Dt 1 pour t 16 Questions : L’effet « guerre » a-t-il une influence significative sur la
production du service du secteur du tourisme ? 251
L’estimation du modèle économétrique est la suivante :
QPS t 2340,4 23,5 VAt 0,3 POPt 120,56 Dt t
n 18
R 2 0,65
t a*ˆ0 4,5
t a*ˆ1 2,2
t a*ˆ 2 2,9
tb*ˆ 5,8 0
On calcule le ratio de Student empirique de la variable Dt Dummy tb*ˆ 5,8 t180,0531 t140, 05 2,14 0
On rejette H0 : le coefficient de régression de la variable Dummy est significativement différent de 0. la production de service pour l’année 16 est donc anormalement basse (−120,56). Cette baisse est sans doute imputable à l’effet de la guerre. Pr. Amale LAHLOU
S5 : Sciences Economiques
252
(R.B. exercice 5, page 77) Intégration d’une variable qualitative Afin de déterminer les facteurs explicatifs de la réussite de la Licence en Sciences Économiques, on spécifie le modèle suivant :
NLi a0 a1 NDi a2 DSi i Avec, NLi : Note moyenne obtenue en Licence, pour l’étudiant i ; NDt : Note moyenne obtenue en fin de Deuxième année, pour l’étudiant i; DSi : variable indicatrice de genre, pour l’étudiant i.
DSi 1 pour les hommes DSi 0 pour les femmes
Question : Le fait d’être homme ou femme a-t-il une influence sur la note obtenue en Licence de Sciences Économiques ? 253
L’estimation du modèle économétrique est la suivante :
NLi 8,5 0,3 NDi 1,2 DSi et
n 60
R 2 0,72
t a*ˆ0 4,5
t a*ˆ1 7,1
tb*ˆ 2,3 0
On calcule le ratio de Student empirique de la variable Dummy DSi 0 , 05 0 , 05 tb*ˆ 2,3 t60 t 1,96 2 1 57 0
On rejette H0 : le coefficient de régression de la variable Dummy est significativement différent de 0. le facteur sexe est un facteur discriminant de la note obtenue en Licence. Pr. Amale LAHLOU
S5 : Sciences Economiques
254
(R.B. exercice 6, page 79) Analyse de saisonnalité :
Une entreprise cherche à appréhender une relation entre ses ventes et ses dépenses publicitaires. Le directeur du marketing dispose des données de ventes et de dépenses publicitaires sur 5 ans par trimestre. 1. Ce directeur du marketing commence par estimer la relation : Vt a0 a1 Pubt t
Commenter les résultats obtenus : La publicité a-t-elle un effet significatif sur les ventes ? 2. Tracer le graphique de la série des ventes, que pouvez-vous en conclure ? 3. Spécifier et estimer le modèle adéquat. 255
Ventes et dépenses publicitaires pendant 5 ans par trimestre
Années 1 2 3
4 5
T1
T2
T3
T4
Vente
164
198
85
179
Pub
34
36
32
29
Vente
168
201
98
197
Pub
45
67
76
75
Vente
197
209
100
216
Pub
75
78
72
75
Vente
223
245
119
260
Pub
78
81
84
83
Vente
298
309
124
267
Pub
89
82
81
83
Pr. Amale LAHLOU
Date T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
VENTES PUB 164 34 198 36 85 32 179 29 168 45 201 67 98 76 197 75 197 75 209 78 100 72 216 75 223 78 245 81 119 84 260 83 298 89 309 82 124 81 267 83 256
RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations
Vt 104,889 1,29 Pubt et 0,400542526 0,160434315 0,113791777 61,1586794 20
n 20 R 2 0,16 ˆ aˆ1 1,85
ANALYSE DE VARIANCE Degré Somme Moyenne Valeur de liberté des carrés des carrés F critique de F Régression 1 12865,63682 12865,63682 3,439656622 0,080105841 Résidus 18 67326,91318 3740,384066 Total 19 80192,55
Constante Variable X 1
Coefficients Erreur-type Statistique t Probabilité Lim inf à 95% Lim sup à 95% 104,8959227 49,35643393 2,125273533 0,047665411 1,201903004 208,5899424 1,298215163 0,699985643 1,854631128 0,080105841 -0,1724001 2,768830426
On calcule le ratio de Student empirique de la variable dépenses publicitaires : 0, 05 0, 05 ta*ˆ0 1,85 t20 t 2,10 11 18
On accepte H0 : le coefficient de régression de la variable Pub n’est pas significativement différent de zéro. la publicité n’a pas, a priori, d’impact sur les ventes. 257
On remarque que : la série des ventes est fortement saisonnière avec un creux très affirmé au troisième trimestre la variable publicité ne semble pas affectée de variations saisonnières. Ainsi, le mouvement saisonnier vient occulter l’estimation économétrique. Il convient donc d’intégrer ce mouvement saisonnier à l’aide de variables Dummy. 350 300 250 200 Ventes 150
Publicité
100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pr. Amale LAHLOU
258
En tenant compte du mouvement saisonnier, le modèle s’écrit :
Vt a0 a1 Pubt a2 D1t a3 D2t a4 D3t t Avec
.
Pr. Amale LAHLOU
D1t 1 D1t 0 D2t 1 D2t 0 D3t 1 D3t 0
premier trimestre de l' année t les autres deuxième trimestrede l' année t les autres troisièmetrimestrede l' année t les autres
S5 : Sciences Economiques
259
Avec l’introduction de D4t les vecteurs de la matrice X sont colinéaire :
1 Pubt
1 1 D1t D2t D3t D4t 1 1 La matrice sera non inversible 1 1 On supprime alors D4t 1 1 1 1 1 X 1 1 1 1 1 1 1 1 1 1 Pr. Amale LAHLOU
D1t
D2t
D3t
34
1
0
0
36
0
1
0
32
0
0
1
29
0
0
0
45
1
0
0
67
0
1
0
76
0
0
1
75
0
0
0
75
1
0
0
78
0
1
0
72
0
0
1
75
0
0
0
78
1
0
0
81
0
1
0
84
0
0
1
83
0
0
0
89
1
0
0
82
0
1
0
81
0
0
1
83
0
0
0
S5 : Sciences Economiques
D4t 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 260
Introduction des variables indicatrice pour une désaisonnalisation trimestrielle Date T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 Pr. Amale LAHLOU
VENTES 164 198 85 179 168 201 98 197 197 209 100 216 223 245 119 260 298 309 124 267
PUB 34 36 32 29 45 67 76 75 75 78 72 75 78 81 84 83 89 82 81 83
D1t 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0
S5 : Sciences Economiques
D2t 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0
D3t 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 261
Vt 129,101 1,372 Pubt 7,212 D1t 8,874 D2t 118,6 D3t et n 20 R 2 0,83 RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple 0,912099225 Coefficient de détermination R^2 0,831924996 Coefficient de détermination R^2 0,787104995 Erreur-type 29,97594943 Observations 20 ANALYSE DE VARIANCE Degré de liberté Régression 4 Résidus 15 Total 19
Constante Variable X 1 Variable X 2 Variable X 3 Variable X 4
Coefficients 129,1013935 1,372443573 -7,21227085 8,874488715 -118,6
Pr. Amale LAHLOU
Somme des carrés 66714,18684 13478,36316 80192,55
Erreur-type 27,31974281 0,344993551 19,0306398 18,9585806 18,95845504
Moyenne des carrés 16678,54671 898,5575441
Statistique t 4,725571333 3,978171681 -0,37898205 0,468098794 -6,25578401
t a*ˆ1 3,97
t a*ˆ 2 0,37
t a*ˆ3 0,46
t a*ˆ 4 6,25
F 18,56146757
Valeur critique de F 1,12455E-05
Probabilité Lim inf à 95% Lim sup à 95% 0,000270728 70,87074032 187,3320466 0,001211965 0,63710723 2,107779916 0,710011936 -47,77511921 33,35057751 0,646443204 -31,53476911 49,28374654 1,5395E-05 -159,0089902 -78,1910098
S5 : Sciences Economiques
262
On recalcule
publicitaires :
le ratio de Student empirique de la variable dépenses 0, 05 0, 05 ta*ˆ1 3,97 t20 t 2,13 41 15
On rejette H0 : le coefficient de régression de la variable Pub est significativement différent de zéro. la publicité a un impact sur les ventes. C’est bien une variable explicative des ventes. On remarque que D3t est la seule variable indicatrice explicative. Ainsi, la saisonnalité des ventes est liée essentiellement au creux du troisième trimestre.
t a*ˆ 2 0,37 t150,05 2,13 t a*ˆ3 0,46 t150,05 2,13 t a*ˆ 4 6,25 t150, 05 2,13
Pr. Amale LAHLOU
S5 : Sciences Economiques
263
VI.
La prévision à l’aide du modèle linéaire général et la régression récursive Soit le modèle général estimé : yt aˆ0 aˆ1 x1t aˆk xkt et
La prévision pour un horizon h est donnée par : yˆ h aˆ0 aˆ1 x1h aˆk xkh la notation matricielle yˆ h X h aˆ avec X h 1 x1h
xkh
T
L’erreur de prévision calculée à l’horizon h est égale à :
eh yh yˆ h X h a h X h aˆ X h a aˆ h
E eh E X h a aˆ h X h E a aˆ E h 0
e2 Var X h a aˆ h X hVar a aˆ 2C ov X h a aˆ h Var h h
Pr. Amale LAHLOU
yˆi* yˆ xi* aˆ0 aˆ1 x1i* S5 : Sciences Economiques
aˆk xki* X i*aˆ 264
(R.B. exercice 7, C3EX1, page 83) On a montré que :
yt 32,89 0,80x1t 0,38x2t 0,03x3t et Puis on a montré que la variable x3 n’est pas explicative de la variable y. 1. Estimer le modèle à deux variables explicatives :
yt a0 a1 x1t a2 x2t t 2. Calculer une prévision et son intervalle à 95 % pour les périodes 15 et 16, sachant
x115 3;
x116 6;
x215 24;
x216 38
Y 12 14 10 16 14 19 21 19 21 16 19 21 25 21
X1 2 1 3 6 7 8 8 5 5 8 4 9 12 7
X2 45 43 43 47 42 41 32 33 41 38 32 31 35 29
X3 121 132 154 145 129 156 132 147 128 163 161 172 174 180
265
1. n 14 R 2 0,687 ˆ 2,538
yt 25,842 0,715 x1t 0,328 x2t et ˆ aˆ 0,266 1
ˆ aˆ 0,134 2
0 , 025 t a*ˆ1 2,685 t140,025 t 2,20 2 1 11
t a*ˆ 2 2,438 t110, 025 2,20
RAPPORT DÉTAILLÉ Statistiques de la régression Coefficient de détermination multiple Coefficient de détermination R^2 Coefficient de détermination R^2 Erreur-type Observations ANALYSE DE VARIANCE Degré de liberté Régression 2 Résidus 11 Total 13
Somme des carrés 155,973257 70,88388582 226,8571429
Coefficients Erreur-type Constante 25,8421378 6,064674439 Variable X 1 0,714895936 0,26626382 Variable X 2 -0,32811294 0,134561217 Pr. Amale LAHLOU
Les deux variables sont bien explicatives de la variable y
0,829180044 0,687539546 0,630728555 2,538501452 14 Moyenne des carrés 77,98662852 6,44398962
Statistique t 4,261092341 2,684915789 -2,43839158
F 12,10222752
Valeur critique de F 0,001664841
Probabilité Lim inf à 95% Limsup à 95% 0,001340548 12,49387937 39,19039623 0,021221023 0,128853218 1,300938653 0,032916444 -0,624280181 -0,031945698
S5 : Sciences Economiques
266
2. La prévision ponctuelle pour les périodes 15 et 16 : yˆ15
25,84 0,71 x1t 0,33 x2t
25,84 0,71 3 0,33 24 20,05
yˆ16
25,84 0,71 x1t 0,33 x2t
25,84 0,71 6 0,33 38 17,56
Les variances de l’erreur de prévision sont données par :
ˆ 215 ˆ 2 X 15T X T X X 15 1 1
ˆ 216 ˆ 2 X 16T X T X X 16 1 1
nx1 nx2 14 n 85 532 14 14 T 2 X X nx1 x1t x1t x2t 85 631 3126 t 1 t 1 532 3126 20666 14 14 2 nx x2 t 2 x1t x2t t 1 t 1 X15T 1 3 24 et X16T 1 6 38
Avec,
Pr. Amale LAHLOU
S5 : Sciences Economiques
267
Et
Ainsi, ˆ
5,7077 0,1634 0,1222 1 T X X 0,1634 0,0110 0,0025 0,1222 0,0025 0,0028 2 15
ˆ X
X X
1
X 15 1 5,7077 0,1634 0,1222 1 2 2,538 1 3 24 0,1634 0,0110 0,0025 3 1 0,1222 0,0025 0,0028 24 12,4545 2
T 15
T
ˆ 216 ˆ 2 X 16T X T X X 16 1 5,7077 0,1634 0,1222 1 2 2,538 1 6 38 0,1634 0,0110 0,0025 6 1 0,1222 0,0025 0,0028 38 6,6920 Pr. Amale LAHLOU
1
S5 : Sciences Economiques
268
Ainsi les écarts type de l’erreur de prévision sont donnés par : ˆ 215 12,4545 ˆ 15 3,5290 ˆ 216 6,6920 ˆ 16 2,5869
Les intervalles de prévision sont donnés par :
y h yˆ h t n k 1ˆ h yˆ h t nk 1ˆ Ainsi,
IP15
2
IP16
Pr. Amale LAHLOU
2
X
T h
X
T
X
yˆ15 t142 21ˆ 15 ; yˆ15 t142 21ˆ 15
1
X h 1
20,05 2,201(3,5290) ; 20,05 2,201(3,5290) 12,28 ; 27,82
yˆ
16
t142 21ˆ 16 ; yˆ16 t142 21ˆ 16
17,56 2,201(2,5689) ; 17,56 2,201(2,5689) 11,90 ; 23,21 S5 : Sciences Economiques
269
Les tests de stabilité par la régression récursive Le test de Ramsey, aussi appelé le test de RESET (Regression Error Specification Test), porte sur la pertinence de la forme fonctionnelle du modèle, telle que : – une relation fonctionnelle non adaptée (passage aux logarithmes, fonctions inverses…) entre la variable à expliquer et les variables explicatives ; – l’absence d’une variable explicative dans le modèle ; – la corrélation entre la variable explicative et le terme d’erreur ; –… Plutôt que d’estimer des spécifications alternatives (par exemple linéaire ou non linéaire), le test porte sur la significativité d’un ou des coefficients d’une équation intermédiaire dans laquelle figure la série à expliquer ajustée et élevée à la puissance 2, 3, 4… Le test RESET est mené en trois étapes :
Pr. Amale LAHLOU
S5 : Sciences Economiques
270
Pr. Amale LAHLOU
S5 : Sciences Economiques
271