37 0 5MB
COURS D’ECONOMETRIE LICENCE 3 SCIENCES ECONOMIQUES
Dr Omer Kouakou
1
CHAPITRE I GENERALITES SUR L’ECONOMETRIE
I.
Qu’est-ce que l’économétrie ?
C'est dans un article de 1926 qui expose les possibilités d'une mesure empirique de l'utilité marginale que Ragnar FRISCH utilise pour la première fois le terme "econometric". Frisch forge le terme « économétrie » pour désigner une nouvelle branche de l’économie, qui utilise des modèles mathématiques associés à des techniques statistiques pour analyser des données économiques. Frisch fonde en 1931 la société d’économétrie (Econometric society). Deux ans plus tard, il crée la revue Econometrica, l’une des revues scientifiques de référence en économie. Littéralement, l’économétrie se définit comme étant une mesure de l’économie. Wassily LEONTIEF (économiste américain d’origine russe, Prix Nobel 1973) définit l’économétrie comme un type spécial d’analyse économique dans lequel l’approche théorique générale – souvent formulée en termes explicitement mathématiques – se combine fréquemment au moyen de procédures statistiques complexes à la mesure empirique des phénomènes économiques. Jan TINBERGEN (économiste et statisticien néerlandais, Prix Nobel 1969) propose la définition suivante : L’économétrie est une observation statistique de concepts théoriquement fondés, ou économie mathématique travaillant sur données mesurées. L’économétrie pourrait donc être comprise comme une utilisation des mathématiques et de la statistique pour évaluer les relations de la théorie économique. L’économétrie se propose de :
II.
Estimer les relations. Tester les théories. Evaluer les politiques économiques. Prévoir l’évolution des grandeurs économiques.
La modélisation économétrique 1. Le modèle économétrique
Un modèle économétrique est une représentation simplifiée, mais complète, de l’évolution économique d’une société, pendant une période donnée, sous un aspect chiffré. Comme une carte résumant la réalité géographique, la technique des modèles correspond à la cartographie de l’économie. Donc, tout modèle implique une simplification et non une déformation. Dans un modèle, il y a lieu de distinguer : les variables, les relations et les paramètres
2
2. Les données en économétrie Il existe 3 types de données généralement utilisées en Econométrie : les données transversales, les données en série temporelle, les données de panel.
3
3. Les étapes de l’analyse économétrique
4
III.
Etude de la corrélation 1. Importance de l’étude de la corrélation
L’étude de la corrélation permet de déterminer l’intensité ou la force de la relation existant entre variables sous examen. L’étude de la corrélation peut être scindée en deux catégories : l’analyse de la corrélation proprement dite et l’analyse de l’ajustement.
Soit n variable intervenant dans l’étude de corrélation : - Si n = 2 : la corrélation est dite simple ; - Si n > 2 : la corrélation est dite multiple et dans ce cas, elle alimente la matrice de corrélation. Le domaine du coefficient de corrélation « r » est [-1, +1]. Le coefficient de corrélation linéaire, appelé aussi coefficient de Bravais-Pearson a été préalablement étudié par Galton.
5
2.
Coefficients de corrélation et limites
3. Application Ci-après est reprise l’évolution du taux de croissance économique et du taux d’inflation (en moyenne annuelle) en R.D. Congo de 2000 à 2008.
Mesurez l’intensité de la relation entre les variables Yt (taux de croissance) et Xt (taux d’inflation) et dites comment varient-elles ? Résolution Connaissant la formule du coefficient de corrélation, on dégage le tableau suivant qui permet de mesurer l’intensité de la relation existant entre le PIB et l’inflation :
6
En général, plus le coefficient est proche de 1, meilleure est la corrélation. Cependant, c’est le nombre d’observations n, ou plutôt le nombre de degrés de liberté (n - 2 pour une régression simple), qui détermine plus précisément une valeur limite, pour un niveau de risque d’erreur donné, et il existe pour cela des tables du r. Elles sont rarement reprises dans les manuels de statistiques. Le tableau 6 (extrait de la table du coefficient de Pearson) permet de tester si le coefficient « r » est significatif avec un risque de 5% :
7
Table du coefficient de Pearson
Ce tableau indique que pour un niveau de confiance de 0.95, le coefficient de 0,919 est significatif puisqu’il est supérieur { 0.67 (n-2 = 7 degrés de liberté). 4. La statistique de Student et le coefficient de corrélation Par ailleurs, le test t-Student permet également d’évaluer la signification du coefficient de corrélation c’est-à-dire de préciser si la relation entre Y et X n’est pas le fait d’un hasard.
8
5. Détermination du coefficient de corrélation à partir de logiciels
9
CHAPITRE II LA REGRESSION LINEAIRE SIMPLE
I.
Modèle de régression linéaire simple 1. Le Modèle
Nous disposons de n = 10 observations (Figure 1.1) et l’on cherche à expliquer Y le rendement en maïs (en quintal) de parcelles de terrain, à partir de X la quantité d'engrais (en kg) que l'on y a épandu. L'objectif est de modéliser le lien à travers une relation linéaire.
Nous représentons les données ci-dessus dans le graphique ci-dessous :
Le nuage de points présume d’une relation linéaire entre X et Y. Le modèle de régression linéaire simple s'écrit : y i=b +a x i+ ε i
10
y i est la variable que l'on cherche à expliquer (à prédire), on parle de variable expliquée ou variable endogène (dépendante) ; x i est la variable explicative (prédictive), on parle de variable exogène (indépendante). a et b sont les paramètres (les coefficients) du modèle. Dans le cas spécifique de la régression simple, a est la pente, b est la constante. ε i est le terme aléatoire ou terme d’erreur. Il joue un rôle très important dans la régression. Il permet de résumer toute l'information qui n'est pas prise en compte dans la relation linéaire que l'on cherche à établir entre Y et X c.-à-d. les problèmes de spécifications, l'approximation par la linéarité, résumer le rôle des variables explicatives absentes, etc.
Comme nous le verrons plus bas, les propriétés des estimateurs reposent en grande partie sur les hypothèses que nous formulerons à propos de ". En pratique, après avoir estimé les paramètres de la régression, les premières vérifications portent sur l'erreur calculée sur les données (on parle de "résidus") lors de la modélisation. Notre objectif est d’estimer les paramètres a et b. Les n=10 observations ci-dessus sont alors considérées comme un échantillon de n observations i.i.d (indépendantes et identiquement distribuées). Pour y parvenir, on formule les hypothèses ci-dessous. Ces hypothèses pèsent sur les propriétés des estimateurs (biais, convergence) et l'inférence statistique (distribution des coefficients estimés). 2. Les étapes de la modélisation économétrique Les étapes processus de modélisation sont les suivantes: 1. Estimer les valeurs des coefficients ( a , b ) à partir d'un échantillon de données (estimateur des moindres carrés ordinaires). 2. Évaluer la précision de ces estimations (biais, variance des estimateurs). 3. Mesurer le pouvoir explicatif du modèle dans sa globalité (tableau d'analyse de variance, coefficient de détermination). 4. Tester la réalité de la relation entre Y et les exogènes X (test de significativité globale de la régression). 5. Tester l'apport marginal de chaque variable explicative dans l'explication de Y (test de significativité de chaque coefficient). 6. Tester l'apport d'un groupe de variables explicatives dans l'explication de Y (test de significativité simultanée d'un groupe de coefficient). 7. Pour un nouvel individu i* pour lequel on fournit la description ( x i∗1 , … , x i∗ p ), calculer la valeur prédite ^y i∗¿ ¿et la fourchette de prédiction. 8. Interpréter les résultats en mettant en avant notamment l'impact des exogènes sur l'endogène (interprétation des coefficients, analyse structurelle).
11
La modélisation est un processus itératif. Lorsqu'on essaie réellement d'approfondir, on se rend compte que le processus de modélisation est très complexe. Il nécessite parfois plusieurs aller-retour pour vérifier la validité des résultats que l'on essaie d'établir. Quelques outils de diagnostic de la régression seront décrits plus tard dans votre cursus. Y sont étudiés notamment : L'étude des résidus, graphiquement mais aussi numériquement avec les tests de normalité, les tests du caractère aléatoire des erreurs. La détection des points aberrants et influents, ces points qui peuvent peser de manière indue sur les résultats de la régression. Les problèmes de colinéarité et la sélection de variables. Les ruptures de structure c.-à-d. la vérification de l'existence de plusieurs souspopulations dans les données, avec des relations de nature différente entre les exogènes et l'endogène (ex. le lien entre le poids et la taille n'est pas le même chez les hommes et chez les femmes). Les problèmes de non linéarité que nous avons commencé à aborder dans la partie consacrée à la régression simple.
3. Les Hypothèses
12
II.
Le principe de l’ajustement des moindres carrés ordinaires (MCO) 1. L’estimation par les MCO
Nous voulons estimer les valeurs de a et b en utilisant les informations apportées par l'échantillon. Trouver la meilleure estimation possible revient à déterminer la droite de régression qui approche au mieux le nuage de points. Le critère des moindres carrés consiste à minimiser la somme des carrés des écarts (des erreurs) entre les vraies valeurs de Y et les valeurs prédites avec le modèle de prédiction (Figure 1.3).
L'estimateur des moindres carrées ordinaires (MCO) des paramètres a et b doit donc répondre à la minimisation de :
La résolution donne les équations ci-dessous qualifiées d’équations normales : 13
Ou
2. Application au cas des rendements agricoles
14
III.
Evaluation de la qualité des estimateurs
Nous constatons que la droite passe peu ou prou au milieu du nuage de points. Pour évaluer la qualité de la régression, la simple évaluation visuelle ne suffit pas. Il faut un critère quantitatif que l'on saura interpréter. Deux propriétés importantes sont mises en avant dans l'évaluation d'un estimateur : 15
Est-ce qu'il est sans biais c.-à-d. est-ce qu'en moyenne nous obtenons la vraie valeur du paramètre ? Est-ce qu'il est convergent c.-à-d. à mesure que la taille de l'échantillon augmente, l'estimation devient de plus en plus précise ? Quelle est la qualité de l’ajustement ? 1. Vérifions si les estimateurs a^ et b^ sont des estimateurs sans biais
On dit que θ^ est un estimateur sans biais de θ si E ( θ^ ) =θ
16
17
2. Vérifions si les estimateurs a^ et b^ sont des estimateurs convergents Un estimateurθ^ sans biais de θ est convergent si et seulement si
18
19
3. Les estimateurs sont-ils efficaces ? Selon le Théorème de Gauss-Markov, les estimateurs des MCO de la régression sont sans biais et convergents. On peut même aller plus loin et prouver que parmi les estimateurs linéaires sans biais de la régression, les estimateurs MCO sont à variance minimale c.-à-d. il n'existe pas d'autres estimateurs linéaires sans biais présentant une plus petite variance. Les estimateurs des MCO sont BLUE (best linear unbiased estimator). On dit qu'ils sont efficaces.
4. Evaluation de la qualité de l’ajustement Les estimateurs a^ et b^ sont ceux qui minimisent la somme des carrés des résidus :
Lorsque la prédiction est parfaite, tout naturellement SCR = 0. Mais en général, on n »obtient pas une telle perfection. L’on se contente alors d’une bonne régression. Pour savoir si une régression est bonne ou pas, on compare la SCR avec une valeur de référence : la sommes des carrés totaux (SCT). Cela permet de déterminer un indicateur synthétique qui indique la proportion de variance de Y expliquée par le modèle: le coefficient de détermination R2.
Plus R2 est proche de 1, meilleur sera le modèle, la connaissance des valeurs de X permet de deviner avec précision celle de Y. Lorsque R2est proche de 0, cela veut dire que X n'apporte pas d'informations utiles (intéressantes) sur Y, la connaissance des valeurs de X ne nous dit rien sur celles de Y.
Pour mieux comprendre, établissons l'équation d'analyse de variance. On appelle somme des carrés totaux (SCT) la quantité suivante :
20
21
Tableau simplifié d’analyse de la variance
Nota bene :
Quelques remarques sur la précision des estimateurs
22
Application au cas des rendements agricoles :
23
24
5. Evaluation de la significativité globale de la régression Le R2 indique dans quelle proportion la variabilité de Y pouvait être expliquée par X. En revanche, il ne permet pas de savoir si la régression est globalement significative. Dit autrement, est-ce que les X (il n'y en a qu'un seul pour l'instant dans la régression simple) emmènent significativement de l'information sur Y, représentative d'une relation linéaire réelle dans la population, et qui va au-delà des simples fluctuations d'échantillonnage ? Pour répondre à cette question, il faut tester la significativité globale de la régression, en nous basant sur la statistique F. Pour ce faire, nous étendons l'étude de la décomposition de la variance en complétant le tableau d'analyse de variance par les degrés de liberté (Tableau 3.1).
Cette statistique indique si la variance expliquée est significativement supérieure à la variance résiduelle. Dans ce cas, on peut considérer que l'explication emmenée par la régression traduit une relation qui existe réellement dans la population. D'aucuns considèrent le test F comme un test de significativité du coefficient de détermination, on peut le comprendre dans la mesure où il peut s'écrire en fonction du R2 :
25
Nota Bene : Les degrés de liberté On peut les voir de différentes manières. La définition la plus accessible est de les comprendre comme le nombre de termes impliqués dans les sommes (le nombre d'observations) moins le nombre de paramètres estimés dans cette somme. 26
Degré de liberté associé à la SCT : on a besoin de l’estimation de la moyenne y ;( n−1 ) Degré de liberté associé à la SCR : on a besoin de l’estimation de a et b ; ( n−2 ) Degré de liberté associé à la SCE : le plus simple est de l’obtenir par déduction ( n−1 )−( n−2 )=1
6. Evaluation de la significativité des estimateurs Test de significativité de la pente Le test de significativité de la pente consiste à vérifier l'influence réelle de l'exogène X sur l'endogène Y . Les hypothèses à confronter s'écrivent :
27
28
Montrons pourquoi les paramètres sont distribués selon une loi de Student
29
30
Test de conformité à un standard unilatéral
31
Détermination de l’intervalle de confiance
32
Prédiction et intervalle de prédiction Outre l'analyse structurelle et l'interprétation des coefficients, la régression est beaucoup utilisée pour la prédiction (ou prévision, on utilise plutôt ce terme quand on manipule des données longitudinales). Pour un nouvel individu donné, à partir de la valeur de l'exogène X, nous voulons connaître la valeur que prendrait l'endogène Y. Prédiction ponctuelle
Prédiction par intervalle
33
Variance de l’erreur de prédiction
34
Loi de distribution de l’erreur de prévision
Intervalle de prédiction
Application aux rendements agricoles
35
36
CHAPITRE III LA REGRESSION LINEAIRE MULTIPLE La régression linéaire multiple est la généralisation multivariée de la régression simple. Nous cherchons à expliquer les valeurs prises par la variable endogène Y à l'aide de p variables exogènes Xj , (j = 1; : : : ; p). L'équation de régression s'écrit : y i=a0 +a1 x i1 +…+ a p xip +ε i
Lecture des coefficients : Chaque coefficient se lit comme une propension marginale :
Mais, à la différence de la régression linéaire simple, on prend en compte le rôle des autres variables lors de son calcul. On dit alors que c'est un coefficient partiel : il indique l'impact de la variable en contrôlant l'effet des autres variables, c'est la fameux "toutes choses égales par ailleurs". Nous approfondirons cette notion dans un chapitre dédié à l'interprétation des coefficients. Enfin, l'effet des variables est additif c.-à-d. toutes les autres étant constantes, si x j et x j ' sont tous deux augmentés d'une unité, alors y est augmenté de ( a j +a j ' ).
I.
Ecriture matricielle et hypothèses 1. Ecriture matricielle
Pour simplifier les notations, on retrouve souvent une écriture matricielle du modèle dans la littérature Y = Xa+ϵ
Les dimensions des matrices sont respectivement :
Y →(n , 1) X →(n , p+1) a →( p+1 , 1) ϵ →(n , 1)
La matrice X de taille (n , p+1) contient l'ensemble des observations sur les exogènes, avec une première colonne formée par la valeur 1 indiquant que l'on intègre la constante a 0 dans l'équation
37
2. Les hypothèses
II.
Ajustement par les MCO 1. Minimisation de la SCR
38
2. MCO sous forme matricielle
39
Quelques remarques sur les matrices :
III.
Propriétés des estimateurs 1. Biais
40
2. Convergence
41
42
On montre qu'une condition nécessaire et su-sante pour que a^ soit un estimateur convergent de a est que les variables exogènes ne tendent pas à devenir colinéaires lorsque n tend vers l'infini, autrement dit que l'hypothèse (H8) reste valable lorsque n tend vers l'infini. Théorème de Gauss-Markov : Exactement comme pour la régression simple, on montre pour la régression multiple qu'il n'existe pas d'estimateurs sans biais avec une variance plus faible que celle des moindres carrés ordinaires. Les estimateurs des MCO sont BLUE (best linear unbiased estimator).
43
3. Estimation de la variance de l’erreur
IV.
Tests de significativité 1. Tableau d'analyse de variance et coefficient de détermination
La décomposition de la variabilité de Y (SCT) en variabilité expliquée par le modèle (SCE) et variabilité résiduelle (SCR) reste valable. Nous pouvons construire une nouvelle version du tableau d'analyse de variance qui tient compte des nouvelles valeurs des degrés de liberté puisque nous estimons (p + 1) paramètres maintenant.
44
Le R2 est un indicateur de qualité, mais il présente un défaut ennuyeux : plus nous augmentons le nombre de variables explicatives, même non pertinentes, n'ayant aucun rapport avec le problème que l'on cherche à résoudre, plus grande sera sa valeur, mécaniquement. A l'extrême, si nous multiplions le nombre d'explicatives jusqu'à ce que (p + 1) soit égal à n, nous obtiendrions un R2 = 1. Clairement le R2 en tant que tel n'est pas un bon outil pour évaluer le rôle de variables supplémentaires lors de la comparaison de modèles imbriqués. En augmentant le nombre d'explicatives, nous augmentons de manière mécanique la valeur du R2 mais, dans le même temps, nous diminuons le degré de liberté. Il faudrait donc intégrer cette dernière notion pour contrecarrer l'évolution du R2. C'est exactement ce que fait le R2 -ajusté (ou R2 -corrigé). Le R2 -ajusté est déni de la manière suivante :
Il s'agit donc d'un R2 corrigé par les degrés de liberté, il peut s'exprimer en fonction du R2 d'ailleurs
Attention, la lecture en termes de part de variance expliquée n'est plus possible dans ce cas. De même, le R2 peut prendre des valeurs négatives. Il ne faut pas s'en offusquer.
45
2. Test de significativité globale
3. Test de significativité d’un coefficient
46
Le retrait de la variable Xj de la régression est possible si l'hypothèse nulle est avérée. Par rapport aux autres variables, la contribution de Xj dans l'explication de Y n'est pas significative. Méfiance néanmoins, des problèmes de colinéarité peuvent parfois perturber les résultats.
4. Test de significativité d’un bloc de coefficients Supposons que deux variables ne sont pas significatifs. Est-ce que cela veut dire que nous pouvons retirer directement les deux variables de la régression ? Clairement non. On ne peut se baser sur les tests individuels pour supprimer en bloc des exogènes du modèle. En effet, les coefficients correspondent à des contributions partielles, tenant compte de l'impact des autres variables. Si ces dernières sont corrélées, elles se gênent mutuellement dans la régression, partageant leur influence au point que, individuellement, elles ne semblent pas intéressantes. Pour évaluer la contribution de q variables prises simultanément, nous introduisons un nouveau type de test. L'hypothèse nulle du test s'écrit (sans restreindre la généralité du propos, nous ne testons pas forcément les q premiers coefficients) :
:
47
V.
Régression sous contraintes - Estimation des coefficients
Dans la régression sous-contraintes (régression restreinte), nous introduisons des impératifs – sous forme de combinaisons linéaires de coefficients - sur les paramètres estimés lors du processus de minimisation de la somme des carrés des résidus. Après avoir accepté l'hypothèse nulle, nous souhaitons que les coefficients estimés par les MCO reflètent les conditions émises. Il s'agit donc d’une optimisation sous q contraintes linéaires. A résoudre directement, ça paraît très compliqué. Fort heureusement, il est possible de dériver les nouveaux coefficients des résultats de la régression sans contraintes.
48
49
TRAVAUX PRATIQUES UTILISATION DU LOGICIEL ECONOMETRIQUE EVIEWS
I.
Récupération des données
Créez sur votre disque dur un répertoire (Dossier) dans lequel vous placerez tous les fichiers qui se rapportent d'une manière ou d'une autre à vos classeurs EViews. La simplicité est de rigueur; choisissez comme emplacement pour ce dossier la racine de votre disque dur et donnez-lui un nom simple, de 8 caractères ou moins, par exemple C:\DEV_CONJ (ce même exemple sera employé tout au long de ce texte afin d'illustrer les manipulations à effectuer).
Les séries se présentent sous trois formes. Soit en fichier texte .txt, soit en fichier .wk1 ou .xls. Dans tous les cas, la procédure initiale est la même. Il vous faut en premier lieu sauvegarder ces fichiers sur votre disque dur... 1. Pour les fichiers texte... Après avoir cliqué sur le nom de la série qui vous intéresse, celle-ci s'ouvrira dans votre navigateur. Il faut l'enregistrer dans un fichier d'extension .txt. Pour ce faire, vous devez aller dans le menu "Fichier" ("Page" en haut à droite pour la nouvelle version ou l'icône en forme d'"engrenage", haut droite, pour Explorer 9) et cliquer sur "Enregistrer sous...". Une fenêtre apparaîtra à l'écran. Choisissez un répertoire Ensuite, dans le menu "Type" du bas, choisissez "Fichier Texte" (*.txt). Puis, changez le nom du fichier par le label de la série (ex.: pour le PIB canadien en dollars de 2002, tapez v1992067.txt (assurez-vous bien que l'extension du fichier est ".txt")). Appuyez enfin sur "OK". 2. Pour les fichiers Excel (*.xls) et Lotus 1-2-3 (*.wk1)... Après avoir cliqué sur le nom de la série qui vous intéresse, le logiciel vous demandera si vous souhaitez ouvrir le ficher ou l'enregistrer. Choisissez d'enregistrer le fichier. Assurez-vous que le nom de sauvegarde proposé est représentatif de la série et appuyez sur OK après avoir déterminé votre emplacement de sauvegarde. Gardez ici aussi toujours votre répertoire de travail en tête. Sauvegardez de cette manière toutes les séries que vous souhaitez exploiter dans le cadre de votre travail avant de passer aux prochaines étapes.
50
Créer un fichier de travail sous Eviews :
Cliquez sur l’icône Eviews pour démarrer votre session. La fenêtre Eviews comporte la barre des titres, la fenêtre de commande, la ligne de statut (status line). Les résultats des opérations sont dans la zone de travail (entre la fenêtre de commande et la ligne de statut)
cliquer sur le menu « File » et sur « New » et « Workfile ». On obtient la boîte de dialogue :
51
Comme on travaille sur des données en coupe instantanée (cross section), prendre « Workfile Structure Type » et sélectionner «Unstructured/Undated ». Entrer 10 dans la boîte d’observation.
Entrer “SW10smpl” dans le champ “WF”. Une fenêtre de travail s’ouvre, contenant deux entrées (c, resid). Entrer des données manuellement:
Cliquer sur “Quick” dans la barre de titre et sur “Empty Group (Edit Series)”. 52
Ensuite entrer les données de deux variables (10 observations): Observations 1 2 3 4 5 6 7 8 9 10
TESTSCR 606.8 631.1 631.4 631.8 631.9 632.0 632.0 638.5 638.7 639.3
STR 19.5 20.1 21.5 20.1 20.4 22.4 22.9 19.1 20.2 19.7
Nb: EViews will add zeros. You will see later how to get rid of these.
Une fois les données entrées, fermer l’objet. Il sera demandé“Delete Untitled GROUP ?”. Cliquersur “Yes”. Renommer les variables: Cliquer sur SER01, ensuite cliquer droit et choisir “Rename…” et entrer “testscr” Faire la même chose pour substituer SER02 à “str” Pour voir les données, taper dans la commande : showtestscrstr On verra alors :
53
Cliquer le bouton “View” et cliquer sur “Descriptive Stats » et « Common sample ». on a alors l’output ci-dessous. Nb :Au lieu d’utiliser PrntScrn de l’ordinateur, on peut utiliser le bouton “Freeze” de Eviews.
54
Pour revoir les données et apporter des corrections: cliquer sur “View” et choisir “SpreadSheet” ou cliquer simplement sur le bouton “Sheet”. Corriger le problème. Cliquer le bouton « Edit+/-“, entrer la valeur correcte et presser “Enter”. Quelquesfonctions: CellFmt apparaît après “Freeze” et clic “ Edit +/-. Il permet de getrid les digits non nécessaires après le point décimal. Entrer des données à partir d’un fichier: Cette façon manuelle de rentrer les données n’est pas pratique quand il y a de nombreuses observations. Il est possible de rentrer les données directement à partir d’un spreadsheet ou d’un fichier ASCII. Par exemple, importer des données à partir d’Excel :
Utiliser la procédure « Quick/Edit Group (Empty Series)”. Retourner au fichier Excel et sélectionner le fichier. Ensuite, utiliser les commandes “copy” et “paste” et envoyer le bloc de données dans Eviews.S’assurer de sélectionner la boite grey du côté droit de « obs » avant de « paste » (cela highlight cette colonne). Ensuite, renommer « rename » les variables selon les noms dans les cellules. Celma donne sous Eviews : 55
Outre la méthode cut and paste, il y a aussi la possibilité d’importer directement les données dans Eviews à partir d’Excel :
Ouvrir un nouveau fichier de travail dans Eviews. Presser « Proc/Import /Read Text-Lotus-Excel”. Une boîte de dialogue s’ouvre: spécifier là où se trouve le fichier de données Excel (par exemple caschool.xls) Double cliquer sur ce fichier Excel. Une autre boîte de dialogue s’ouvre : copier les noms des variables de cell F1 (enrl_tot) à R1 (math_scr) dans le fichier Excel et les copier dans ce champ. Finalement, Eviews suggère que la première donnée est dans la cellule B2. Changer cela en F2, le premier point de donnée correspondant à enrl_tot. Avant de cliquer OK, il faut fermer le fichier Excel. On obtient la boîte de dialogue :
56
Nb : Eviews permet aussi d’importer d’autres types de fichiers de données, par exemple des fichiers STATA, bien que cela soit un peu plus compliqué. On peut sauvergarder les données dans ASCII, spreadsheet,STATA, SPSS, et d’autres formats en cliquant sur File/ Save As et ensuite en regardant aux différentes options dans “Save as type.”
Deux façons d’enregistrer les données sur Eviews : Enregistrer le fichier entier : cliquer bouton « Save » dans la barre d’outils ou « File » et « Save as » dans le menu principal. Utiliser l’extension “.WF1.”exemple: enregistrer le fichier “SW10smpl.wf1.” Sauvegarder les sériesindividuelles : First mark the two series in the workfile by clicking on testscr, then hold down the control button and click on str. (Make sure that you are doing this in the Workfile window, not in the Group View window.) After that, press the Store button in the workfile toolbar. Once again, a dialog box will pop up. Store the two data series in the EViews subdirectory with the extension “.db.” Next time you need to retrieve these two series, you can simply click on the Fetch button in the workfile toolbar.
Présenter des graphiques: 57
Établir l’échantillon de 1 à 10 soit en cliquant sur le bouton “Sample” de la barre d’outils soit en entrant “smpl 1 10” dans la fenêtre de commande Dans la ligne de commande suivante, taper la commande “freeze (graph_str) str.line”. cela va créer un graphique et lui donner un nom (graph_strhere, mais d’autres noms, tels que graph_1 oumygraph, peuvent être choisis). Penser àfreezingun objet en prenant une photographie et en lui donnant un nom. Cela permet de le localiserplus facilement dans l’album photo. On peut le couper et le coller dans le word-processing program. “graph_str” apparaît maintenant dans la fenêtre de fichier de travail. Double cliquer sur “graph_str” pour voir apparaître le graphique créé. Double cliquer dans le graphique ou cliquer sur le bouton « Options » et le toucher jusqu’à ce qu’il ressemble au graphique ci-dessous :
Certaines de ces altérations peuvent être faites dans la boîte de dialogue correspondante : textinserted, title of the graph, etc., Nb : il est recommandé de travailler souvent dans la fenêtre de commande plutôt que de cliquer sur des boutons.
On peut plot deux variables ensemble pour voir la relation causale entre elles. Utiliser la commande de ligne. Définir d’abord un groupe (ici « size_perform » mais d’autres comme « my group » sont possibles). Ensuite dire au programme quelles séries forment le groupe, ici strandtestscr. Ensuite, « freeze » le graphique. “m” signifie“display multiple graphs” : 58
groupsize_performstrtestscr freeze(two_series_plot) size_perform.line (m) On obtient le graphique suivant:
Pour avoir une idée plus précise de la relation entre les deux variables, on conduit le programme suivant: size_perform.scatlinefit oùsize_perform est le nom du groupe créé précédemment.
59
Régression linéaire simple par MCO (Moindres Carrés ordinaires) Il y a plusieurs moyens d’estimer la ligne de régression. La commande pour régresser une variable Y sur une constant et une autre variable X est: ls Y c X Où “ls” signifie least squares. Taper, dans la fenêtre de commande : ls(h) testscr c str où le “h” entre parenthèse indique qu’on utilise des erreurs standards robustes à l’hétéroscédasticité. L’outputapparaîtcomme suit:
60
Selon ces résultats, baisser le ratio student-teacher de 1 étudiant par classe fait baisser en moyenne le score de test de 0,6 point.
61
62
63
64
65
Bibliographie Manfred W. Keil (…), “EViews 6 Tutorial” Jean-Martin Proulx et Maurice N. Marchon (2014), « Guide d'utilisation - Logiciel EViews, version 7 » © HEC Montréal, 2010. Dernière révision : 15-01-2014 Jean-Paul TSASA Vangu (2010), « L’analyse économétrique : Par où commencer ? », Cellules de réflexions économiques et sociales
66
67