Examen ANALYSE DES DONNEES [PDF]

  • Author / Uploaded
  • ezz
  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

2019-2020

Faculté des sciences juridiques, Economiques et Sociales de Settat Master : Ingénierie de la décision Master : Politiques publiques et développement économique

Examen Final d’Analyse de données -- Professeur : A. Abarda -Durée : 2 h NOM : …………………………………

N° APOGEE : ……………………..

PRENOM : …………………………….

MASTER : ....………………………

Question de cours Analyse Factorielle 1. Donner les objectifs des méthodes d’analyses factorielles ? 2. Expliquer les différences qui existent entre les méthodes : Analyse en Composante Principale (ACP), Analyse Factorielle des correspondances (AFC) et Analyse des correspondances multiple. 3. Justifier les opérations de centrage et de réduction des données en ACP: 4. Justifier l’utilisation du test Khi-deux pour l’analyse Factorielle des correspondances (AFC). 5. Dans le cadre d’une ACP, peut-on, en observant que deux points-variables sont proches dans le premier plan factoriel, en déduire que les variables associées sont fortement corrélées? Justifier votre réponse. 6. Dans le cadre d’une AFC, peut-on, en observant le nuage des profils-lignes dans le plan factoriel principal, déterminer les profils qui contribuent à la formation du premier axe factoriel ? Justifier votre réponse. Logiciels d’analyse de données 7. 8. 9. 10.

Citer 3 logiciels statistiques qui permettent d’effectuer « l’analyse de données » Donner deux bibliothèques (packages R) nécessaires pour exécuter l’ACP, l’AFC et l’ACM : Ecrire les scripts R pour une ACP, AFC et ACM sur des données nommées « data1 ». Ecrire la commande R qui permet d’effectuer le test Khi-deux.

Problème 1 10 étudiants se sont présentés à une épreuve d'analyse des données qui comportait 4 problèmes :  

Pb1 et Pb2 étaient des problèmes de statistiques Pb3 et Pb4 étaient des problèmes de probabilités

Chaque problème comptait 5 points. Le nombre de points obtenus par les 10 étudiants est donné sous forme d'un tableau de 10 lignes et 4 colonnes. On analyse ces données en réalisant une ACP normée (représentée sur les espaces ou ) sur les variables Pb1, Pb2, Pb3, et Pb4 ; On obtient les résultats dans l'annexe 1 : 1. 2. 3. 4. 5.

Dans quel espace est représenté le nuage des individus. Justifier votre réponse. Dans quel espace est représenté le nuage des variables. Justifier votre réponse. Commenter les valeurs numériques de la table 1 (Annexe 1): Commenter les coefficients de la table 2 (Annexe 1). Quel est le rôle de cette table dans l'ACP ?

Quels sont les pourcentages des variances (inerties) expliquées par l’axe 3 et par l’axe 4 (Annexe 1)?

1

6. Quelle relation existe entre la trace de la matrice de corrélation et la somme des valeurs propres ? (Trace : somme de la diagonale principale) 7. Compléter des valeurs manquantes dans les tables des valeurs propres (Table 3, Annexe 1). 8. Combien d'axe doit-on conserver ? Justifier votre réponse. 9. Donner une interprétation des axes factorielles (figure 1, Annexe 1) 10. En se basant sur la table des cordonnées (table 4, annexe 1), tracer le nuage de points des individus sur deux axes :

Problème 2 Nous effectuons une analyse factorielle sur des indicateurs macro-économiques prélevés sur 802 entreprises marocaines. Le but de cette étude est de dégager une certaine typologie sur l’ensemble des entreprises sur la base des indicateurs les plus significatifs parmi : : le chiffre d’Affaire, : la Valeur ajoutée, réalisé et : les Importations globales.

: l’Exploitation,

: la Production,

: l’Investissement

On choisit de représenter chaque individu-entreprise i par le vecteur des valeurs prise par les variables centrées et réduites pour les entreprises.

,

.

1- En se basant sur la nature des variables , . Quelle est la méthode d’analyse factorielle adaptée à la situation ? 2- Interpréter les résultats de la table 1, Annexe 2. 3- Interpréter les résultats de la matrice corrélation (table 2, Annexe 2) et proposez un scénario possible de regroupement de variables. 4- Donner le pourcentage de l’inertie expliqué par : 2 composantes, 3 composantes, 4 composantes (table 3, Annexe 2). 5- Tracer le diagramme des valeurs propres, et décider le nombre d’axes à retenir (table 3, Annexe 2).

2