Etude de Cas - Corrigé [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

UNIVERSITE DE SFAX

Institut International de Technologie Technolo

AU : 2019/2020 2ème Semestre

Analyse des Données Enseignantes Responsable : Mme. Diala DHOUIB

Etude de Cas : Corrigé Analyse en Composantes Principales

Auditoire : 2èreGénie Mécanique

L’ensemble des variables retenues par la banque étant de nature quantitative ⇒ c’est l’ACP qui a été employée. On a pratiqué une ACP normée afin de tenir compte de l’hétérogénéité des unités de mesure qui entrent dans la définition de ces variables. Le e fait de procéder à une réduction des données avant l’analyse permet de s’assurer que les variables vari possédant de forts écarts-types écarts types ne joueront pas un rôle prédominant dans la formation de l’inertie totale du nuage et dans les calculs de distances entre les points individus. Dans cette analyse, c’est seulement aux variables décrivant l’attitude des clients face à la banque que l’on a donné le statut d’élément actif. actif Ainsi, la signification des axes factoriels sera exprimée uniquement en termes terme de comportements bancaires. Les deux variables décrivant la situation socio-démographique socio démographique des clients ont été utilisées uniquement comme éléments supplémentaires. Elles n’ont pas contribué à fixer leur direction. Le recours à ces variables supplémentaires supplémentaire permet de savoir s’il existe un lien entre les phénomènes socio-démographiques socio démographiques élémentaires dont elles rendent compte et les structures du comportement bancaire révélées par l’analyse des éléments actifs.

1. Le nuage des individus sera représenté dans un espace de dimension 11(p) 11 Le nuage des variables sera représenté dans un espace de dimension 50 (n) 2. On constate une forte corrélation positive entre : (DEPO, VADD) =0,890 (MEM, DEPO) = 0,847 (NBPR, MEMP) =0,805 1 /5

3. Ig= tr(VM)=p=11 4. Pourcentage d’Inertie Expliquée Souhaité: Le premier axe permet de récupérer 31,237% de la variance Le deuxième axe permet de récupérer 27,606% de la variance Le troisième axe permet de récupérer 10,639% de la variance Les trois premiers axes permettent de récupérer 69,483% d’informations (sup à 60%) ⇒On retient les trois premiers axes. Critère de Kaiser: On ne retient que les axes associés aux valeurs propres supérieurs à 1. D’après le tableau des V.P. (Variance Totale Expliquée), les trois premières V.P. sont supérieures à 1. ⇒On retient les trois premiers axes. Éboulis des Valeurs Propres: On cherche un «coude» dans le graphe des valeurs propres et on ne conserve que les valeurs jusqu’au ce « coude ».

5. Les variables les plus actives sur l’axe n°1, sont les variables qui possèdent une forte corrélation avec l’axe 1. DEPO (0,9) VADD (0,868) SOLD (0,849) MDEC (-0,58) NDEC (-0,66) 2 /5

6. Les individus qui contribuent le plus fortement à la formation du premier axe principal sont ceux projetés loin de l’origine. COORD (-)

COORD (+)

I10 (-1,987)

I30 (2,616)

I14 (-1,921)

I27 (2,488)

I3 (-1,34)

I21 (1,78)

I7 (-1,33) I1 (-1,28)

7. Interprétation du Premier Axe Factoriel.

Coord>>>0

Corrélation >>>0

I30 (2,616)

DEPO (0,9)

I27 (2,488)

VADD (0,868)

I21 (1,78)

SOLD (0,849)

I10 (-1,987)

MDEC (-0,58)

I14 (-1,921)

NDEC (-0,66)

I3 (-1,34) I7 (-1,33) I1 (-1,28)

Coord0

I11 (2,96)

MEMP (0,945)

I46 (2,333)

NBPR (0,893)

I20 (1,677)

RETR (0,882)

I14 (-1,405) I3 (-1,226) I1 (-1,039)

Coord0

I14 (2,672)

MDEC (0,937)

I7 (1,701)

NDEC (0,860)

I3 (1,596)

I15 (-1,693) I50(-1,632) I24 (-1,582)

Coord