Corrigé Exercice ACP [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Corrigé - Exercice de révision (ACP) Une étude gastronomique à apprécier le service, le prix et la qualité de quatre restaurants. Pour cela, un expert a noté les restaurants avec des notes allant de -3 à +3. Les résultats sont les suivants : Restaurant R1 R2 R3 R4

Service -2 -1 +2 +1

Qualité +3 +1 -1 -3

prix -1 0 -1 +2

La matrice des variances-covariances est : 5 2 𝑉 = −3 1 ( 2

−3 5 −2

1 2 −5 3 2)

Et celle des corrélations est : 1 − 0.85 0.26 𝛤 = (−0.85 1 − 0.73). 0.26 − 0.73 1 Pour l’étude, on effectue une ACP centrée avec des poids équirépartis. 1. Etude des valeurs propres : a ) Vérifier simplement que V admet une valeur propre λ3=0 Pour vérifier simplement que V admet une valeur propre nulle, il suffit de calculer son déterminant (qui doit être nul). 5 1 −3 2 2| 𝑑𝑒𝑡 𝑉 = ||−3 5 − 5| 1 3 −2 2 2 Pour retrouver le déterminant, il suffit de rajouter à la première ligne les deux autres. Et donc, on aura : 0 0 0 −3 5 −5 𝑑𝑒𝑡 𝑉 = | 1 3 |=0 −2 2 2 Il suffit d’avoir une ligne nulle pour pouvoir dire que le déterminant est nul. CCL : V admet une valeur propre nulle.

b) On donne λ1=30.5/4,. En déduire λ2. On sait que la somme es valeurs propres est la trace de la matrice à diagonalise (dans notre cas : la matrice V) λ1 + λ2+ λ3 =5/2 + 5 + 3/2 = 9,. On en déduit que λ2 = 9-30.5/4 = 5.5/4 C ) Calculer le pourcentage des inerties. Quelle est la dimension à retenir. Le pourcentage des inerties : λ1 (%) = (30.5/4) / 9 = 84.72 %, λ2 (%) = (5.5/4) / 9 = 15.28 %, λ3 (%) = 0 / 9 = 84.72 %. En examinant le diagramme des valeurs propres, et utilisant le critère du coude qui casse : 0.9 0.8 0.7 0.6 0.5 0.4 0.3

0.2 0.1 0 1

2

3

La dimension à retenir est 1 seule. Le deuxième sera pris pour la frome !! 0.5 0.65 ( ) ( 2. On donne (aux erreurs d’arrondi près) : 𝑢1 = −0.8 et 𝑢2 = 0.11 ) 0.3 −0.75 a)Calculer les composantes principales. Pour trouver les composantes principales, il faudra faire le produit matriciel de la matrice des données centrées avec u1 et u2 La matrice des données centrées −2 3 −1 1 𝑋=( 2 −1 1 −3

−1 0 ) −1 2

(On remarque que les données sont centrées depuis le départ)

−3.7 −1.3 ) 𝑐 1 = X 𝑢1 = ( 1.5 3.5

𝑐2

−0.22 −0.54 ) = X 𝑢2 = ( 1.94 −1.18

b) Représenter les individus dans le plan principal (1,2). La représentation des individus dans le plan principal (1,2) : 2.5 2

R3

1.5 1 0.5 0 -5

-4

R1

-3

-2

-1

0

1

2

3

4

-0.5

R2

-1

R4 -1.5

3. a) Déterminer les corrélations entre les variables et les composantes La corrélation entre les variables et les composantes principales Cor (Vj,ci) = (produit scalaire des deux vecteurs) divisé par le produit de leurs écarts-types La composante ci étant de variance λi !! −3.7 1 (−2 , −1 , 2 , 1) ( −1.3 ) 4 1.5 3.5 1 𝑐𝑜𝑟(𝑉1 , 𝑐 ) = = √𝑉(𝑉1 )√ λ1 De la meme façon on trove les autres corrélations :

15.2/4 √5 √30.5 2 4

= 0.87

1

C C2

V1 0,87 0,50

V2 -0,99 0,048

V3 0,68 -0,71

b) Représenter les variables sur le cercle des corrélations dans le plan factoriel (1,2)

0.6

V1 0.4 0.2

V2 -1.5

-1

0 -0.5

0

0.5

1

-0.2 -0.4 -0.6

-0.8

c) Interpréter les résultats. çà , vous savez le faire !!!! ……(j’espère).

V3