34 0 190KB
Corrigé - Exercice de révision (ACP) Une étude gastronomique à apprécier le service, le prix et la qualité de quatre restaurants. Pour cela, un expert a noté les restaurants avec des notes allant de -3 à +3. Les résultats sont les suivants : Restaurant R1 R2 R3 R4
Service -2 -1 +2 +1
Qualité +3 +1 -1 -3
prix -1 0 -1 +2
La matrice des variances-covariances est : 5 2 𝑉 = −3 1 ( 2
−3 5 −2
1 2 −5 3 2)
Et celle des corrélations est : 1 − 0.85 0.26 𝛤 = (−0.85 1 − 0.73). 0.26 − 0.73 1 Pour l’étude, on effectue une ACP centrée avec des poids équirépartis. 1. Etude des valeurs propres : a ) Vérifier simplement que V admet une valeur propre λ3=0 Pour vérifier simplement que V admet une valeur propre nulle, il suffit de calculer son déterminant (qui doit être nul). 5 1 −3 2 2| 𝑑𝑒𝑡 𝑉 = ||−3 5 − 5| 1 3 −2 2 2 Pour retrouver le déterminant, il suffit de rajouter à la première ligne les deux autres. Et donc, on aura : 0 0 0 −3 5 −5 𝑑𝑒𝑡 𝑉 = | 1 3 |=0 −2 2 2 Il suffit d’avoir une ligne nulle pour pouvoir dire que le déterminant est nul. CCL : V admet une valeur propre nulle.
b) On donne λ1=30.5/4,. En déduire λ2. On sait que la somme es valeurs propres est la trace de la matrice à diagonalise (dans notre cas : la matrice V) λ1 + λ2+ λ3 =5/2 + 5 + 3/2 = 9,. On en déduit que λ2 = 9-30.5/4 = 5.5/4 C ) Calculer le pourcentage des inerties. Quelle est la dimension à retenir. Le pourcentage des inerties : λ1 (%) = (30.5/4) / 9 = 84.72 %, λ2 (%) = (5.5/4) / 9 = 15.28 %, λ3 (%) = 0 / 9 = 84.72 %. En examinant le diagramme des valeurs propres, et utilisant le critère du coude qui casse : 0.9 0.8 0.7 0.6 0.5 0.4 0.3
0.2 0.1 0 1
2
3
La dimension à retenir est 1 seule. Le deuxième sera pris pour la frome !! 0.5 0.65 ( ) ( 2. On donne (aux erreurs d’arrondi près) : 𝑢1 = −0.8 et 𝑢2 = 0.11 ) 0.3 −0.75 a)Calculer les composantes principales. Pour trouver les composantes principales, il faudra faire le produit matriciel de la matrice des données centrées avec u1 et u2 La matrice des données centrées −2 3 −1 1 𝑋=( 2 −1 1 −3
−1 0 ) −1 2
(On remarque que les données sont centrées depuis le départ)
−3.7 −1.3 ) 𝑐 1 = X 𝑢1 = ( 1.5 3.5
𝑐2
−0.22 −0.54 ) = X 𝑢2 = ( 1.94 −1.18
b) Représenter les individus dans le plan principal (1,2). La représentation des individus dans le plan principal (1,2) : 2.5 2
R3
1.5 1 0.5 0 -5
-4
R1
-3
-2
-1
0
1
2
3
4
-0.5
R2
-1
R4 -1.5
3. a) Déterminer les corrélations entre les variables et les composantes La corrélation entre les variables et les composantes principales Cor (Vj,ci) = (produit scalaire des deux vecteurs) divisé par le produit de leurs écarts-types La composante ci étant de variance λi !! −3.7 1 (−2 , −1 , 2 , 1) ( −1.3 ) 4 1.5 3.5 1 𝑐𝑜𝑟(𝑉1 , 𝑐 ) = = √𝑉(𝑉1 )√ λ1 De la meme façon on trove les autres corrélations :
15.2/4 √5 √30.5 2 4
= 0.87
1
C C2
V1 0,87 0,50
V2 -0,99 0,048
V3 0,68 -0,71
b) Représenter les variables sur le cercle des corrélations dans le plan factoriel (1,2)
0.6
V1 0.4 0.2
V2 -1.5
-1
0 -0.5
0
0.5
1
-0.2 -0.4 -0.6
-0.8
c) Interpréter les résultats. çà , vous savez le faire !!!! ……(j’espère).
V3