44 0 136KB
Résumé : Khi-deux Les descriptions faites sur les variables soulèvent toute une série de questions sur leurs relations, qui devront être mises en lumière en les rapprochant deux à deux dans des analyses bi-variées. Les tris croisés, qui ont pour objet de rassembler dans un tableau unique les distributions de fréquences ou d'effectifs de deux ou plusieurs variables, sont en général complétés par des mesures d'association qui permettent de démontrer la signification statistique d’association observée entre ces variables. Le test très simple du khi-deux pour vérifier l'association de deux variables qualitatives constitue une bonne introduction.
BOULAHOUAL ADIL
1
1- Principe du test Le principe est de comparer la distribution observée (Oij), c'est-à-dire les effectifs que l'on peut lire dans le tableau croisé, à une distribution théorique (Tij) qui correspond à l'hypothèse selon laquelle les deux variables sont indépendantes. Normalement, si les variables étaient indépendantes, l'effectif observé ne devrait dépendre que des effectifs marginaux, c'est-à-dire de l'effectif total de chaque modalité. Autrement, nous cherchons à vérifier si l'association des deux variables est suffisamment forte pour que l'hypothèse de leur indépendance puisse être rejetée.
2- Procédure du test
r
Nous posons l’hypothèse nulle : H0 : Il n’y a pas de relation entre les deux variables. H1 : Il existe une relation statistiquement significative entre les deux variables. 2
Nous rejetons l’hypothèse nulle (on conclut que la relation existe) si : >
2
c
2
i 1 j 1
O
ij
Tij
2
Tij
0,05 [(r-1)(c-1)]
i = numéro de la ligne; j = numéro de la colonne; r = nombre de lignes, c'est-à-dire le nombre de modalités de la variable présentée en lignes; c = nombre de colonnes, c'est-à-dire le nombre de modalités de la variable présentée en colonnes.
N.B : La loi du 2 suit une distribution asymétrique dont la forme dépend du nombre de degrés de liberté n. Le nombre de degrés de liberté varie en fonction du nombre de modalités des variables et se calcule de la manière suivante: (r-1)(c -1). Il est important de noter aussi que ce test est assez sensible à la taille de l'échantillon, à la taille du tableau croisé et que, normalement, chaque case du tableau devrait avoir un effectif théorique au moins égal à cinq(5). Procédures sous SPSS : Analyse – Statistiques descriptives – Tableaux croisés – Chi-deux – Poursuivre – Ok. Règle : Si la signification du test est inférieure au seuil choisi nous rejetons l’hypothèse nulle et nous confirmons l’existence d’association entre les variables étudiées.
Test d’association : Test de Khi-Deux
Où:
0,50 0,30 0,10 0,01
3- Indicateurs mesurant la force de l'association
V V V V V V
=
0,70 0,69 0,49 0,29 0,09 0,00
Relation très forte Relation forte Relation modérée Relation faible Relation très faible Relation nulle
-
Dans le cas particulier des tableaux carrés 2 x 2 (2 lignes et 2 colonnes), qui comparent deux variables à deux modalités, il est recommandé d'appliquer une correction au 2 , ou d'utiliser le coefficient phi ( ).
-
Le coefficient de contingence (C) peut être appliqué pour des mesures d'association sans contrainte de taille de tableau. Nous pouvons mesurer la force de la relation entre les deux variables par le biais de l’indice V de Cramer ; Le coefficient d'association prédictive (lambda) permet de mesurer dans quelle proportion une variable qualitative indépendante influence une variable qualitative dépendante. C'est donc une mesure dissymétrique qui - contrairement aux précédentes - a pour objet une force de prédiction. 2 2 2 C V 2 n n( L 1) n
BOULAHOUAL ADIL
2
Exercice d’application
Hommes Femmes
Possède une carte fidélité Ne possède pas de carte fidélité Total T : 250* O : 220 T : 750* O : 780 1000 T:
T:
O:
450*
400
TOTAL
2
O : 180
150*
1200
2 2 2 2 220 250 780 750 180 150 420 450
250
750
150
450
12,8
420
600 1600
Au seuil de 5% et à un degré de liberté 2 de 1, tabulée est égale à 0,004 2 > 20,05 [(r-1)(c-1)]
12,8 > 0,004 Conclusion: Les deux variables sont significativement associées
Test d’association : Test de Khi-Deux
Vérifier l’existence d’association entre le genre et a possession de carte de fidélité et mesurer la force de cette association sachant que 25% (400/1600) des clients possèdent une carte de fidélité.
Tests du Khi-deux Valeur
ddl
Signification asymptotique (bilatérale)
12,800a
1
,000
Correction pour la continuité
12,377
1
,000
Rapport de vraisemblance
12,619
1
,000
Khi-deux de Pearson b
Signification exacte (bilatérale)
Signification exacte (unilatérale)
,000
,000
Test exact de Fisher
La signification du test de Khi-Deux est inférieure au seuil classique 5% nous pouvons confirmer l’existence d’association significative entre les deux variables étudiées.
BOULAHOUAL ADIL
3
Nombre d'observations valides 1600 a. 0 cellules (0,0%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 150,00. b. Calculé uniquement pour un tableau 2x2
Valeur Symétrique Lambda Nominal par Nominal
Erreur standard asymptotique
a
T approximé b
.
b
.
b
.
Sig.approximée b
.
,000
,000
.
Sexe dépendant
,000
,000
.
Possession dépendant
,000
,000
.
Sexe dépendant
,008
,005
,000
Possession dépendant
,008
,005
,000
b
b
c
Tau de Goodman et Kruskal a. L'hypothèse nulle n'est pas considérée. b. Calcul impossible /: l'erreur standard asymptotique est égale à zéro. c. Basé sur une approximation du Khi-deux
c
La valeur du test symétrique de Lambda est de « 0,000 » qui veut dire l’association entre le genre est la possession d’une carte fidélité est presque inexistante. La statistique Lambda est égale à « 0,000 » dans le cas ou la variable sexe est considérée comme dépendante et lorsque la possession est considérée comme dépendante aussi.
Mesures symétriques Valeur
Signification approximée
Phi Nominal par Nominal
.
,089
,000
V de Cramer
,089
,000
Coefficient de contingence
,089
,000
Nombre d'observations valides a. L'hypothèse nulle n'est pas considérée. b. Utilisation de l'erreur standard asymptotique dans l'hypothèse nulle.
1600
Les tests de Phi, de V de cramer, et du coefficient de contingence viennent appuyer le constat de la très faible association entre le genre et la possession de carte de fidélité.
Test d’association : Test de Khi-Deux
Mesures directionnelles