Khi Deux [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Résumé : Khi-deux Les descriptions faites sur les variables soulèvent toute une série de questions sur leurs relations, qui devront être mises en lumière en les rapprochant deux à deux dans des analyses bi-variées. Les tris croisés, qui ont pour objet de rassembler dans un tableau unique les distributions de fréquences ou d'effectifs de deux ou plusieurs variables, sont en général complétés par des mesures d'association qui permettent de démontrer la signification statistique d’association observée entre ces variables. Le test très simple du khi-deux pour vérifier l'association de deux variables qualitatives constitue une bonne introduction.

BOULAHOUAL ADIL

1

1- Principe du test Le principe est de comparer la distribution observée (Oij), c'est-à-dire les effectifs que l'on peut lire dans le tableau croisé, à une distribution théorique (Tij) qui correspond à l'hypothèse selon laquelle les deux variables sont indépendantes. Normalement, si les variables étaient indépendantes, l'effectif observé ne devrait dépendre que des effectifs marginaux, c'est-à-dire de l'effectif total de chaque modalité. Autrement, nous cherchons à vérifier si l'association des deux variables est suffisamment forte pour que l'hypothèse de leur indépendance puisse être rejetée.

2- Procédure du test

r

Nous posons l’hypothèse nulle : H0 : Il n’y a pas de relation entre les deux variables. H1 : Il existe une relation statistiquement significative entre les deux variables. 2

Nous rejetons l’hypothèse nulle (on conclut que la relation existe) si :  > 

2

c

   2

i 1 j 1

O

ij

 Tij 

2

Tij

0,05 [(r-1)(c-1)]

i = numéro de la ligne; j = numéro de la colonne; r = nombre de lignes, c'est-à-dire le nombre de modalités de la variable présentée en lignes; c = nombre de colonnes, c'est-à-dire le nombre de modalités de la variable présentée en colonnes.

N.B : La loi du 2 suit une distribution asymétrique dont la forme dépend du nombre de degrés de liberté n. Le nombre de degrés de liberté varie en fonction du nombre de modalités des variables et se calcule de la manière suivante: (r-1)(c -1). Il est important de noter aussi que ce test est assez sensible à la taille de l'échantillon, à la taille du tableau croisé et que, normalement, chaque case du tableau devrait avoir un effectif théorique au moins égal à cinq(5). Procédures sous SPSS : Analyse – Statistiques descriptives – Tableaux croisés – Chi-deux – Poursuivre – Ok. Règle : Si la signification du test est inférieure au seuil choisi nous rejetons l’hypothèse nulle et nous confirmons l’existence d’association entre les variables étudiées.

Test d’association : Test de Khi-Deux

Où:

0,50 0,30 0,10 0,01

3- Indicateurs mesurant la force de l'association

   

V V V V V V

     =

0,70 0,69 0,49 0,29 0,09 0,00

Relation très forte Relation forte Relation modérée Relation faible Relation très faible Relation nulle

-

Dans le cas particulier des tableaux carrés 2 x 2 (2 lignes et 2 colonnes), qui comparent deux variables à deux modalités, il est recommandé d'appliquer une correction au 2 , ou d'utiliser le coefficient phi (  ).

-

Le coefficient de contingence (C) peut être appliqué pour des mesures d'association sans contrainte de taille de tableau. Nous pouvons mesurer la force de la relation entre les deux variables par le biais de l’indice V de Cramer ; Le coefficient d'association prédictive (lambda) permet de mesurer dans quelle proportion une variable qualitative indépendante influence une variable qualitative dépendante. C'est donc une mesure dissymétrique qui - contrairement aux précédentes - a pour objet une force de prédiction. 2 2 2 C V    2  n n( L  1) n

BOULAHOUAL ADIL

2

Exercice d’application

 Hommes Femmes

Possède une carte fidélité Ne possède pas de carte fidélité Total T : 250* O : 220 T : 750* O : 780 1000 T:



T:

O:

450*

400

TOTAL

2

O : 180

150*

1200

2 2 2 2  220  250  780  750  180  150  420  450     

250

750

150

450

 12,8

420

600 1600

Au seuil de 5% et à un degré de liberté 2 de 1,  tabulée est égale à 0,004 2 > 20,05 [(r-1)(c-1)]

12,8 > 0,004 Conclusion: Les deux variables sont significativement associées

Test d’association : Test de Khi-Deux

Vérifier l’existence d’association entre le genre et a possession de carte de fidélité et mesurer la force de cette association sachant que 25% (400/1600) des clients possèdent une carte de fidélité.

Tests du Khi-deux Valeur

ddl

Signification asymptotique (bilatérale)

12,800a

1

,000

Correction pour la continuité

12,377

1

,000

Rapport de vraisemblance

12,619

1

,000

Khi-deux de Pearson b

Signification exacte (bilatérale)

Signification exacte (unilatérale)

,000

,000

Test exact de Fisher

La signification du test de Khi-Deux est inférieure au seuil classique 5% nous pouvons confirmer l’existence d’association significative entre les deux variables étudiées.

BOULAHOUAL ADIL

3

Nombre d'observations valides 1600 a. 0 cellules (0,0%) ont un effectif théorique inférieur à 5. L'effectif théorique minimum est de 150,00. b. Calculé uniquement pour un tableau 2x2

Valeur Symétrique Lambda Nominal par Nominal

Erreur standard asymptotique

a

T approximé b

.

b

.

b

.

Sig.approximée b

.

,000

,000

.

Sexe dépendant

,000

,000

.

Possession dépendant

,000

,000

.

Sexe dépendant

,008

,005

,000

Possession dépendant

,008

,005

,000

b

b

c

Tau de Goodman et Kruskal a. L'hypothèse nulle n'est pas considérée. b. Calcul impossible /: l'erreur standard asymptotique est égale à zéro. c. Basé sur une approximation du Khi-deux

c

La valeur du test symétrique de Lambda est de « 0,000 » qui veut dire l’association entre le genre est la possession d’une carte fidélité est presque inexistante. La statistique Lambda est égale à « 0,000 » dans le cas ou la variable sexe est considérée comme dépendante et lorsque la possession est considérée comme dépendante aussi.

Mesures symétriques Valeur

Signification approximée

Phi Nominal par Nominal

.

,089

,000

V de Cramer

,089

,000

Coefficient de contingence

,089

,000

Nombre d'observations valides a. L'hypothèse nulle n'est pas considérée. b. Utilisation de l'erreur standard asymptotique dans l'hypothèse nulle.

1600

Les tests de Phi, de V de cramer, et du coefficient de contingence viennent appuyer le constat de la très faible association entre le genre et la possession de carte de fidélité.

Test d’association : Test de Khi-Deux

Mesures directionnelles