78 0 2MB
Tests statistiques sous SPSS
Analyses Uni-variées (tris à plat)… Rappels: L’analyse univariée permet de décrire et de synthétiser les résultats de l’étude en analysant les variables une par une. Analyse: 1. Procédure SPSS: Analyse Statistique descriptive Fréquences 1- Sélectionner les variables pour lesquelles on souhaite connaître les fréquences ; les faire passer dans le cadre variable(s) en cliquant sur la flèche. 2- Cliquer sur statistique et sélectionner les éléments désirés. -Pour une variable nominale: mode , distribution de fréquence, minimum, maximum -Pour une variable ordinale: mode , distribution de fréquence, minimum, maximum, médiane -Pour une variable métrique: mode , distribution de fréquence, minimum, maximum, médiane, moyenne, variance, … Puis cliquer sur poursuivre; puis OK
Distribution de fréquence Procédure SPSS: Analyse Statistique Fréquence
Sélectionner les variables pour lesquelles on souhaite connaître les fréquences les faire passer dans le cadre variable(s) en cliquant sur la flèche et cliquer sur OK
Résultat
Le cas des tableaux à réponses multiples … Rappels : Dans quel cas a-t-on un tableau multiple ? Par exemple, dans le questionnaire sur les " Pratiques culturelles des étudiants" une question est : « parmi la liste des émissions TV, ci-dessous, quelles sont vos 3 émissions préférées ? ». Réponses possibles : •La marche du siècle, F3 •Thalassa F3 •Pyramide F2 •Nulle part ailleurs, Canal+ •Etc. Le codage retenu est le suivant : nous avons créé autant de variables que d’émissions de TV proposées. Lorsqu’une émission est mentionnée comme appartenant aux 3 émissions préférées, elle est codée « 1 », sinon « 0 ». Dans ce cas, on a créé autant de variables que de modalités de réponses, chacune étant codée de façon binaire. Il serait fastidieux de sortir un tableau de fréquences pour chaque variable ainsi créée. De plus l’interprétation ne serait pas aisée. SPSS permet de faire les calculs pour l’ensemble des modalités de réponses en une seule opération. Analyse :
Pour calculer des fréquences sur un tableau multiple il faut créer un vecteur (analyse
réponses multiples définir les vecteurs),
Puis demander les fréquences (analyse
réponses multiples
fréquences)
Sélectionner l’ensemble des variables correspondant aux différentes modalités de réponses Indiquer quelle est la valeur comptée. Si oui est codé « 1 » et non est codé « 0 » , la valeur comptée est «1 » Donner un nom de variable et une étiquette au nouveau vecteur
4 Ajouter le nouveau vecteur à la liste des vecteurs, puis fermer
analyse
réponses multiples
fréquences
Sélectionner le vecteur puis cliquer sur OK
Interprétation des résultats : Réponses multiples : Group EM_PREF émissions préférées (value tabulated =1) Dichotomy label
Name
Tout est possible, TF1 La marche du siècle, F3 Thalassa, F3 Nulle part ailleurs, C+ Des chiffres et des lettres, F2 Cote Ouest, TF1 Le juste prix, TF1 Le cercle de minuit Souillon de culture, F2 Grosses têtes, TF1 Faut pas rêver Perdu de vue, TF1 Capital, M6 Les mercredis de l’histoire Arrêt sur images, 5 X files, M6 Julie Lescault, TF1 Téléshopping, TF1 Stade2, F2
E.TOUT E.MARCHE E.THALA E.NULLE E.CHIFFR E.COTEO E.JUSTE E.CERCLE E.BOUILL E.GROSSE E.FAUT E.PERDU E.CAPIT E.MERCRE E.ARRET E.XFILES E.JULIE E.TELESH E.STADE
Count
Total responses
Pct of responses
Pct of Cases
2 16 17 87 5 5 2 1 4 2 22 1 111 14 35 26 9 1 18
.5 4.2 4.5 23.0 1.3 1.3 .5 .3 1.1 .5 5.8 29.4 3.7 9.3 6.9 2.4 .3 4.8
1.5 12.1 12.9 65.9 3.8 3.8 1.5 3.0 1.5 16.7 .8 84.1 10.6 26.5 19.7 6.8 .8 13.6
378
100.0
286.4
10 missing cases 132 valid cases
132 individus sur 142 ont répondu et il ont cité 378 émissions
Parmi les 378 réponses obtenues, 29,4% correspondent à l’émission capital sur M6
84,1% des 132 individus ont cité capital comme une de leurs 3 émissions préférées.
Fiche n° 2 : Test de la normalité des variables Rappels: De nombreuses méthodes statistiques reposent sur la normalité des variables métriques (ou de certaines variables ordinales, considérées comme métriques telles que les variables mesurées par des échelles de Likert). Procédure SPSS, Analyse et interprétation des résultats: Sélectionner : Analyse Statistiques descriptives Fréquences Statistique cocher asymétrie et aplatissement dans Distribution.
Pour que la variable puisse être considérée comme suivant une loi normale, le coefficient d’asymétrie ou « Skewness" doit être inférieur à |1| et le coefficient d’aplatissement ou "Kurtosis" doit être inférieur à |1,5|
•
Il est également possible d’obtenir une représentation graphique qui superpose l’histogramme de la variable considérée et la courbe Gaussienne théorique.
• La procédure SPSS: Sélectionner Analyse Statistiques descriptives Fréquence Diagramme Histogramme et courbe gaussienne.
Fiche n° 3: Les tris croisés et les tests d’indépendance du χ² Faire des tris croisés et demander le test d’indépendance du χ²
Rappels: Il est nécessaire de recourir au tests d’indépendance du χ² lorsque l’analyse porte sur une relation bivariée comprenant deux variables non métrique (nominale et/ou ordinale). L’analyse de deux variables non métriques s’effectue à l’aide de fréquences conjointes (tableau de contingence). Le tableau croisé contient les fréquences correspondant au croisement des caractéristiques qui définissent les deux variables.
Procédure SPSS : Pour obtenir un tableau croisé et faire le test d’indépendance du χ² la procédure SPSS est: Sélectionner : Analyse Statistiques descriptives Tableaux croisés.
RESULTATS ET INTERPRETATION : Lecture d’un tableau croisé :
• Interpréter les résultats du test du χ² : • Le test du χ² permet de vérifier si une relation entre deux variables (non métriques) existe dans la population • Le test du χ² permet donc d’accepter ou de rejeter l’hypothèse H0 "il n’y a pas de relation entre les deux variables dans la population dont est issu l’échantillon".
Ici la valeur du χ² est relativement grande, ce qui lui permet d’être supérieure à la valeur critique correspondant au seuil de signification statistique de 0,05. ainsi, nous avons une signification de 0,000 ce qui nous permet de rejeter H0 et de conclure qu’il existe bien une relation entre les deux variable dans la population Remarque : dans la lecture du tableau du Khi-deux, il est préférable de se référer au seuil de signification statistique qui est toujours le même (0,05) plutôt qu’à la valeur du χ² qui varie selon le nombre de degrés de liberté.
Nombre d’individus féminins et secrétaires
Pourcentage des secrétaires de féminin parmi toutes les femme
Pourcentage des secrétaires de sexe féminin parmi tous les secrétaires
Pourcentage des secrétaires de sexe féminin parmi tous les individus de l’échantillon
Ici la valeur du χ² est relativement grande, ce qui lui permet d’être supérieure à la valeur critique correspondant au seuil de signification statistique de 0,05. ainsi, nous avons une signification de 0,000 ce qui nous permet de rejeter H0 et de conclure qu’il existe bien une relation entre les deux variable dans la population
Attention : l’effectif théorique de chaque cellule du tableau doit être supérieur à 5. Dans le cas contraire, il peut être nécessaire de procéder à des regroupements de modalités
Remarque : dans la lecture du tableau du Khi-deux, il est préférable de se référer au seuil de signification statistique qui est toujours le même (0,05) plutôt qu’à la valeur du χ² qui varie selon le nombre de degrés de liberté.
FICHES N° 4 LES TESTS DE COMPARAISON DE MOYENNES
Rappels Il est nécessaire de recourir aux tests de comparaison de moyennes lorsque l’analyse porte sur une relation bivariée comprenant une variable non métrique (nominale ou ordinale) et une variable métrique (d’intervalle ou de ratio). Les tests de comparaison de moyennes sont également utilisables lorsque l’on a une variable métrique et une valeur de test. Le test de comparaison de moyennes est approprié à l’analyse de relations de dépendance et d’interdépendance. Il existe 3 types de tests de comparaison de moyennes selon la situation à analyser et la nature de l’échantillon :
1. Les tests de comparaison de moyennes pour échantillons indépendants 2. Les tests de comparaison de moyennes pour échantillons appariés 3. Les tests de comparaison de moyennes pour échantillon unique.
Le test de comparaison de moyennes pour échantillons indépendants… Rappels : Le test de comparaison de moyennes pour échantillons indépendants suppose que la variable non métrique (nominale ou ordinale) comporte seulement 2 modalités. Lorsque la variable non métrique comporte plus de 2 modalités (dans ce cas, il y a donc plus de 2 moyenne à comparer), il devient nécessaire de faire une analyse de variance à un facteur. L’hypothèse H0 est ici la suivante : "les moyennes observées dans les deux groupes sont égales« l’hypothèse alternative est H1 "les moyennes observées dans les deux groupes sont différentes". Exemple, on souhaite savoir si le salaire à l’embauche est égal chez les hommes et les femmes.
Procédure SPSS Sélectionner : Analyse Comparer les moyennes Test t pour échantillons indépendants.
1.on sélectionne la variable métrique sur laquelle on souhaite faire le test de comparaison de moyennes
2. on sélectionne la variable non métrique à partir de laquelle on constitue les deux sous-échantillons
3. on définit les sous-échantillons à partir des valeurs de la variable non métrique. Dans cet exemple, le premier sous-échantillon est constitué par les hommes « 1 » et le second par les femmes « 2 ».
RESULTATS ET INTERPRETATION : Test-t
Salaire d'embauche
Sexe de l'employé Féminin Masculin
Nombre d’individus composant chaque sous-échantillon. On considère généralement qu’il faut au minimum 30 individus par sous-groupe. Cette condition est à vérifier, contrairement au test du Chi-deux, SPSS ne donne pas d’indication dans ce sens
N
Moyenne
Ecart-type
Erreur standard moyenne
216
$13,091.97
$2,935.599
$199.742
258
$20,301.40
$9,111.781
$567.275
Moyenne de chaque souséchantillon sous la variable à tester (variable métrique). Cet indicateur permet de se faire un première idée et de voir quel sous-groupe à la moyenne la plus élevée.
Lorsque le test de Levene n’est pas significatif, nous considérons le résultat du test basé sur l’hypothèse des variances égales. Il faut alors lire les résultats du test de comparaison de moyennes (Test † pour égalité des moyennes) sur la première ligne. Lorsque le test de Levene est significatif, il faut alors considérer le résultat du test basé sur l’hypothèse des variances inégales. Il faut alors lire résultats du test de comparaison de moyennes (Test t pour égalité des moyennes) sur la deuxième ligne.
Test de Levene sur l'égalité des variances
Pour que le test de comparaison de moyennes soit significatif et que l’on puisse rejeter H0 , il faut que la significativité (p) soit ≤ à 0,05. ici, c’est le cas ce qui veut dire que l’on peut considérer qu’il existe une relation entre le sexe et le salaire à l’embauche.
Test-t pour égalité des moyennes
Intervalle de confiance 95% de la différence
F Salaire Hypothèse de d'embauche variances 105,969 égales Hypothèse de variances inégales
Sig.
T
ddl
Sig. Différence (bilatérale) moyenne
Différenc e écarttype Inférieure
Supérieure
472
,000
-$7,209.43 $646.447
$8,479.698
-$5,939.158
-11,987 318,818
,000
-$7,209.43 $601.413
$8,392.667
-$6,026.188
,000 -11,152
Le test de comparaison de moyennes pour échantillons appariés… Rappels : Le test de comparaison de moyennes pour échantillons appariés suppose que la variable non métrique (nominale ou ordinale) comporte seulement deux modalités. Le test de comparaison de moyennes pour échantillons appariés est utilisé lorsque l’on souhaite comparer deux moyennes calculées chez les mêmes individus. Par exemple, on peut souhaiter comparer l’attitude des spectateurs face à un produit marocain et face à un produit étranger. Autre exemple, on peut souhaiter savoir si les individus dépensent plus dans un magasin A que dans un magasin B. Il est parfois également nécessaire de faire des mesures "avant / après" , comme par exemple lors d’une exposition à une publicité, pour voir si il y a un effet de la pub. Dans ce cas, on teste l’hypothèse H0 selon laquelle les moyennes observées dans les deux groupes sont égales.
Procédures SPSS :
Sélectionner Analyse Comparer les moyennes Test t pour échantillons appariés
Sélectionner les deux variables dont on souhaite comparer les moyennes et cliquer sur la flèche. NB : il faut sélectionner les 2 faut sélectionner les 2 variables en même temps pour avoir accès à la flèche
Résultats et Interprétation (exemple 1): Statistiques pour échantillons appariés
Paire Regarder la TV c’est une 1. activité qui compte vraiment beaucoup pour moi. j’aime particulièrement parler d’émissions de TV
Moyenn e
N
2.50 2.69
139 139
Ecarttyp e
Erreur standard moyenne
P est à 0,05, on peut donc en conclure que la différence entre les deux moyennes est statistiquement significative
On a un écart de /0,19/ Entre les 2 moyennes Différences
Moyenne
Paire 1
Regarder la TV c’est une activité qui compte vraiment beaucoup pur moi, j’ai particulièrement parler d’émission de TV
-19
Ecart-type
1.06
Erreur standard moyenne
9.01E609
Intervalle de confiance 95% de la différence
Inférieur
supérieure
-37
-1.61E-02
t
-2.156
ddl
Sig (bilatérale)
138
033
La valeur de l’écart permet de calculer le t auquel on associe une significativité (p)
Exemple 2 Test-t Statistiques pour échantillons appariés
Moyenne Paire 1
METHODE1 METHODE
N
Ecart-type
Erreur standard moyenne
45,8500
20
3,63137
,81200
48,6000
20
3,76130
,84105
Corrélations pour échantillons appariés N Paire 1
METHODE1 & METHODE
Corrélation 20
Sig.
,465
,039
Test échantillons appariés
Différences appariées
Moyenne Paire 1
METHODE1 METHODE
Ecarttype
-2,7500 3,82340
Intervalle de Erreur confiance 95% de la différence standard moyenn Supérieu e Inférieure re ,85494
-4,5394
-,9606
t -3,217
ddl 19
Sig. (bilatérale) ,005
Remarque : il est possible de faire simultanément l’analyse pour plusieurs paires de variables. Dans ce cas, on obtient un tableau de « test échantillons appariés » de la forme suivante : Sélectionner: Analyse Comparer les moyennes Test t pour échantillons appariés Sélectionner deux paires ou plus.
Remarque : il est possible de faire simultanément l’analyse pour plusieurs paires de variables. Dans ce cas, on obtient un tableau de « test échantillons appariés » de la forme suivante : Sélectionner: Analyse Comparer les moyennes Test t pour échantillons appariés Sélectionner deux paires ou plus.
Test échantillons appariés Différences Moyen n e
Paire 1
Paire 2
Regarder la TV c’est une activité qui compte vraiment beaucoup pur moi, j’ai particulièrement parler d’émission de TV Regarder la TV c’est une activité qui compte vraiment beaucoup pur moi, je me sens particulièrement attiré(e) par les émissions de TV
Ecartt y p e
Erreur standar d moyen ne
Intervalle de confiance 95% de la différence
Inférieur
supérieure
t
ddl
Sig (bilatérale)
-19
1.06
9.01E609
-37
-1.61E-02
-2156
138
033
-11
.98
8.24E-02
-28
4.87E-02
-1.387
139
0.168
Dans cette deuxième paire p= 0,168 ce qui est supérieur au seuil de 0,05. dans ce cas, on conclut qu’il n’existe pas de différence statistiquement significative entre les deux moyennes
Le test de comparaison de moyennes pour échantillon unique … Rappels : Le test de comparaison de moyennes pour échantillon unique est un peu différent des deux précédents. Il permet de comparer la moyenne d’une variable métrique avec une valeur, issue de données secondaires. Gardons l’exemple du cas « Pratiques culturelles des étudiants de la FSTG ». Imaginons qu’un organisme de sondage ait récemment fait une enquête auprès de la population étudiante du Maroc et que cette étude a montré que les étudiants marocains dépensent en moyenne 50 Dh par jours en « produits alimentaires ». L’hypothèse H0 testée est alors la suivante : la moyenne obtenue pour l’échantillon des étudiants à à la FSTG est égale à celle relevée pour l’ensemble des étudiants marocains.
Procédures SPSS
Sélectionner : Analyse Comparer les moyennes Test t pour échantillon unique
Sélectionner la variable dont on veut comparer la moyenne à la valeur de test, puis entrer la valeur de test (dans notre exemple, 50)
Résultats et interprétation :
Statistiques sur échantillon unique
Budget sorties au cinéma
N
Moyenne
Ecart-type
Erreur standard moyenne
141
79.78
47.78
4.02
Les étudiants de la FSTG dépensent en moyenne 79,82 DH par mois pour leur produit alimentaires. Cette moyenne est elle significativement différente de la moyenne nationale (50 DH) ? Test sur échantillon unique Valeur du test = 50
t
Budget sorties au cinéma
7.411
ddi
140
Sig (bilatérale)
000
Différence moyenne 29.82
Intervalle de confiance 95% de la différence inférieure
Supérieure
21.87
37.78
La valeur du p est significative (0,05), ce qui signifie que la moyenne dépensée mensuellement par les étudiants de la FSTG est différente (statistiquement significative) de la moyenne dépensée mensuellement par l’ensemble des étudiants marocains.
FICHE N° 6 : CORRELATION ET REGRESSION LINEAIRES
La corrélation… Rappels : Un coefficient de corrélation r est une mesure d’association (d’interdépendance) entre deux variables métriques. Elle mesure l’intensité de la co-variation entre les deux variables. Cette mesure est standardisée (i.e,. elle ne dépend pas de l’unité utilisée pour chaque variable), et est comprise entre -1et +1. Plus le coefficient est proche de 1 en valeur absolue, plus les variables sont dites corrélées : si r est proche de +1, ceci signifie que les deux variables varient dans le même sens (ex., « les dépenses de loisirs et le revenu ») ; si r est proche de -1, ceci signifie que les deux variables varient en sens inverse l’une de l’autre (ex., « plus on s’éloigne du centre de Casa, moins les loyers sont élevés ») ; Plus r est proche de 0, moins les variables sont corrélées. 0 signifie l’absence de corrélation entre les deux variable (attention d’autres relations restant toujours possibles, exemple : relations sinusoïdale de type y = sin x). Dans la mesure où l’on travaille sur un échantillon (et non sur la population totale, donc la corrélation observée peut être due à la fluctuation), SPSS teste, si le coefficient obtenu est significativement différent de 0 (autrement dit, si le coefficient obtenu est différent de 0 dans la population). Il indique le risque d’erreur de première espèce (sig.), à savoir, le risque de rejeter à tort l’hypothèse de non corrélation (ou ce qui revient au même, l’hypothèse H0 suivante : r = 0). Si H0 est rejetée, alors on conclut que les variables sont corrélées. SPSS permet de représenter sur un tableau croisé les mesures de corrélation deux à deux d’un nombre illimité de variables (par rapport à des besoins usuels, j’entend).
Procédure SPSS :
Fichier utilisé : Voitures.sav ou utiliser les données du TD2 exo 13 (poids et tailles des bébés)
Analyse Corrélation Bivariée
Basculer les variables dont ont souhaite mesurer les coefficients de corrélation deux à deux, de la fenêtre de gauche à la fenêtre de droite
Cocher « coefficient de corrélation de Pearson ».
Puis OK
Résultats et interprétation : Corrélations
miles par gallon
cylindrée (cu. inches)
puissance
poids du véhicule (lbs.)
temps d'accélération de 0 à 60 mph (sec)
Corrélation de Pearson Sig. (bilatérale) N Corrélation de Pearson Sig. (bilatérale) N Corrélation de Pearson Sig. (bilatérale) N Corrélation de Pearson Sig. (bilatérale) N Corrélation de Pearson Sig. (bilatérale) N
miles par cylindrée poids du gallon (cu. inches) puissance véhicule (lbs.) 1,000 -,789** -,771** -,807** , ,000 ,000 ,000 398 398 392 398 -,789** 1,000 ,897** ,933** ,000 , ,000 ,000 398 406 400 406 -,771** ,897** 1,000 ,859** ,000 ,000 , ,000 392 400 400 400 -,807** ,933** ,859** 1,000 ,000 ,000 ,000 , 398 406 400 406 ,434** -,545** -,701** -,415** ,000 ,000 ,000 ,000 398 406 400 406
temps d'accélération de 0 à 60 mph (sec) ,434** ,000 398 -,545** ,000 406 -,701** ,000 400 -,415** ,000 406 1,000 , 406
**. La corrélation est significative au niveau 0.01 (bilatéral).
Pour chaque couple de variable (xi, xj), les résultats indiquent le coefficient (de Pearson) estimé, et le risque d’erreur de première espèce ou signification (sig.)-soit le risque de se tromper sur le sens de la corrélation-. Si sig. ‹0,05, on peut conclure à l’existence d’un corrélation, au seuil 0,05 entre les deux variables (au seuil de signification indiqué par la statistique sig.) le symbole **indique tous les sig. Inférieurs à 0.05. Ceci permet une lecture rapide du tableau.
Création du diagramme interactif Cet exercice présente les procédures de base permettant de créer des diagrammes interactifs à l’aide du sous-menu Interactif du menu Graphes. Il illustre les opérations suivantes : •Création d’un diagramme en bâtons interactif récapitulant des groupes d’observations •Modification de la légende pour créer un diagramme en bâtons juxtaposés •Affichage des valeurs moyennes dans un diagramme en bâtons •Application d’un modèle de graphiques •Collage d’un diagramme interactif dans une autre application
Cet exercice utilise le fichier Employes data.sav
Les diagrammes standard (non interactifs) sont présentés après. si vous souhaitez modifier un diagramme crée par une procédure statistique comme fréquences, suivez les instructions relatives aux diagrammes standard. "Glisser-déplacer". En ce qui concerne les diagrammes interactifs, la technique du « glisser- déplacer » permet de déplacer les variables à l’intérieur des boîtes de dialogue. (Dans les autres boîtes de dialogue du système, l’utilisateur doit cliquer sur un bouton fléché pour déplacer une variable).
Procédure SPSS Graphe
Interactif
Battons
Le type de variable est indiqué par une icône :
Intégrée
Echelle
Catégorielle
Faites glisser la variable Catégorie d’emploi vers cette cible.
Cliquez sur OK. Le diagramme est affiché dans le Viewer, comme l’illustre la Figure suivante
La figure Illustre un diagramme en bâtons simple représentant le nombre d’observation dans chaque catégorie d’emploi.
La variable Effectif est affectée par défaut à l’axe vertical. Trois types de variable sont disponibles dans la liste des variables : variables intégrées, d’échelle et catégorielles. Une dimension de données intégrée crée un diagramme sur la base des effectifs ou des pourcentages des observations trouvées dans vos données. Par exemple, la variable Effectif produit un diagramme sur la base des effectifs des observations dans chaque catégorie. Une dimension de données d’échelle produit un diagramme dans lequel une fonction de la variable est représentée (la valeur moyenne, par exemple). La variable Salaire actuel est une variable d’échelle. Une dimension de données catégorielle produit un diagramme avec des graduations indiquant des valeurs discrètes, sans valeurs entre les graduations. La variable Catégorie d’emploi est une variable catégorielle. Ses catégories sont Employé de bureau, Personnel pénitentiaire et Cadre. Cliquez sur la variable catégorielle Catégorie d’emploi, maintenez le bouton gauche de la souris enfoncé et faites glisser la variable vers la cible de l’axe horizontal.
Modification de la légende Supposons que vous souhaitez visualiser la répartition des sexes dans les catégories d’emploi. Vous pouvez modifier la légende pour produire une répartition par sexe dans le diagramme. •Double-cliquez sur le diagramme pour l’activer. •Cliquer sur l’outil Affecter les variables du diagramme pour ouvrir la boîte de dialogue du même nom. Faites glisser la variable sexe vers la cible couleur sous variable de la légende. Dans la liste déroulante, sélectionnez Juxtaposer
Boîte de dialogue Affecter les variables du diagramme
Légende Clé
Groupe
Pile
La variable Sexe étant une variable catégorielle, les bâtons sont divisés en deux catégories : masculin et féminin. La légende indique comment les couleurs sont affectées à chaque sexe. Vous remarquez que, dans ce jeu de données, davantage de fermes occupent un poste d’employé de bureau et davantage d’homme occupent un poste de cadre.
Modifier les variables Modifier l’orientation Modifier la dimension 2 ou 3D
Affichage des valeurs moyennes
Supposons que vous souhaitez les salaires actuels moyens pour chaque catégorie d’emploi. •Dans la boîte de dialogue Affecter les variables du diagramme, replacez la variable sexe dans la liste des variables. Faites glisser la variable salaire actuel vers l’axe vertical et déposez-la sur la variable Effectif. Dans la boîte de dialogue, les variables permutent. La variable Effectif retourne automatiquement dans la liste des variables.
La clé indique à présent que les bâtons représentent les moyennes au lieu des effectifs
Ajout de bâton de variation
Il est souvent utile de connaître la variabilité du récapitulatif représenté. Vous pouvez ajouter des bâtons de variation à un diagramme représentant des valeurs moyennes. Pour ajouter des bâtons de variation : •Fermez la boîte de dialogue Affecter les variables du diagramme. •Cliquez sur Insérer
dans la barre d’outils.
•Sélectionnez Bâtons e variation.
une nouvelle clé indique que les bâtons de variation représentent l’intervalle de confiance 95% de la moyenne.
Application d’un modèle de graphiques
Vous pouvez personnaliser l’aspect d’un diagramme en appliquant un modèle de graphique. Vous pouvez utiliser des modèles de graphiques pour améliorer l’aspect des diagrammes en vue de présentations et de rapports, ou pour standardiser des fonctions comme la couleur et la taille. •Dans le Viewer, double-cliquez sur le diagramme pour l’activer. •A partir du menu, sélectionnez : Format Modèle de graphiques La boîte de dialogue Modèle de graphiques apparaît, comme l’illustre la figure suivante. Elle contient la liste des modèles de graphiques stockés dans le répertoire Looks. •Dans la liste des modèles de graphiques, sélectionnez Classique ou marina •Cliquez sur appliquer, puis sur fermer.
Figure : Boîte de dialogue modèle de graphiques
Classique
Marina
Affichage de bâtons de variation Le modèle de graphiques Classique peut être utilisé pour une présentation en couleurs spectaculaire. Néanmoins, la partie inférieure de chaque bâton de variation n’apparaît pas car il s’agit de la même couleur que celle du bâton associé. Pour résoudre ce problème, vous pouvez modifier la couleur et le style des bâtons de variation. •Double-cliquez sur un bâton de variation. La boîte de dialogue Bâtons de variation apparaît, comme l’illustre la figure suivante.
•Sous Style des bâtons de variation, cliquez sur la liste déroulante Couleur et sélectionnez le noir. •Sous afficher le symbole, cliquez sur la liste déroulante Couleur et sélectionnez le noir. •Cliquez sur ok En général, vous pouvez modifier l’élément d’un diagramme en double-cliquant dessus et en effectuant des sélections dans une boîte de dialogue. Figure Boîte de dialogue Bâtons de variation
Collage d’un diagramme dans une autre application
Vous pouvez coller votre diagramme dans une autre application, et imprimer le document final en noir et blanc. Vous devez d’abord sélectionner un modèle de graphiques approprié pour l’impression en noir et blanc (comme Niveau de gris). •Dans le Viewer, double-cliquez sur le diagramme pour l’activer. •A partir du menu, sélectionnez : Format Modèle de graphiques •Dans la liste des modèles de graphiques, sélectionnez niveaux de gris. •Cliquez sur appliquer, puis sur fermer. Cette opération applique un modèle de graphiques en niveaux de gris dont l’impression en noir et blanc est très réussie. •Cliquez dans le Viewer hors du diagramme pour désactiver ce dernier. •Cliquez une fois à dans le diagramme pour le sélectionner •A partir des menus de l’application cible, sélectionnez : Affichage Coller Vous pouvez maintenant imprimer le diagramme dans l’autre application. (une fois le diagramme collé dans l’autre application, vous ne pouvez plus le modifier).
Exercice : Création et modification de diagrammes de dispersion interactifs Cet exercice présente les bases de la création d’un diagramme en partant de zéro et de l’ajout d’objets de façon interactive. Il illustre les opérations suivantes : •Démarrage avec un diagramme vide •Création d’un diagramme de dispersion interactif •Etiquetage de points dans un diagramme de dispersion •Ajout d’une ligne de régression à un diagramme de dispersion •Ajout de courbes de prévision de la moyenne ajustables Cet exercice utilise le fichier Employée data.sav
Création d’un diagramme de dispersion Un diagramme de dispersion montre la relation entre deux variables continues comme salaire actuel et salaire d’embauche, comme l’illustre la figure suivante.
Cet exercice débute par un diagramme contenant une zone de données vide. Les menus appropriés figurent dans le Viewer. •Si le Viewer n’est pas affiché, à partir des menus, sélectionnez : Fichier Nouveau Résultat Une nouvelle fenêtre du Viewer apparaît
•A partir du menu, sélectionnez : Insérer Graphique 2 D interactif Cette opération insère un diagramme bidimensionnel vide, comme l’illustre la figure suivante
Figure Diagramme bidimensionnel vide
Cliquez sur l’icône affecter les variables du diagramme pour ouvrir la boîte de dialogue du même nom.
Figure : Boîte de dialogue affecter les variables du diagramme •Faites glisser la variable salaire d’embauche de la liste de variables vers l’axe horizontal. •Faites glisser la variable salaire actuel de la liste des variables vers l’axe vertical. La diagramme est toujours vide car nous n’avons pas sélectionnée son type . •A partir du menu sélectionnez : Insérer Nuage Cette opération créé un diagramme de dispersion, come l’illustre la figure suivante
Figure : Diagramme de dispersion
• Etiquetage de points dans le diagramme de dispersion • Supposons que vous souhaitiez étiqueter tout ou partie des points de la variable Expérience passée (nombre de mois). • Dans la boîte de dialogue Affecter les variables du diagramme, sélectionnez l’onglet observations.
Onglet observation
Faites glisser la variable Expérience passée de la liste des variables vers la cible Identifier les points par. Fermer la boîte de dialogue Affecter les variables du diagramme.
Dans le diagramme, tout en maintenant la touche Ctrl enfoncée, cliquer sur trois symboles près de l’extrémité supérieure de l’axe verticale, comme l’illustre la figure suivante:
Trois observations sélectionnées
•Cliquez avec le bouton droit de la souris sur l’une des observations. •Dans le menu contextuel, sélectionnez Propriétés pour ouvrir la boîte de dialogue Propriétés de symbole.
•Sélectionnez afficher l’étiquette. •Cliquez sur ok.
Boîte de dialogue propriétés de symbole
Sur le diagramme, les trois observations sélectionnées sont étiquetées avec la durée (en mois) de l’expérience passée
Dans la boîte de dialogue propriétés de symbole, vous pouvez également modifier le style, la couleur et la taille des symboles du diagramme.
• Ajout d’une ligne de régression • Les points du diagramme de dispersion semblent plus ou moins disposés le long d’une ligne droite. Plusieurs méthodes permettent d’ajuster ne ligne aux points. Une méthode d’ajustement de ligne couramment utilisée est appelée régression. • Pour tracer une ligne ajustée à la distribution des points, à partir des menus, sélectionne : • Insérer • Courbe d’ajustement • Régression • Cette opération insère une ligne de régression dans le diagramme de dispersion, comme l’illustre la figure 7.9. Des étiquettes apparaissent également : elles contiennent l’équation de la ligne et une valeur pour R-eux, statistique qui inique la qualité d’ajustement de la ligne. Les valeurs de R-deux peuvent aller de 0 à 1 : plus cette valeur est proche de 1, meilleur est l’ajustement.