33 1 2MB
UNIVERSITE SIDI MOHAMED BEN ABDELLAH ECOLE NATIONALE DE COMMERCE ET DE GESTION -FES-
Enseignant: Abdessamad OUCHEN
1
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Introduction générale Le mot statistique tire son origine du latin statisticus relatif à l’état (status). Il est apparu vers le milieu du XVIIème siècle. Au pluriel, les « statistiques » signifient un ensemble de données numériques relatives à un groupe d’individus. On parle des statistiques du chiffre d’affaires, de celles du produit intérieur brut, de celles du cours d’un indice boursier, etc. Au singulier, la « statistique » signifie un ensemble des méthodes qui permettent de rassembler, de présenter et d’analyser un ensemble de données numériques. 2
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Dans un premier temps, la statistique a été employée dans un sens purement descriptif de recueil ou de collection de faits chiffrés, les statistiques. Dans un second temps, elle a été utilisée pour étendre les résultats et dégager des lois (l’inférence). Elle vise à dégager, à partir de données observées sur quelques individus d’une population, des résultats valables pour l’ensemble de la population. Elle est alors un moyen scientifique d’analyse et de compréhension d’un phénomène étudié. Elle s’applique à l’économie ainsi qu’à toutes les sciences sociales et de la nature. 3
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La méthodologie statistique
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
la statistique descriptive qui consiste à remplacer des données nombreuses par des indicateurs les plus pertinents possibles ainsi qu’à les résumer sous forme de tableaux ou de graphiques ; l’inférence statistique qui vise, à partir de la description statistique, la mise en évidence de certaines permanences ou lois statistiques qui peuvent constituer des outils de prévision ; la théorie des probabilités (objet du cours du calcul des probabilités en 2ème année) qui signifie l’analyse mathématique des phénomènes dans lesquels le hasard intervient et qui est utilisée pour déterminer les précisions des estimations de certains paramètres (la théorie de l’estimation) ou des tests de certaines hypothèses (la théorie des tests) : l’inférence statistique (objet du cours de la 4 statistique appliquée en 3ème année).
5
Chapitre 1
• les séries statistiques simples (à un caractère)
Chapitre 2
• les séries statistiques doubles (à deux caractères)
Chapitre 3
• les indices statistiques
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
6
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Définitions
1- Population, individu et échantillon 1-1- Population La population est l’ensemble des éléments auxquels se rapportent les données étudiées, par exemple l’ensemble des étudiants d’un établissement, l’ensemble des produits d’une usine, l’ensemble des poissons d’une rivière, l’ensemble des entreprises d’un secteur donné, etc. 7
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2- Individu ou unité statistique Un individu est un élément de la population. En d’autres termes, c’est l’élément de l’ensemble que l’on veut étudier, par exemple un étudiant est un individu lorsque l’on étudie la population des étudiants d’un établissement, un produit est un individu lorsque l’on
étudie la population des produits d’une usine, etc. 1-3- Echantillon C’est un sous-ensemble d’une population statistique. 8
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Variable statistique ou caractère et ses modalités 2-1- Variable statistique ou caractère Un individu peut être décrit selon un ou plusieurs
caractères
ou
variables
qui
peuvent
être
des
caractéristiques qualitatives ou prendre des valeurs
numériques. Par exemple, une entreprise d’un secteur donné peut être
décrite selon son chiffre d’affaires, ou selon le nombre de ses salariés, ou encore selon sa forme juridique. 9
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Modalités d’un caractère ou d’une variable statistique
Les
modalités
sont
les
différentes
situations
disjonctives et exhaustives d’un caractère et chaque
individu présente alors une modalité et une seule du caractère. 2-3- Caractère quantitatif discret ou continu Un caractère ou variable X est quantitatif si ses diverses modalités sont mesurables ou repérables, c’est-àdire à chaque modalité j est associé un nombre xj.
10
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
a- Un caractère est discret si les différentes modalités du caractère sont des valeurs numériques isolées. Par exemple, pour l’ensemble des assurés d’une société d’assurance automobile, on associe à chaque adhérent le nombre annuel d’accidents déclarés qui est un des entiers : x1=0, x2=1, x3=2,…
11
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Cas d’une variable discrète On considère 10 familles d’un quartier avec au moins un enfant de 0 à 17 ans (en âge révolu) : f1, f2, …, f10. A chaque
famille fi est associé le nombre d’enfants xi : x1=1, x2=2, x3=1, x4=2, x5=3, x6=4, x7=3, x8=5, x9=1, x10=2. La population statistique P est l’ensemble des familles du quartier ayant au moins un enfant de 0 à 17 ans (en âge révolu): P={f1, f2, …, f10}. Chaque élément fi de P, c’est-à-dire chacun des 10 familles,
est un individu ou une unité statistique. 12
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La variable statistique est l’application X : P → {1, 2, 3, …} qui, à chaque famille fi, associe le nombre X(fi)=xi d’enfants. On constate que X(P)={1, 2, 3, 4, 5} et que les nombres d’observations associées à chacune des valeurs de X(P) sont
respectivement : n1=3, n2=3, n3=2, n4=1 et n5=1. Nombre
1
2
3
4
5
3
3
2
1
1
d’enfants Effectifs ni 13
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
b- Un caractère est continu s’il peut prendre n’importe quelle
valeur d’un intervalle. Par exemple, pour l’ensemble des employés d’une entreprise, les salaires appartiennent aux intervalles suivants:
[3000 DH; 6000 DH[; [6000 DH; 9000 DH[; [9000 DH; 12000 DH[; [12000
DH;
15000
DH[;
[18000 DH; 21000 DH[.
14
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
[15000
DH;
18000
DH[
et
*Cas d’une variable continue Le quartier industriel Sidi Brahim dispose de 25 PME. A chaque entreprise ei de la population statistique P={e1, e2, e3, …, e25} est associé le chiffre d’affaires ci. On définit ainsi une applicationX : P → ℝ+, ei → X(ei) = ci. Chiffre d’affaires
c < 40
40 ≤ c < 50
50 ≤ c < 60
60 ≤ c < 70
70 ≤ c < 80
2
8
8
4
3
annuel (en millions de DH) Effectifs
Les valeurs possibles de X appartiennent à 5 intervalles : [0, 40[ ; [40, 50[ ; [50, 60[ ; [60, 70[ ; [70, 80[ dont les effectifs respectifs associés sont n1=2 ; n2=8 ; n3=8 ;
n4=4 ; et n5=3. 15
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-4- Caractère qualitatif Un caractère est qualitatif si chaque modalité ne peut être mesurée ou repérée par un nombre. Toutefois, il est toujours possible de rendre numérique une telle variable en associant un nombre à chaque modalité et les modalités sont alors codées. Sur des variables qualitatives codées, les opérations algébriques n’ont généralement pas de sens. Par exemple, la situation matrimoniale d’un individu : 1) célibataire, 2) marié, 3) veuf, 4) divorcé. 16
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 2- Distributions statistiques et représentations graphiques 1- Variables statistiques discrètes
Soit X une variable discrète qui prend les valeurs numériques x1, x2, …, xK (où x1< x2< …< xK) et soit ni les
effectifs associés à chaque valeur xi. Le nombre total d’observations est n=n1+n2+…+nK.
17
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-1- Présentation en tableau
18
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2- Représentations graphiques a- Diagramme en bâtons Dans un système d’axe cartésien, portant en abscisses les valeurs xi de la variable statistique X et en ordonnées les effectifs ni ou les fréquences fi, on trace, à partir de chaque valeur xi, un segment de droite vertical (le bâton)
dont la hauteur (la longueur du bâton) est proportionnelle à l’effectif ni ou à la fréquence fi relative et on obtient
ainsi le digramme en bâtons. 19
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : Le tableau ci-dessous présente la distribution de 100 familles selon le nombre de pièces du logement. Nombre
de
1
2
3
4
5
6
7
8
Total
Effectifs
10
15
15
30
10
12
5
3
100
Fréquences
0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03
pièces
20
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1
21
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
22
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-3- Effectif cumulé et fréquence relative cumulée a- Effectif cumulé (croissant) L’effectif cumulé croissant jusqu’à une valeur xh de la
variable X est le nombre d’individus pour lesquels la variable X prend une valeur inférieure ou égale à xh.
b- Fréquence relative cumulée (croissante) La fraction Fh du nombre total d’individus pour lesquels la variable X prend une valeur inférieure ou égale à xh est la
fréquence relative cumulée croissante des valeurs de X jusqu’à xh. 23
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Valeurs de X
Effectifs
Effectifs cumulés
Fréquences
Fréquences relatives
ou modalités xi
ni
croissants Ni
relatives fi
cumulées croissantes Fi
x1
n1
N1 = n1
f1 = n1 / n
F1 = f1
x2
n2
N2 = n1 + n2
f2 = n2 / n
F2 = f1 + f2
x3
n3
N3 = n1 + n2 + n3
f3 = n3 / n
F3 = f1 + f2 + f3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
xh
nh
Nh = n1 + n2 +…+ nh
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
xk
nk
Nk =
fk = nk / n
Fk = 1
24
𝑘 𝑖=1 𝑛𝑖
=𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
fh = nh / n
Fh = f1 + f2 + … + fh
Exemple : On reprend le cas de la distribution de 100 familles selon le nombre de pièces du logement.
Nombre
de
1
2
3
4
5
6
7
8
Total
Effectifs
10
15
15
30
10
12
5
3
100
Fréquences
0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03
pièces
25
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1
Nombre
Effectifs
Effectifs
Fréquences
Fréquences
de pièces
ni
cumulés
relatives fi
relatives cumulées
croissants Ni
26
croissantes Fi
1
10
10
0,1
0,1
2
15
25
0,15
0,25
3
15
40
0,15
0,4
4
30
70
0,3
0,7
5
10
80
0,1
0,8
6
12
92
0,12
0,92
7
5
97
0,05
0,97
8
3
100
0,03
1
Total
100
-
1
-
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Variables statistiques continues
Lorsque n est grand (une infinité des valeurs observables d’une variable continue)
27
l’analyse cidessus de cette série d’observations de vient fastidieuse (par exemple, la généralisation du diagramme en bâtons)
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Subdiviser le domaine des valeurs numériques possibles de la variable statistique continue en K classes consécutives d’amplitudes égales ou non : [e0,e1[, [e1, e2[, …, [ek-1, ek[ et de grouper toutes les observations qui appartiennent à une même classe.
L’intervalle [ei-1, ei[ fermé à gauche, ouvert à droite, est appelé ième classe (i = 1, 2, …, k). Son amplitude est égale à : ai = ei - ei-1.
28
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-1- Présentation en tableau
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableau- Effectifs et fréquences relatives
29
Valeurs de X
Effectifs ni
Fréquences relatives fi
e0 ≤ x < e1
n1
f1 = n 1 / n
e1 ≤ x < e2
n2
f2 = n 2 / n
.
.
.
.
.
.
.
.
.
ei-1 ≤ x < ei
ni
fi = n i / n
.
.
.
.
.
.
.
.
.
ek-1 ≤ x < ek
nk
fk = nk / n
ni est l’effectif de la classe [ei-1, ei[. La fréquence relative de la ième classe est fi=ni/n.
Exemple : Le tableau ci-dessous présente la répartition des salaires de 200 salariés de l’entreprise Atlas. Tableau- Effectifs et fréquences relatives Valeurs du salaire
Effectifs ni
en DH
30
Fréquences
relatives fi
3000 ≤ x < 6000
50
0,25
6000 ≤ x < 9000
90
0,45
9000 ≤ x < 12000
30
0,15
12000 ≤ x < 15000
15
0,075
15000 ≤ x < 18000
10
0,05
18000 ≤ x < 21000
5
0,025
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Représentations graphiques a- Histogramme On peut représenter dans un repère orthogonal la
fréquence relative de chaque classe par la surface d’un rectangle qui lui est égale ou proportionnelle. Cette représentation, nommée histogramme, est ainsi obtenue par la juxtaposition de rectangles dont les bases représentent les différentes classes et dont les surfaces sont proportionnelles aux fréquences relatives 31
des classes. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
En effet, à la ième classe, correspond un rectangle dont la base est l’intervalle [ei-1, ei[ et dont la surface est proportionnelle à la fréquence fi.
32
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
les classes ont toutes la même amplitude • les hauteurs des rectangles sont égales aux fréquences
33
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
les classes sont d’amplitudes inégales • la hauteur du rectangle correspondant à la ième classe d’amplitude ai sera hi = fi . ar / ai où ar représente l’amplitude de référence (la plus petite des amplitudes).
Histogramme des fréquences hi
𝑓𝑎
ℎ2 = (𝑒 2−𝑒𝑟
1)
2
𝑓𝑎
𝑖 𝑟 ℎ𝑖 = (𝑒 −𝑒
𝑖−1 )
𝑖
𝑓𝑎
ℎ1 = (𝑒 1−𝑒𝑟 1
ℎ𝑘 = (𝑒
0)
𝑓𝑘 𝑎𝑟 𝑘 −𝑒 𝐾−1 )
e0 34
e1
e2
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ei-1
ei ai
ek-1
ek
xi
Remarque : Pour une série d’observations relatives à une variable statistique X discrète ou continue classée, la
donnée des modalités xi et de leurs fréquences fi est appelée « distribution statistique » de la variable X.
35
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemples : i) cas de classes avec amplitudes égales : On reprend l’exemple de la distribution des salaires des salariés de l’entreprise Atlas. Histogramme 0,5 0,4 hi =fréquence fi
0,3
0,2 0,1 0 0
36
3000
6000
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
9000 12000 15000 18000 21000 valeurs du salaire
ii) cas de classes avec amplitudes inégales : Le tableau ci-dessous présente la distribution de chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Ancienneté d’inscription
Fréquence fi
hi = fi . ar / ai
362
0,168
0,168
D’un mois à moins de 3 mois
409,8
0,19
0,095
De trois mois à moins de six mois
326,2
0,151
0,0503
De six mois à moins d’un an
382,2
0,177
0,0295
D’un an à moins de deux ans
398,6
0,185
0,0154
De deux ans à moins de trois ans
150,8
0,07
0,0058
Trois ans ou plus
125,8
0,058
0,0024
Total
2155,4
1
-
Effectif ni (en milliers)
Moins d’un mois
37
La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois). Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
38
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
b- Polygone des fréquences :
*Lorsque les classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ ont une même amplitude a (a = ei - ei-1), on joint par des
segments de droites les milieux des sommets des rectangles de l’histogramme des fréquences. Le milieu
Mi du sommet du rectangle relatif à la classe [ei-1, ei[ a pour abscisse xi = (ei-1 + ei) / 2 et pour ordonnée yi = fi. Aux extrémités, on ajoute les segments [M0 M1] et [Mk Mk+1] où M0 et Mk+1 ont respectivement pour 39
coordonnées (e0 – a / 2, 0) et (ek + a / 2, 0). Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple 1: On reprend l’exemple de la distribution des salaires des salariés de l’entreprise Atlas. Histogramme et polygone des fréquences 0,5 0,45 0,4 0,35 0,3 hi=fréquence 0,25 fi 0,2 0,15 0,1 0,05 0
0
40
3000
6000
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
9000 12000 15000 18000 21000 valeur du salaire
*Lorsque les classes n’ont pas la même amplitude, on considère parmi les k classes celle ou celles qui ont la plus petite longueur θ. On subdivise l’histogramme des fréquences en sous rectangles de même base égale à la longueur θ. On joint par des segments les milieux des intervalles de longueur θ des sommets des sous rectangles de l’histogramme des fréquences à partir du point M0(e0 - θ/2, 0) jusqu’au point Mk(ek + θ/2, 0).
41
Remarque : L’aire située sous le polygone doit être égale à l’aire de l’ensemble des rectangles de l’histogramme. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : On reprend l’exemple de la distribution de chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Puisque les amplitudes des classes sont inégales et la plus petite
amplitude est θ=1, on subdivise alors l’histogramme des fréquences en sous rectangles de même base égale à la longueur θ=1 et on joint
par des segments les milieux des intervalles de longueur θ=1 des sommets des sous rectangles de l’histogramme des fréquences à partir du point M0(-1/2, 0) jusqu’au point M62 (60,5 , 0). 42
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Histogramme et polygone des fréquences hi
.
M1
..
M3
M2
.
M0
0 1 3
43
.
M61 Mois
6
12
24
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
36
60
Remarques : i) L’aire située sous le polygone doit être égale à l’aire de
l’ensemble des rectangles de l’histogramme. ii) Si l’amplitude la plus petite n’est pas un diviseur
commun des autres amplitudes, on choisit une valeur de θ, autre que la plus petite amplitude, qui doit être un diviseur commun de toutes les amplitudes afin de faciliter la subdivision des rectangles de l’histogramme en des sous rectangles de base θ. 44
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-3- Effectif cumulé et fréquence relative cumulée a- Effectif cumulé croissant L’effectif cumulé croissant de la hème classe est le
nombre d’individus Nh pour lesquels la variable X prend une valeur inférieur à eh.
45
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
b- Fréquence relative cumulée (croissante) La fréquence cumulée croissante de la hème classe est la fraction Fh du nombre total d’individus pour lesquels la
variable X prend une valeur inférieure à eh.
46
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableau- Effectifs, fréquences relatives, effectifs cumulés croissants, fréquences relatives cumulées croissantes
47
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : On reprend le cas de la distribution des chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Ancienneté d’inscription
Effectif ni
Fréquences fi
(en milliers) Moins d’un mois
362
0,168
D’un mois à moins de 3 mois
409,8
0,19
De trois mois à moins de six
326,2
0,151
De six mois à moins d’un an
382,2
0,177
D’un an à moins de deux ans
398,6
0,185
De deux ans à moins de trois ans
150,8
0,07
Trois ans ou plus
125,8
0,058
Total
2155,4
1
mois
La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois). 48
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableau- Effectifs, fréquences relatives, effectifs cumulés croissants, fréquences relatives croissantes Ancienneté d’inscription
Effectifs
Effectifs
Fréquence
Fréquences
ni
cumulés
s relatives
relatives
croissants Ni
fi
cumulées croissantes Fi
Moins d’un mois
362
362
0,168
0,168
D’un mois à moins de 3 mois
409,8
771,8
0,19
0,358
De trois mois à moins de six mois
326,2
1098
0,151
0,509
De six mois à moins d’un an
382,2
1480,2
0,177
0,686
D’un an à moins de deux ans
398,6
1878,8
0,185
0,871
De deux ans à moins de trois ans
150,8
2029,6
0,07
0,941
Trois ans ou plus
125,8
2155,4
0,058
1
2155,4
-
1
-
Total 49
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3- Variables qualitatives Soit C une variable qualitative qui prend les modalités c1, c2, …,cK et soit ni les effectifs associés à chaque modalité
ci.
Le
nombre
n=n1+n2+…+nK.
50
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
total
d’observations
est
3-1- Présentation en tableau Tableau- Effectifs et fréquences relatives Modalités du caractère C
Effectifs ni
Fréquences relatives fi
c1
n1
f1=n1/n
c2
n2
f2=n2/n
.
.
.
.
.
.
.
.
.
ci
ni
fi=ni/n
.
.
.
.
.
.
.
.
.
ck-1
nk-1
fk-1=nk-1/n
ck
nk
fk=nk/n
𝑘
𝑘
𝑛𝑖 = 𝑛 𝑖=1
51
𝑓𝑖 = 1 𝑖=1
ni est l’effectif de la modalité ci. La fréquence relative de la modalité ci est fi=ni/n. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3-2- Représentations graphiques a- Diagramme en « tuyaux d’orgue »
Dans un repère orthogonal, portant en abscisses les modalités ci de la variable qualitative C et en ordonnées les
effectifs ni ou les fréquences fi, on trace, à partir de chaque modalité ci, un rectangle (tuyau) qui a pour base cette
modalité ci et comme hauteur l’effectif ni ou la fréquence fi. La base de chacun des rectangles ne possède aucune
signification numérique puisque la variable est qualitative et les bases des rectangles sont égales. 52
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : Le tableau ci-dessous présente la distribution de 100 personnes selon la catégorie socioprofessionnelle. Catégories Effectifs Fréquences Socioprofessionnelles ni fi Agriculteurs 10 0,1 Commerçants 30 0,3 Cadres 20 0,2 Ouvriers 30 0,3 Retraités 10 0,1 Total 100 1 53
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Diagramme en tuyaux d'orgue 0,35
0,3
0,25
0,2
Fréquences fi 0,15
0,1
0,05
0 Agriculteurs
Commerçants
Cadres
Catégories socioprofessionnelles
54
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Ouvriers
Retraités
b- Diagramme en secteurs
Appelé aussi « Camembert » ou digramme circulaire, le diagramme en secteurs partage un disque en des aires
proportionnelles aux effectifs (ou aux fréquences).
55
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : On reprend l’exemple de la distribution de 100 personnes selon la catégorie socioprofessionnelle. Catégories Effectifs Fréquences Socioprofessionnelles ni fi Agriculteurs 10 0,1 Commerçants 30 0,3 Cadres 20 0,2 Ouvriers 30 0,3 Retraités 10 0,1 Total 100 1 56
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Diagramme en secteurs : On porte sur le disque successivement : -Angle AôB : [AôB] = 0,1 x 360°=36°. La surface du secteur (AOB) représente la part des agriculteurs dans l’ensemble des 100 personnes ; -Angle BôC : [BôC] = 0,3 x 360° = 108°. La surface du secteur (BOC) représente la part des commerçants dans l’ensemble des 100 personnes ; -Angle CôD : [CôD] = 0,2 x 360° = 72°. Le secteur (COD) représente la part des cadres dans l’ensemble des 100 personnes ; -Angle DôE : [DôE] = 0,3 x 360° = 108°. Le secteur (DOE) représente la part des ouvriers dans l’ensemble des 100 personnes ; -Angle EôA : [EôA] = 0,1 x 360° = 36°. Le secteur (EOA) représente la part des retraités dans l’ensemble des 100 personnes. 57
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Diagramme en secteurs A
Retraités 10%
A B
B
A
E
B A
Agriculteurs 10%
B E
B B A
Ouvriers 30%
Commerçants 30%
O C
C D
C
D D
58
D
D
D
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Cadres 20%
C C
C
Section 3- Les indicateurs statistiques
• Les indicateurs de tendance centrale ; • Les indicateurs de dispersion ; • Les indicateurs de forme.
59
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-Les indicateurs de tendance centrale
Ce sont des indicateurs qui synthétisent l’ensemble d’une série statistique en faisant ressortir une position centrale de la valeur du caractère étudié. Ils regroupent la valeur médiane, différents types de moyennes et la valeur modale.
60
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-1-Moyenne arithmétique 𝒙 La valeur moyenne d’une série statistique est la somme de toutes les observations divisée par le nombre total d’observations. Autrement dit, la valeur moyenne 𝑥 d’une série de n observations 𝑥1 , 𝑥2 , …,𝑥𝑛 est 𝑥 =
61
1 𝑛 𝑥 1 +𝑥 2 +⋯+𝑥𝑛 𝑥 = . 𝑖 𝑖=1 𝑛 𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
i) le cas d’une variable discrète : Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1, 𝑥2, …, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne 𝑥 est : 𝑥 =
62
1 𝑘 𝑛 1 𝑥 1 + 𝑛 2 𝑥 2 +⋯+ 𝑛 𝑘 𝑥 𝑘 𝑛 𝑥 = 𝑖 𝑖 𝑖=1 𝑛 𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. Nombre
de
1
2
3
4
5
6
7
8
Total
Effectifs
10
15
15
30
10
12
5
3
100
Fréquences
0,1 0,15 0,15 0,3
pièces
8
0,1 0,12 0,05 0,03
1
1 10𝑥1 + 15𝑥2 + 15𝑥3 + 30𝑥4 + 10𝑥5 + 12𝑥6 + 5𝑥7 + (3𝑥8) 𝑥= 𝑛𝑖 𝑥𝑖 = = 3,86 𝑛 100 𝑖=1
63
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) le cas d’une variable continue : Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0 , e1[,[e1, e2[, …, [ek-1, ek[ d’effectifs respectifs𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne 𝑥 est : 𝑥 = ème
i classe : 𝑥𝑖 =
64
𝑒𝑖−1 +𝑒𝑖 2
1 𝑘 𝑛 1 𝑥 1 +𝑛 2 𝑥 2 +⋯+𝑛 𝑘 𝑥 𝑘 𝑛 𝑥 = 𝑖 𝑖 𝑖=1 𝑛 𝑛
.
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
où 𝑥𝑖 est le centre de la
On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. Tableau- Effectifs et fréquences relatives Valeurs du salaire en DH
Effectifs ni
Fréquences relatives fi
3000 ≤ x < 6000
50
0,25
6000 ≤ x < 9000
90
0,45
9000 ≤ x < 12000
30
0,15
12000 ≤ x < 15000
15
0,075
15000 ≤ x < 18000
10
0,05
18000 ≤ x < 21000
5
0,025
Total
200
1
6
1 50𝑥4500 + 90𝑥7500 + 30𝑥10500 + 15𝑥13500 + 10𝑥16500 + (5𝑥19500) 𝑥 = 𝑛𝑖 𝑥𝑖 = = 8400 𝐷𝐻 𝑛 200 65
𝑖=1Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2-Autres moyennes usuelles i) Moyenne harmonique H : La moyenne harmonique H de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes non nulles, est l’inverse de la moyenne arithmétique des inverses des valeurs xi : 1 1 = 𝐻 𝑛
66
𝑛
𝑖=1
1 1 1 1 1 = ( + + ⋯+ ) 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 , non nulles, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne harmonique est : 𝑘
1 1 𝑛𝑖 1 𝑛1 𝑛2 𝑛𝑘 = = ( + + ⋯+ ) 𝐻 𝑛 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛 𝑖=1
𝐻=
𝑛
𝑛
=𝑛 𝑛 𝑛 𝑛𝑘 1 2 𝑘 𝑖 𝑖=1 𝑥 𝑥 + 𝑥 + ⋯ + 𝑥 𝑖 1 2 𝑛
La définition de la moyenne harmonique présuppose que X ne prend pas la valeur 0. 67
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 8
1 1 𝑛𝑖 1 10 15 15 30 10 12 5 3 = = + + + + + + + = 0,3509 𝐻 𝑛 𝑥𝑖 100 1 2 3 4 5 6 7 8 𝑖=1
Ou encore : 𝐻 =
68
𝑛
=
100
8 𝑛 𝑖 10 15 15 30 10 12 5 3 + + + + + ++ 𝑖=1 𝑥 1 2 3 4 5 6 7 8 𝑖 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
= 2,8498
ii) Moyenne géométrique G : La moyenne géométrique G de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes strictement positives, est définie ainsi :
𝑛
𝑛
𝑥𝑖 = 𝑛 𝑥1 𝑥2 … 𝑥𝑛
𝐺= 𝑖=1
Cette formule implique : 1 𝑙𝑛 𝐺 = 𝑛 69
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝑛
ln(𝑥𝑖 ) 𝑖=1
Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 , strictement positives, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne géométrique est :
𝑛
𝑘
𝑥𝑖 𝑛 𝑖 = 𝑛 𝑥1 𝑛 1 𝑥2 𝑛 2 … 𝑥𝑘 𝑛 𝑘
𝐺= 𝑖=1
𝑘
𝑥𝑖 𝑓 𝑖 = 𝑥1 𝑓1 𝑥2 𝑓2 … 𝑥𝑘 𝑓 𝑘
𝐺= 𝑖=1
Ces formules impliquent: 𝑘
𝑙𝑛 𝐺 =
𝑓𝑖 𝑙𝑛(𝑥𝑖 ) 𝑖=1
70
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 𝑛
8
𝑥𝑖 𝑛 𝑖
𝐺=
=
100
110 215 315 430 510 612 75 83
𝑖=1
𝐺=
71
8 𝑓𝑖 𝑥 𝑖=1 𝑖
= 10,1 20,15 30,15 40,3 50,1 60,12 70,05 80,03 =3,3882
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
iii) Moyenne quadratique Q : Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 ,…,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne quadratique Q est la racine carrée de la moyenne arithmétique des carrés des valeurs 𝑥𝑖 :
1 𝑄= 𝑛
72
𝑘
𝑛𝑖 (𝑥𝑖 )2 𝑖=1
1 = (𝑛1 𝑥1 2 + 𝑛2 𝑥2 2 + ⋯ + 𝑛𝑘 𝑥𝑘 2 ) 𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement.
𝑄=
73
1 8 1 2 2 𝑛 (𝑥 ) = [ 10 𝑥 1 𝑖 𝑖 𝑛 𝑖=1 100
+ 15 𝑥 22 + 15 𝑥 32 + 30 𝑥 42 + 10 𝑥 52 + 12 𝑥 62 + 5 𝑥 72 +( 3 𝑥 82)] = 4,2474
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
N.B. : Quelle que soit la série statistique considérée où tous les 𝑥𝑖 sont strictement positifs : H≤G≤x≤Q
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. H = 2,8498 ≤ G = 3,3882 ≤ x = 3,86 ≤ Q = 4,2474
74
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-3-Le mode i) le cas d’une variable discrète :
Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1, 𝑥2, …, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, le mode 𝑚𝑜 est la valeur 𝑥𝑖𝑜 de la variable statistique pour laquelle l’effectif 𝑛𝑖𝑜 est maximal : 𝑚𝑜 = 𝑥𝑖𝑜 .
75
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement.
Avec la valeur 𝑥4=4, l’effectif 𝑛4 = 30 est maximal.
Le mode est alors 𝑚𝑜 = 𝑥4 = 4.
76
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) le cas d’une variable continue :
Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs respectifs 𝑛1 , 𝑛2 , … , 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la classe modale est celle qui, dans l’histogramme des fréquences , a la plus grande ordonnée. L’intervalle [eio-1, eio[ est la classe modale si et seulement si : ℎ𝑖𝑜 = (𝑒
77
𝑓 𝑖𝑜 𝑎 𝑟 𝑖𝑜 −𝑒 𝑖𝑜−1
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝑓𝑖 𝑎𝑟
> ℎ = ∀ 𝑖 ≠ 𝑖𝑜 𝑖 ) (𝑒 −𝑒 ) 𝑖 𝑖−1
𝑑1
La valeur 𝑚𝑜 = 𝑒𝑖𝑜−1 + (𝑒𝑖𝑜 − 𝑒𝑖𝑜−1)(𝑑 +𝑑 ) est la valeur modale, où :𝑒𝑖𝑜−1 est 1 2
l’extrémité inférieure de la classe modale, 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1 est l’amplitude de la classe modale, 𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 et 𝑑2 = 𝑓𝑖 − 𝑓𝑖+1 lorsque les classes ont la même amplitude ou 𝑑1 = 𝑓′𝑖 − 𝑓′𝑖−1 et 𝑑2 = 𝑓′𝑖 − 𝑓′𝑖+1 lorsque les classes ont des amplitudes différentes.
78
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. D’après l’histogramme, c’est la classe [6000 ; 9000[ qui a la plus grande ordonnée : h2 = f2 = 0,45. D’où la classe modale est [eio-1, eio[ = [6000 ; 9000[ et la valeur modale est : 𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1
79
𝑑1 0,45 − 0,25 = 6000 + 9000 − 6000 = 7200 𝐷𝐻 𝑑1 + 𝑑2 0,45 − 0,25 + 0,45 − 0,15
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Quant à l’exemple de la distribution des chômeurs inscrits à
l’ANAPEC selon l’ancienneté de chômage en Janvier 2015, c’est la classe [0 ; 1[ qui a la plus grande ordonnée :
h1 = f1 . ar / a1 = f’1 = 0,168.
D’où la classe modale est [eio-1, eio[ = [0 ; 1[ et la valeur modale est : 𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1
80
𝑑1 𝑑 1 +𝑑 2
=0+ 1−0
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
0,168−0 0,168−0+0,168−0,095
= 0,6971 𝑚𝑜𝑖𝑠.
Dans la plupart des cas concrets, il y a une seule
valeur modale, la distribution est dite alors unimodale. Si la distribution sur une population comporte deux ou
plusieurs
modes
(distribution
bimodale
ou
multimodale) cela laisse à penser qu’il existe deux ou
plusieurs groupes distincts dans la population. Par exemple, la distribution des pointures de chaussures des hommes et femmes réunies. 81
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-4- La médiane et les quantiles
a- La médiane La médiane est la valeur de la variable statistique telle qu’il ait autant d’observations supérieures et
d’observations inférieures à cette valeur. Elle partage la série statistique en deux parties d’égal effectif.
82
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
i) le cas d’une variable discrète : *Soit une série statistique de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 connues, distinctes ou non et classées par ordre de valeurs croissantes : 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛 . On appelle médiane la valeur 𝑚𝑒 , telle que : (nombre d’observations inférieures ou égales à 𝑚𝑒 ) ≥ n/2 et (nombre d’observations supérieures ou égales à 𝑚𝑒 ) ≥ n/2. Autrement dit, il y a au moins 50 % des observations qui ont une valeur inférieure ou égale à 𝑚𝑒 la médiane et il y a au moins 50% des observations qui ont une valeur supérieure ou égale à 𝑚𝑒 . Sa définition dépend de la parité de n : ∗ - Si n est un nombre impair (n = 2 p + 1), la valeur médiane sera 𝑚𝑒 = 𝑥𝑝+1 ; ∗ - Si n est un nombre pair (n = 2 p), la valeur médiane sera 𝑚𝑒 = (𝑥𝑝∗ + 𝑥𝑝+1 )/2. 83
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple: Afin de réaliser une étude sur la rentabilité sectorielle dans le secteur S1, une enquête permet d’obtenir les taux de rentabilité en % de 8 entreprises : 2,5 ; 3 ; 3,1 ; 4,1 ; 5,4 ; 4,5 ; 5,2 ; 2,5. La valeur médiane de cet échantillon est obtenue en classant ces 8 valeurs par ordre croissant : Rang de
1
2
3
4
5
6
7
8
2,5
2,5
3,0
3,1
4,1
4,5
5,2
5,4
l’observation i Rentabilité financière (en%) xi
84
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Le nombre d’observations n = 8 étant un nombre pair (n = 2 p avec p = 4) la valeur médiane me
correspond à 𝑥𝑝∗ + 𝑥𝑝+1∗ /2soit: 𝑥4∗ + 𝑥5∗ /2 = 3,1 + 4,1 /2 = 3,6.
85
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Pour comparer la rentabilité des firmes de ce secteur S1 à celle des firmes du secteur S2, on a prélevé dans ce dernier un échantillon de 9 entreprises : 3 ; 3,5 ; 3,8 ; 4,1 ; 4,1 ; 4,5 ; 5,5 ; 5,5 ; 4,2. Pour obtenir la valeur médiane de ce deuxième échantillon, on réécrit les valeurs de cette série dans l’ordre croissant : Rang de
1
2
3
4
5
6
7
8
9
3
3,5
3,8
4,1
4,1
4,2
4,5
5,5
5,5
l’observation i Rentabilité financière (en%) xi 86
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La taille de l’échantillon étant un nombre impair
(n = 2p +1 avec p = 4), la valeur médiane me correspond à xp+1* : me = x5 = 4,1.
87
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) le cas d’une variable continue : Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs respectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la classe médiane est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,5 par excès, c’est-à-dire Fi>0,5.
88
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Par interpolation linéaire, on a :
𝑚𝑒 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
= 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
89
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
0,5 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1 0,5 − 𝐹𝑖−1 𝑓𝑖
On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. la classe médiane est la classe [6000, 9000[ dont la
fréquence cumulée croissante approche 0,5 par excès, c’est-à-dire F2 = 0,70 > 0,5.
90
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
D’où : la classe médiane est : [e1, e2[=[6000 ; 9000[ et, par
interpolation linéaire, on a :
𝑚𝑒 = 𝑒1 + 𝑒2 − 𝑒1
0,5 − 𝐹1 = 𝑒1 + 𝑒2 − 𝑒1 𝐹2 − 𝐹1
𝑚𝑒 = 6000 + 9000 − 6000
0,5 − 0,25 0,70 − 0,25
= 6000 + 9000 − 6000
91
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
0,5 − 𝐹1 𝑓2
0,5 − 0,25 = 7666,6667 0,45
b- Les quantiles
Le quantile est un indicateur de position. Il est une généralisation de la notion de médiane.
Le quantile d’ordre α (0 ≤ α ≤ 1), noté 𝑥𝛼 , est tel qu’une proportion α des individus ait une valeur du
caractère X inférieure ou égale à 𝑥𝛼 . Le quantile 𝑥0,5 est égal à la médiane.
Les quantiles les plus courants sont : les quartiles, les déciles et les centiles. 92
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Les quartiles sont les valeurs d’une série ou d’une distribution statistique rangées par ordre croissant (ou
décroissant) qui partagent l’effectif total en quatre parties égales. Ils sont les quantiles d’ordre ¼, ½ et ¾.
Ils sont ainsi notés : Q1 = premier quartile = 𝑥0,25 ; Q2 = deuxième quartile = médiane = 𝑥0,5 et Q3 = troisième quartile = 𝑥0,75 (Q1 ≤ Q2 ≤ Q3). 93
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
i) le cas d’une variable discrète : Les trois quartiles Q1, Q2 et Q3 sont des nombre qui partagent les n observations en 4 classes qui ont chacune un effectif sensiblement égal à n/4. Le second quartile coïncide évidemment avec la médiane.
94
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Premier quartile. Le premier quartile Q1 est défini comme suit : Q1= (xn/4* + xn/4+1*)/2 si n/4 est un entier ;
Q1= x[n/4]+1* (où [n/4] est la partie entière de n/4) si n/4 n’est pas un entier.
On a la propriété : il y a au moins 25 % des observations qui ont une valeur inférieure ou égale à 𝑄1 et il y a au moins 75% des observations qui ont une valeur supérieure ou égale à 𝑄1 . 95
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Deuxième quartile. Sa valeur Q2 est égale à la médiane me. Troisième quartile. Sa valeur Q3 est définie comme suit : Q3= (x3n/4* +x3n/4+1*)/2 si 3n/4 est un entier ;
Q3= x[3n/4]+1* (où [3n/4] est la partie entière de 3n/4) si 3n/4 n’est pas un entier.
On a la propriété : il y a au moins 75 % des observations qui ont une valeur inférieure ou égale à 𝑄3 et il y a au moins 25% des observations qui ont une valeur supérieure ou égale à 𝑄3 . 96
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : Pour l’échantillon des 8 firmes issues de S1, le nombre d’observations n étant égal à 8, n/4 est l’entier 2. Par suite Q1= (xn/4* + xn/4+1*)/2=(x2* + x3*)/2=(2,5+3)/2=2,75. 3n/4 étant l’entier 6, on a: Q3=(x3n/4* + x3n/4+1*)/2=(x6* + x7*)/2=(4,5+5,2)/2=4,85.
Pour les 9 firmes issues de S2 le nombre d’observations n n’est pas divisible par 4 car n/4=9/4=2,25. Et [n/4] la partie entière de n/4 étant égale à 2, on a Q1= x[n/4]+1* = Q1= x* =3,8. De même, on a Q3= x[3n/4]+1* = x7* =4,5. 97
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) le cas d’une variable continue :
Premier quartile. La classe qui contient le premier quartile est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,25 par excès, c’est-à-dire Fi>0,25.
Par interpolation linéaire on a :
𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
0,25 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1
Deuxième quartile. Sa valeur Q2 est égale à la médiane me.
Troisième quartile. La classe qui contient le troisième quartile est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,75 par excès, c’est-à-dire Fi>0,75.
Par interpolation linéaire on a :
𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
98
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
0,75 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1
Exemple : On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas.
La classe qui contient le premier quartile est la classe [6000, 9000[ telle que F(9000) = 0,7 > 0,25 et F(6000) = 0,25 ≤ 0,25. Par interpolation linéaire on a :
𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
0,25 − 𝐹𝑖−1 = 6000 + 9000 − 6000 𝐹𝑖 − 𝐹𝑖−1
0,25 − 0,25 = 6000. 0,7 − 0,25
Deuxième quartile. Sa valeur Q2 est égale à la médiane me = 7666,6667.
Troisième quartile. Sa valeur estimée Q3 est définie par F(Q3) = 0,75. La classe qui contient le troisième quartile est la classe [9000, 12000[ telle que F(12000)=0,85 > 0,75 et F(9000)=0,7 ≤ 0,75. Par interpolation linéaire on a :
𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1 99
0,75 − 𝐹𝑖−1 = 9000 + 12000 − 9000 𝐹𝑖 − 𝐹𝑖−1
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
0,75 − 0,7 ≈ 10000. 0,85 − 0,7
2- Les indicateurs de dispersion
2-1-La dispersion en termes d’écarts moyens
Le calcul des écarts moyens se basent sur les caractéristiques de tendance centrale, telles que : la valeur médiane me ou la valeur moyenne 𝑥. Il considère ces écarts en valeur absolue ou en puissance paire afin de traduire correctement la dispersion.
100
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
a-Ecarts absolus moyens i) Ecart absolu moyen par rapport à la valeur médiane 𝑚𝑒 L’écart absolu moyen par rapport à la valeur médiane me d’une série de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 est
𝑒𝑚 𝑒 =
1 𝑛
𝑛
𝑖=1
1 𝑥𝑖 − 𝑚𝑒 = ( 𝑥1 − 𝑚𝑒 + 𝑥2 − 𝑚𝑒 + ⋯ + 𝑥𝑛 − 𝑚𝑒 ) 𝑛
Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu moyen par rapport à la valeur médiane me est :
𝑒𝑚 𝑒 101
1 = 𝑛
𝑘
𝑖=1
1 𝑛𝑖 𝑥𝑖 − 𝑚𝑒 = (𝑛1 𝑥1 − 𝑚𝑒 + 𝑛2 𝑥2 − 𝑚𝑒 + ⋯ + 𝑛𝑘 𝑥𝑘 − 𝑚𝑒 ) 𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) Ecart absolu moyen par rapport à la moyenne arithmétique 𝑥 L’écart absolu moyen par rapport à la moyenne arithmétique x d’une série de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 est 1 𝑒x = 𝑛
𝑛
𝑖=1
1 𝑥𝑖 − x = ( 𝑥1 − x + 𝑥2 − x + ⋯ + 𝑥𝑛 − x ) 𝑛
Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu moyen par rapport à la moyenne arithmétique x est : 1 𝑒x = 𝑛 102
𝑘
𝑖=1
1 𝑛𝑖 𝑥𝑖 − x = (𝑛1 𝑥1 − x + 𝑛2 𝑥2 − x + ⋯ + 𝑛𝑘 𝑥𝑘 − x ) 𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
b- Variance et écart-type Ils mesurent la dispersion des données autour de la moyenne. La variance d’une variable statistique X est la moyenne arithmétique des carrés des écarts à la moyenne arithmétique : Var(X) = V(X) =
1 𝑛
𝑛 𝑖=1(𝑥𝑖
1
− 𝑥 )2 = 𝑛
𝑛 2 𝑖=1 𝑥𝑖
− 𝑥2
Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la variance de X est : V(X) =
1 𝑛
𝑘 𝑖=1 𝑛𝑖 (𝑥𝑖
− 𝑥 )2 =
1 𝑛
𝑘 2 𝑖=1 𝑛𝑖 𝑥𝑖
− 𝑥2
Lorsque X est une variable continue les 𝑥𝑖 sont les centres des classes [ei-1 ; ei[ : 𝑥𝑖 = 103
𝑒 𝑖−1 +𝑒 𝑖 2
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
L’écart-type est la racine carrée de la variance : 𝜎𝑋 = 𝑉(𝑋) L’écart-type est exprimé dans la même unité que les observations, alors que la variance s’exprime dans le carré de cette unité. N.B. : L’écart-type donne plus de poids aux observations extrêmes que l’écart absolu moyen à la moyenne : 𝜎𝑋 ≥ 𝑒𝑥 . 104
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple 1 (le cas d’une variable discrète): On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 𝒙𝒊 1 2 3 4 5 6 7 8 Total 105
𝒏𝒊 10 15 15 30 10 12 5 3 100
𝒏𝒊𝒙𝟐𝒊 10 60 135 480 250 432 245 192 1804
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝒙𝒊 − 𝒙 -2,86 -1,86 -0,86 0,14 1,14 2,14 3,14 4,14 -
(𝒙𝒊 − 𝒙)𝟐 8,1796 3,4596 0,7396 0,0196 1,2996 4,5796 9,8596 17,1396 -
𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐 81,796 51,894 11,094 0,588 12,996 54,9552 49,298 51,4188 314,04
La variance de X est : 𝑉 𝑋 Ou encore :
1 𝑘 2 2 1804 = 𝑛 𝑖=1 𝑛𝑖 𝑥𝑖 − 𝑥 = 100
1 𝑘 2 314,04 V(X) = 𝑛 𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥) = 100 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2
L’écart-type de X est : 𝜎𝑋 = 𝑉(𝑋) = 1,7721 𝑝𝑖è𝑐𝑒𝑠.
106
− 3,862 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple 2 (le cas d’une variable continue): On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. Valeurs du salaire en milliers de DH
𝒙𝒊 (le centre de la classe [ei-1; ei[) 4,5
𝒏𝒊
𝒏𝒊 𝒙𝒊
𝒏𝒊 𝒙𝟐𝒊
𝒙𝒊 − 𝒙
(𝒙𝒊 − 𝒙)𝟐
𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐
50
225
1012,5
-3,9
15,21
760,5
6≤x 0, alors la liaison linéaire est positive ;
*Lorsque r(X, Y) = 0, alors la liaison linéaire est nulle ; il existe peut être une liaison non linéaire entre
X et Y; 148
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Le coefficient de corrélation linéaire entre deux variables quantitatives indépendantes est nul, mais la réciproque n’est pas vraie : 𝑋 𝑒𝑡 𝑌 𝑖𝑛𝑑é𝑝𝑒𝑛𝑑𝑎𝑛𝑡𝑒𝑠 → ↚ 𝑟 𝑋, 𝑌 = 0
149
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Ajustement linéaire d’un nuage de points :
Lors d’une étude simultanée de deux variables quantitatives X et Y sur des individus, on cherche si ces
variables sont liées. X et Y peuvent alors être liées par une relation fonctionnelle du type y = f(x).
150
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Ces
deux
variables
peuvent
être
totalement
indépendantes, telles que la taille de l’étudiant et sa note de statistique, totalement dépendantes telles que la distance x du rayon d’une sphère et son volume y liées par la relation 𝑦 =
4 𝜋𝑥 3 3
, ou partiellement
dépendantes telles que certaines variables en économie,
en médecine et pour d’autres sciences. 151
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Indépendance et dépendance fonctionnelle de X et Y
152
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Dépendance partielle de X et Y et ajustements possibles
153
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Pour cette dernière situation, si l’on représente graphiquement l’ensemble des points (xi, yi)
sur un
système d’axe, la forme du nuage de points peut inviter à ajuster
une
droite,
une
parabole,
une
courbe
exponentielle, etc. Ces courbes peuvent être obtenues graphiquement ou encore par une méthode algébrique dont la plus connue s’appelle la méthode des moindres carrés. 154
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On
observe
simultanément
les
variables
quantitatives X et Y sur n individus, on trace l’ensemble des points Mi(xi, yi), et on veut ajuster
une droite d’équation y = ax + b qui passe au « plus près des points Mi ».
155
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
En adoptant la méthode des moindres carrés, les paramètres a et b de la droite y = ax + b sont :
𝑎=
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 = 2 𝑥𝑖 − 𝑥
𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦 𝑥𝑖2 − 𝑛𝑥 2
En divisant le numérateur et le dénominateur par n, on obtient : 𝐶𝑜𝑣 𝑥, 𝑦 𝑎= 𝜎𝑥2
où: 𝑎représente la pente de la droite. 156
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Quant à la constante b, elle s’obtient par la relation : 𝑏 = 𝑦 − 𝑎𝑥 , où 𝑏 représente l’ordonnée à l’origine.
Cette droite est la droite des moindres carrés de y en x ou encore la droite de régression de y en x.
157
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Remarque : Droite des moindres carrés de x en y : 𝑥 = 𝑎′ 𝑦 + 𝑏′ Cette droite s’obtient en minimisant la somme des carrés des
écarts parallèlement à l’axe des abscisses. Il suffit d’échanger x et y dans les formules qui donnent a et b pour obtenir a’ et b’, ainsi la droite a pour équation : 𝑥 = 𝑎′ 𝑦 + 𝑏′ ou : 𝑦 = 𝑎′ =
158
𝐶𝑜𝑣 𝑥,𝑦 𝜎𝑦2
1 𝑥 𝑎′
−
𝑏′ 𝑎′
et 𝑏 ′ = 𝑥 − 𝑎′𝑦
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3- Qualité d’ajustement linéaire : 3-1- Le coefficient de détermination 𝒓𝟐 En vue de mesurer la qualité d’ajustement linéaire on calcule le coefficient de détermination
𝑟 2 , qui est égal au coefficient de corrélation linéaire au carré 𝑟 2 =
𝐶𝑜𝑣 𝑋,𝑌 2 . 2 2 𝜎𝑥 𝜎𝑦
Plus 𝑟 2 est proche de 1
plus la qualité d’ajustement est bonne. 159
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3-2- L’équation de la décomposition de la variation totale de Y La somme des carrés totale (SCT) = la somme des carrés expliquée (SCE) + la somme des carrés résiduelle (SCR)
𝑛
𝑛
𝑦𝑖 − 𝑦 𝑖=1
2
=
𝑛
𝑦𝑖 − 𝑦 𝑖=1
où: les 𝑦𝑖 sont les valeurs observées de Y ; les 𝑦𝑖 sont les valeurs estimées de Y ; et 𝑦 est la moyenne arithmétique de Y. 160
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2
+
𝑦𝑖 − 𝑦𝑖 𝑖=1
2
3-3- La quantité (1-𝒓𝟐 La quantité (1-𝑟 2 est égale à la proportion de variation de Y
non expliquée par la droite des moindres carrés.
1
𝑟2
161
− 𝑟2
=1−
=
𝑛 𝑖=1 𝑛 𝑖=1
𝑛 𝑖=1 𝑛 𝑖=1
𝑦𝑖 − 𝑦𝑖 𝑦𝑖 − 𝑦
𝑦𝑖 − 𝑦𝑖 𝑦𝑖 − 𝑦
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2 2
2 2
𝑆𝐶𝑅 = 𝑆𝐶𝑇
𝑆𝐶𝑅 =1− 𝑆𝐶𝑇
162
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Les indices sont des rapports entre une ou plusieurs
observations d’une même grandeur, ils permettent de supprimer le problème des unités.
Les indices simples sont notamment utiles dans le calcul des taux de variation. Les indices synthétiques permettent de résumer, à l’aide des moyennes arithmétique, harmonique et géométrique, l’évolution d’un agrégat de grandeurs économiques. Les coefficients de concentration ont pour objet la saisie des déformations des distributions se traduisant par un regroupement des individus dans une ou plusieurs classes. 163
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Indices simples ou élémentaires Soit G une grandeur économique qui varie dans le temps et qui prend les valeurs : 𝐺0 , …, 𝐺𝑡 , …, 𝐺𝑇 aux dates tϵ{0 ;1 ;… ;T} .
1- définition : On appelle indice simple ou élémentaire, la grandeur simple définie par le rapport suivant 𝐼𝑡/0 =
𝐺𝑡 𝐺0
avec tϵ{0 ;1 ;… ;T} où t=0 est la date de référence ou
époque de base et où t est la date courante. Nous pouvons également exprimer les indices en % : 𝐼𝑡/0 % = 164
𝐺𝑡 𝐺0
𝑥 100 avec tϵ{0 ;1 ;… ;T}.
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Propriétés des indices simples : 2-1- La circularité :
𝐼𝑡/0 = 𝐼𝑡/𝑡′ 𝐼𝑡′/0 =
𝐺𝑡 𝐺𝑡′ 𝐺𝑡′ 𝐺0
=
𝐺𝑡 𝐺0
avec t ϵ {0 ;1 ;… ;T} et t’ ϵ {0 ;1 ;… ;T}.
2-2- La réversibilité :
𝐼𝑡/0 = 2-3- L’enchainement :
1 𝐼0/𝑡
1 = avec t ϵ {0 ; 1 ; … ; T} 𝐺0 𝐺𝑡
𝐼𝑡/0 = 𝐼𝑡/𝑡−1 𝐼𝑡−1/𝑡−2 𝑥 … 𝑥 𝐼1/0 165
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝐺𝑡 𝐺𝑡−1 𝐺1 𝐺𝑡 = 𝑥…𝑥 = 𝐺𝑡−1 𝐺𝑡−2 𝐺0 𝐺0
Exemple : Depuis 2005, Monsieur Madani déjeune tous les premiers samedis du mois d’avril dans un restaurant. Son menu est composé d’une salade verte, du poisson, d’une portion de fromage, d’une glace à la vanille et il boit de limonade. Le même repas lui a été servi chaque année avec quelques modifications sur les quantités qu’il consomme : Tableau de données pour indice synthétique 2005
2010
2015
Quantité en
Prix en
Quantités en
Prix en euros
Quantités en
Prix en
grammes
dirhams par
grammes
par kg
grammes
dirhams par
kg
kg
Salade verte
120
20
150
26
160
31
Poisson
300
70
200
100
180
120
Fromage
50
8
60
10
80
12
Glace à la
40
20
60
25
70
30
1
10
1
13
1
15
vanille Bouteille de limonade
166
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Calculer les indices élémentaires de prix de chacun des éléments du repas de Monsieur Madani, base 1 en 2005.
Tableau-Indices simples base 1 en 2005 Indices élémentaires 𝑮 𝑰𝟐𝟎𝟏𝟎/𝟐𝟎𝟎𝟓 = 𝟐𝟎𝟏𝟎
Indices élémentaires 𝑮𝟐𝟎𝟏𝟓 𝑰𝟐𝟎𝟏𝟓/𝟐𝟎𝟎𝟓 = 𝑮𝟐𝟎𝟎𝟓
Salade verte
1,3
1,55
Poisson
1,43
1,71
Fromage
1,25
1,5
Glace à la vanille
1,25
1,5
Bouteille de limonade
1,3
1,5
𝑮𝟐𝟎𝟎𝟓
167
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*En utilisant les propriétés des indices élémentaires, calculer pour les éléments du repas de Monsieur Madani les indices élémentaires de prix I2005/2010 et I2005/2015 sauf pour la limonade.
Indices élémentaires
𝐼2005/2010 = 𝐼
168
1 2010 /2005
Indices élémentaires
𝐼2005/2015 =
1 𝐼2015/2005
Salade verte
0,77
0,65
Poisson
0,70
0,58
Fromage
0,80
0,67
Glace à la vanille
0,80
0,67
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Calculer l’indice I2010/2015 pour la limonade en utilisant les indices I2010/2005 et I2005/2015.
Selon la propriété de la circularité : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015 Où : 𝐼2005/2010 = 𝐼
1 2010/2005
1
= 1,3 = 0,77 et 𝐼2005/2015 = 𝐼
1 2015/2005
D’où : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015 = 1,3 𝑥 0,67 = 0,87
169
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1
= 1,5 = 0,67
Section 2- Indices synthétiques 1- Indices des prix
Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées de ce même article sont notées 𝑞 𝑖 . Les dépenses pour l’année de
base et pour l’année courante sont 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖 respectivement. Les coefficients budgétaires de l’article i mesurent la part de la dépense totale consacrée à cet article aux dates 0 (époque de base) et t (époque courante) : 𝑤0𝑖 170
=
𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0
et
𝑤𝑡𝑖
=
𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
avec
𝑛 𝑖 𝑤 𝑖=1 0
=
𝑛 𝑖 𝑤 𝑖=1 𝑡
=1
1-1- Indice de Laspeyres des prix: L’indice de Laspeyres des prix est la moyenne arithmétique pondérée des
indices élémentaires de prix
𝑖 𝐼𝑡/0
=
𝑝𝑡𝑖 𝑝0𝑖
, la pondération utilisée
étant celle de l’époque de base :
𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
𝑛 𝑝
𝑖 𝑤0𝑖 𝐼𝑡/0 =
𝐿𝑡/0 = 𝑖=1
𝑝
𝐿𝑡/0 = 171
𝑝𝑡𝑖 𝑝0𝑖
𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
=
𝑛 𝑖 𝑖 𝑝 𝑖=1 𝑡 𝑞0 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡" 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝑤0𝑖
=
𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0
1-2- Indice de Paasche des prix : L’indice de Paasche des prix est la moyenne harmonique pondérée des
indices élémentaires des prix
𝑤𝑡𝑖
=
𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡
=
1 𝑝𝑖𝑡 𝑝𝑖0
=
𝑝0𝑖 𝑝𝑡𝑖
, la pondération utilisée
étant celle de l’époque courante :
𝑝 𝑃𝑡/0
𝑝 𝑃𝑡/0 172
𝑖 𝐼0/𝑡
=
1 𝑛 𝑖 𝑖 𝑖=1 𝑤𝑡 𝐼0/𝑡
=
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑛 𝑖 𝑖 𝑝0 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑝𝑡
=
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "t" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-3- Indice de Fisher des prix : L’indice de Fisher des prix est la moyenne géométrique simple des indices de prix de Laspeyres et de Paasche :
𝑝 𝐹𝑡/0
173
=
𝑝 𝑝 𝐿𝑡/0 𝑃𝑡/0
=
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞0 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡
2- Indices des quantités : 2-1- Indices de Laspeyres des quantités : L’indice de Laspeyres des quantités est la moyenne arithmétique pondérée des indices élémentaires des quantités 𝑤0𝑖
=
𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0
=
𝑞𝑡𝑖 𝑞0𝑖
, la pondération utilisée
étant celle de l’époque de base :
𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
𝑛 𝑞 𝐿𝑡/0
𝑖 𝑤0𝑖 𝐼𝑡/0 =
= 𝑖=1
𝑞 𝐿𝑡/0 174
𝑖 𝐼𝑡/0
𝑞𝑡𝑖 𝑞0𝑖
𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
=
𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" au prix 𝑑𝑒 "0" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "0"
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Indice de Paasche des quantités :
L’indice de Paasche des quantités est la moyenne harmonique pondérée des
indices élémentaires des quantités
𝑤𝑡𝑖
=
𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡
=
1 𝑞𝑖𝑡 𝑞𝑖0
=
𝑞0𝑖 𝑞𝑡𝑖
, la pondération utilisée
étant celle de l’époque courante :
𝑞 𝑃𝑡/0
𝑞 𝑃𝑡/0 175
𝑖 𝐼0/𝑡
=
1 𝑛 𝑖 𝑖 𝑖=1 𝑤𝑡 𝐼0/𝑡
=
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑛 𝑖 𝑖 𝑞0 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑞𝑡
=
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞0
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "𝑡" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" au prix de "𝑡"
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3- L’indice de dépense et la réversibilité selon les facteurs Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées de ce même article sont notées 𝑞𝑖 . Les dépenses pour l’année de base et pour l’année courante sont : 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖 respectivement. On définit l’indice de dépense
𝐷𝑡/0 de l’année courante t à la date de référence 0 :
𝐷𝑡/0 =
𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
=
𝑛 𝑖 𝑖=1 𝑑𝑡 𝑛 𝑖 𝑖=1 𝑑0
On peut démontrer l’égalité suivante, connue sous le nom de réversibilité selon les facteurs : 𝑝
𝑞
𝑞
𝑝
𝐷𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0
176
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Application :
On reprend l’exemple de l’application ci-dessus de Monsieur Madani de la première section. *Calculer l’indice des prix du repas de Monsieur Madani, pour les années 2010 (notée 1) et 2015 (notée 2) base 1 en 2005 (notée 0), en employant les constructions des indices de Laspeyres et de Paasche.
177
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableaux de données pour les indices synthétiques p0
q0
p1
q1
p2
q2
Salade verte
20
0,12
26
0,15
31
0,16
Poisson
70
0,3
100
0,2
120
0,18
Fromage
8
0,05
10
0,06
12
0,08
Glace à la vanille
20
0,04
25
0,06
30
0,07
Bouteille de limonade
10
1
13
1
15
1
p0q0
p1q0
p2q0
p1q1
p0q1
p2q2
p0q2
Salade verte
2,4
3,12
3,72
3,9
3
4,96
3,2
Poisson
21
30
36
20
14
21,6
12,6
Fromage
0,4
0,5
0,6
0,6
0,48
0,96
0,64
Glace à la vanille
0,8
1
1,2
1,5
1,2
2,1
1,4
Bouteille de limonade
10
13
15
13
10
15
10
34,6
47,62
56,52
39
28,68
44,62
27,84
Total 178
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Indices synthétiques des prix de Laspeyres : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝 𝐿1/0
=
5 𝑖 𝑖 𝑖=1 𝑝1 𝑞0 5 𝑖 𝑖 𝑝 𝑖=1 0 𝑞0
47,62 = = 1,3763 (𝑜𝑢 137,63 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 34,6
-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝐿𝑝2/0
179
=
5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞0 5 𝑖 𝑖 𝑝 𝑖=1 0 𝑞0
56,52 = = 1,6335 (𝑜𝑢 163,35 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 34,6
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Indices synthétiques des prix de Paasche : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝
𝑃1/0 =
5 𝑖 𝑖 39 𝑖=1 𝑝1 𝑞1 = = 1,3598 (𝑜𝑢 135,98 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 5 𝑖 𝑖 28,68 𝑖=1 𝑝0 𝑞1
-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝑝 𝑃2/0 =
180
5 𝑖 𝑖 𝑖=1 𝑝2 𝑞2 44,62 = = 1,6027 (𝑜𝑢 160,27 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 5 𝑖 𝑖 27,84 𝑖=1 𝑝0 𝑞2
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Indices de Fisher des prix : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝
𝑝
𝑝
𝐹1/0 = 𝐿1/0 𝑃1/0 =
5 𝑖 𝑖 𝑝 𝑖=1 1 𝑞0 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
5 𝑖 𝑖 𝑝 𝑖=1 1 𝑞1 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞1
= 1,3763 𝑥 1,3598 = 1,368 (𝑜𝑢 136,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝑝
𝑝
𝑝
𝐹2/0 = 𝐿2/0 𝑃2/0 =
181
5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞0 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞0
5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞2 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞2
= 1,6335 𝑥 1,6027 = 1,618 (𝑜𝑢 161,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Références bibliographiques BOURBONNAIS, (Régis), Econométrie, 7ème édition DUNOD, Janvier 2009. GOLDFARB (Bernard) et PARDOUX (Catherine), Introduction à la méthode statistique, Gestion-Economie, Edition DUNOD, 2000. LECOUTRE (Jean-Pierre), Statistique et probabilités, Cours et exercices corrigés, Edition DUNOD, 2012. LETHIELLEUX (Maurice), Exercices de statistiques et probabilités avec rappels de cours en 12 fiches, Edition DUNOD, 2009. MONINO (Jean-Louis), KOSIANSKI (Jean-Michel), et LE CORNU (François), TD Statistique descriptive, Édition DUNOD, 2010. PUPION (Pierre-Charles), Statistique pour la gestion, Edition DUNOD, 2008. 182
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès