Cours de Statistique Descriptive-Semestre2 PDF [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

UNIVERSITE SIDI MOHAMED BEN ABDELLAH ECOLE NATIONALE DE COMMERCE ET DE GESTION -FES-

Enseignant: Abdessamad OUCHEN

1

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Introduction générale Le mot statistique tire son origine du latin statisticus relatif à l’état (status). Il est apparu vers le milieu du XVIIème siècle. Au pluriel, les « statistiques » signifient un ensemble de données numériques relatives à un groupe d’individus. On parle des statistiques du chiffre d’affaires, de celles du produit intérieur brut, de celles du cours d’un indice boursier, etc. Au singulier, la « statistique » signifie un ensemble des méthodes qui permettent de rassembler, de présenter et d’analyser un ensemble de données numériques. 2

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Dans un premier temps, la statistique a été employée dans un sens purement descriptif de recueil ou de collection de faits chiffrés, les statistiques. Dans un second temps, elle a été utilisée pour étendre les résultats et dégager des lois (l’inférence). Elle vise à dégager, à partir de données observées sur quelques individus d’une population, des résultats valables pour l’ensemble de la population. Elle est alors un moyen scientifique d’analyse et de compréhension d’un phénomène étudié. Elle s’applique à l’économie ainsi qu’à toutes les sciences sociales et de la nature. 3

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

La méthodologie statistique

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

la statistique descriptive qui consiste à remplacer des données nombreuses par des indicateurs les plus pertinents possibles ainsi qu’à les résumer sous forme de tableaux ou de graphiques ; l’inférence statistique qui vise, à partir de la description statistique, la mise en évidence de certaines permanences ou lois statistiques qui peuvent constituer des outils de prévision ; la théorie des probabilités (objet du cours du calcul des probabilités en 2ème année) qui signifie l’analyse mathématique des phénomènes dans lesquels le hasard intervient et qui est utilisée pour déterminer les précisions des estimations de certains paramètres (la théorie de l’estimation) ou des tests de certaines hypothèses (la théorie des tests) : l’inférence statistique (objet du cours de la 4 statistique appliquée en 3ème année).

5

Chapitre 1

• les séries statistiques simples (à un caractère)

Chapitre 2

• les séries statistiques doubles (à deux caractères)

Chapitre 3

• les indices statistiques

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

6

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Section 1- Définitions

1- Population, individu et échantillon 1-1- Population La population est l’ensemble des éléments auxquels se rapportent les données étudiées, par exemple l’ensemble des étudiants d’un établissement, l’ensemble des produits d’une usine, l’ensemble des poissons d’une rivière, l’ensemble des entreprises d’un secteur donné, etc. 7

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-2- Individu ou unité statistique Un individu est un élément de la population. En d’autres termes, c’est l’élément de l’ensemble que l’on veut étudier, par exemple un étudiant est un individu lorsque l’on étudie la population des étudiants d’un établissement, un produit est un individu lorsque l’on

étudie la population des produits d’une usine, etc. 1-3- Echantillon C’est un sous-ensemble d’une population statistique. 8

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2- Variable statistique ou caractère et ses modalités 2-1- Variable statistique ou caractère Un individu peut être décrit selon un ou plusieurs

caractères

ou

variables

qui

peuvent

être

des

caractéristiques qualitatives ou prendre des valeurs

numériques. Par exemple, une entreprise d’un secteur donné peut être

décrite selon son chiffre d’affaires, ou selon le nombre de ses salariés, ou encore selon sa forme juridique. 9

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-2- Modalités d’un caractère ou d’une variable statistique

Les

modalités

sont

les

différentes

situations

disjonctives et exhaustives d’un caractère et chaque

individu présente alors une modalité et une seule du caractère. 2-3- Caractère quantitatif discret ou continu Un caractère ou variable X est quantitatif si ses diverses modalités sont mesurables ou repérables, c’est-àdire à chaque modalité j est associé un nombre xj.

10

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

a- Un caractère est discret si les différentes modalités du caractère sont des valeurs numériques isolées. Par exemple, pour l’ensemble des assurés d’une société d’assurance automobile, on associe à chaque adhérent le nombre annuel d’accidents déclarés qui est un des entiers : x1=0, x2=1, x3=2,…

11

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Cas d’une variable discrète On considère 10 familles d’un quartier avec au moins un enfant de 0 à 17 ans (en âge révolu) : f1, f2, …, f10. A chaque

famille fi est associé le nombre d’enfants xi : x1=1, x2=2, x3=1, x4=2, x5=3, x6=4, x7=3, x8=5, x9=1, x10=2. La population statistique P est l’ensemble des familles du quartier ayant au moins un enfant de 0 à 17 ans (en âge révolu): P={f1, f2, …, f10}. Chaque élément fi de P, c’est-à-dire chacun des 10 familles,

est un individu ou une unité statistique. 12

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

La variable statistique est l’application X : P → {1, 2, 3, …} qui, à chaque famille fi, associe le nombre X(fi)=xi d’enfants. On constate que X(P)={1, 2, 3, 4, 5} et que les nombres d’observations associées à chacune des valeurs de X(P) sont

respectivement : n1=3, n2=3, n3=2, n4=1 et n5=1. Nombre

1

2

3

4

5

3

3

2

1

1

d’enfants Effectifs ni 13

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

b- Un caractère est continu s’il peut prendre n’importe quelle

valeur d’un intervalle. Par exemple, pour l’ensemble des employés d’une entreprise, les salaires appartiennent aux intervalles suivants:

[3000 DH; 6000 DH[; [6000 DH; 9000 DH[; [9000 DH; 12000 DH[; [12000

DH;

15000

DH[;

[18000 DH; 21000 DH[.

14

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

[15000

DH;

18000

DH[

et

*Cas d’une variable continue Le quartier industriel Sidi Brahim dispose de 25 PME. A chaque entreprise ei de la population statistique P={e1, e2, e3, …, e25} est associé le chiffre d’affaires ci. On définit ainsi une applicationX : P → ℝ+, ei → X(ei) = ci. Chiffre d’affaires

c < 40

40 ≤ c < 50

50 ≤ c < 60

60 ≤ c < 70

70 ≤ c < 80

2

8

8

4

3

annuel (en millions de DH) Effectifs

Les valeurs possibles de X appartiennent à 5 intervalles : [0, 40[ ; [40, 50[ ; [50, 60[ ; [60, 70[ ; [70, 80[ dont les effectifs respectifs associés sont n1=2 ; n2=8 ; n3=8 ;

n4=4 ; et n5=3. 15

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-4- Caractère qualitatif Un caractère est qualitatif si chaque modalité ne peut être mesurée ou repérée par un nombre. Toutefois, il est toujours possible de rendre numérique une telle variable en associant un nombre à chaque modalité et les modalités sont alors codées. Sur des variables qualitatives codées, les opérations algébriques n’ont généralement pas de sens. Par exemple, la situation matrimoniale d’un individu : 1) célibataire, 2) marié, 3) veuf, 4) divorcé. 16

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Section 2- Distributions statistiques et représentations graphiques 1- Variables statistiques discrètes

Soit X une variable discrète qui prend les valeurs numériques x1, x2, …, xK (où x1< x2< …< xK) et soit ni les

effectifs associés à chaque valeur xi. Le nombre total d’observations est n=n1+n2+…+nK.

17

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-1- Présentation en tableau

18

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-2- Représentations graphiques a- Diagramme en bâtons Dans un système d’axe cartésien, portant en abscisses les valeurs xi de la variable statistique X et en ordonnées les effectifs ni ou les fréquences fi, on trace, à partir de chaque valeur xi, un segment de droite vertical (le bâton)

dont la hauteur (la longueur du bâton) est proportionnelle à l’effectif ni ou à la fréquence fi relative et on obtient

ainsi le digramme en bâtons. 19

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : Le tableau ci-dessous présente la distribution de 100 familles selon le nombre de pièces du logement. Nombre

de

1

2

3

4

5

6

7

8

Total

Effectifs

10

15

15

30

10

12

5

3

100

Fréquences

0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03

pièces

20

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1

21

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

22

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-3- Effectif cumulé et fréquence relative cumulée a- Effectif cumulé (croissant) L’effectif cumulé croissant jusqu’à une valeur xh de la

variable X est le nombre d’individus pour lesquels la variable X prend une valeur inférieure ou égale à xh.

b- Fréquence relative cumulée (croissante) La fraction Fh du nombre total d’individus pour lesquels la variable X prend une valeur inférieure ou égale à xh est la

fréquence relative cumulée croissante des valeurs de X jusqu’à xh. 23

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Valeurs de X

Effectifs

Effectifs cumulés

Fréquences

Fréquences relatives

ou modalités xi

ni

croissants Ni

relatives fi

cumulées croissantes Fi

x1

n1

N1 = n1

f1 = n1 / n

F1 = f1

x2

n2

N2 = n1 + n2

f2 = n2 / n

F2 = f1 + f2

x3

n3

N3 = n1 + n2 + n3

f3 = n3 / n

F3 = f1 + f2 + f3

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

xh

nh

Nh = n1 + n2 +…+ nh

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

xk

nk

Nk =

fk = nk / n

Fk = 1

24

𝑘 𝑖=1 𝑛𝑖

=𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

fh = nh / n

Fh = f1 + f2 + … + fh

Exemple : On reprend le cas de la distribution de 100 familles selon le nombre de pièces du logement.

Nombre

de

1

2

3

4

5

6

7

8

Total

Effectifs

10

15

15

30

10

12

5

3

100

Fréquences

0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03

pièces

25

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1

Nombre

Effectifs

Effectifs

Fréquences

Fréquences

de pièces

ni

cumulés

relatives fi

relatives cumulées

croissants Ni

26

croissantes Fi

1

10

10

0,1

0,1

2

15

25

0,15

0,25

3

15

40

0,15

0,4

4

30

70

0,3

0,7

5

10

80

0,1

0,8

6

12

92

0,12

0,92

7

5

97

0,05

0,97

8

3

100

0,03

1

Total

100

-

1

-

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2- Variables statistiques continues

Lorsque n est grand (une infinité des valeurs observables d’une variable continue)

27

l’analyse cidessus de cette série d’observations de vient fastidieuse (par exemple, la généralisation du diagramme en bâtons)

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Subdiviser le domaine des valeurs numériques possibles de la variable statistique continue en K classes consécutives d’amplitudes égales ou non : [e0,e1[, [e1, e2[, …, [ek-1, ek[ et de grouper toutes les observations qui appartiennent à une même classe.

L’intervalle [ei-1, ei[ fermé à gauche, ouvert à droite, est appelé ième classe (i = 1, 2, …, k). Son amplitude est égale à : ai = ei - ei-1.

28

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-1- Présentation en tableau

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Tableau- Effectifs et fréquences relatives

29

Valeurs de X

Effectifs ni

Fréquences relatives fi

e0 ≤ x < e1

n1

f1 = n 1 / n

e1 ≤ x < e2

n2

f2 = n 2 / n

.

.

.

.

.

.

.

.

.

ei-1 ≤ x < ei

ni

fi = n i / n

.

.

.

.

.

.

.

.

.

ek-1 ≤ x < ek

nk

fk = nk / n

ni est l’effectif de la classe [ei-1, ei[. La fréquence relative de la ième classe est fi=ni/n.

Exemple : Le tableau ci-dessous présente la répartition des salaires de 200 salariés de l’entreprise Atlas. Tableau- Effectifs et fréquences relatives Valeurs du salaire

Effectifs ni

en DH

30

Fréquences

relatives fi

3000 ≤ x < 6000

50

0,25

6000 ≤ x < 9000

90

0,45

9000 ≤ x < 12000

30

0,15

12000 ≤ x < 15000

15

0,075

15000 ≤ x < 18000

10

0,05

18000 ≤ x < 21000

5

0,025

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-2- Représentations graphiques a- Histogramme On peut représenter dans un repère orthogonal la

fréquence relative de chaque classe par la surface d’un rectangle qui lui est égale ou proportionnelle. Cette représentation, nommée histogramme, est ainsi obtenue par la juxtaposition de rectangles dont les bases représentent les différentes classes et dont les surfaces sont proportionnelles aux fréquences relatives 31

des classes. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

En effet, à la ième classe, correspond un rectangle dont la base est l’intervalle [ei-1, ei[ et dont la surface est proportionnelle à la fréquence fi.

32

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

les classes ont toutes la même amplitude • les hauteurs des rectangles sont égales aux fréquences

33

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

les classes sont d’amplitudes inégales • la hauteur du rectangle correspondant à la ième classe d’amplitude ai sera hi = fi . ar / ai où ar représente l’amplitude de référence (la plus petite des amplitudes).

Histogramme des fréquences hi

𝑓𝑎

ℎ2 = (𝑒 2−𝑒𝑟

1)

2

𝑓𝑎

𝑖 𝑟 ℎ𝑖 = (𝑒 −𝑒

𝑖−1 )

𝑖

𝑓𝑎

ℎ1 = (𝑒 1−𝑒𝑟 1

ℎ𝑘 = (𝑒

0)

𝑓𝑘 𝑎𝑟 𝑘 −𝑒 𝐾−1 )

e0 34

e1

e2

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ei-1

ei ai

ek-1

ek

xi

Remarque : Pour une série d’observations relatives à une variable statistique X discrète ou continue classée, la

donnée des modalités xi et de leurs fréquences fi est appelée « distribution statistique » de la variable X.

35

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemples : i) cas de classes avec amplitudes égales : On reprend l’exemple de la distribution des salaires des salariés de l’entreprise Atlas. Histogramme 0,5 0,4 hi =fréquence fi

0,3

0,2 0,1 0 0

36

3000

6000

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

9000 12000 15000 18000 21000 valeurs du salaire

ii) cas de classes avec amplitudes inégales : Le tableau ci-dessous présente la distribution de chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Ancienneté d’inscription

Fréquence fi

hi = fi . ar / ai

362

0,168

0,168

D’un mois à moins de 3 mois

409,8

0,19

0,095

De trois mois à moins de six mois

326,2

0,151

0,0503

De six mois à moins d’un an

382,2

0,177

0,0295

D’un an à moins de deux ans

398,6

0,185

0,0154

De deux ans à moins de trois ans

150,8

0,07

0,0058

Trois ans ou plus

125,8

0,058

0,0024

Total

2155,4

1

-

Effectif ni (en milliers)

Moins d’un mois

37

La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois). Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

38

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

b- Polygone des fréquences :

*Lorsque les classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ ont une même amplitude a (a = ei - ei-1), on joint par des

segments de droites les milieux des sommets des rectangles de l’histogramme des fréquences. Le milieu

Mi du sommet du rectangle relatif à la classe [ei-1, ei[ a pour abscisse xi = (ei-1 + ei) / 2 et pour ordonnée yi = fi. Aux extrémités, on ajoute les segments [M0 M1] et [Mk Mk+1] où M0 et Mk+1 ont respectivement pour 39

coordonnées (e0 – a / 2, 0) et (ek + a / 2, 0). Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple 1: On reprend l’exemple de la distribution des salaires des salariés de l’entreprise Atlas. Histogramme et polygone des fréquences 0,5 0,45 0,4 0,35 0,3 hi=fréquence 0,25 fi 0,2 0,15 0,1 0,05 0

0

40

3000

6000

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

9000 12000 15000 18000 21000 valeur du salaire

*Lorsque les classes n’ont pas la même amplitude, on considère parmi les k classes celle ou celles qui ont la plus petite longueur θ. On subdivise l’histogramme des fréquences en sous rectangles de même base égale à la longueur θ. On joint par des segments les milieux des intervalles de longueur θ des sommets des sous rectangles de l’histogramme des fréquences à partir du point M0(e0 - θ/2, 0) jusqu’au point Mk(ek + θ/2, 0).

41

Remarque : L’aire située sous le polygone doit être égale à l’aire de l’ensemble des rectangles de l’histogramme. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : On reprend l’exemple de la distribution de chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Puisque les amplitudes des classes sont inégales et la plus petite

amplitude est θ=1, on subdivise alors l’histogramme des fréquences en sous rectangles de même base égale à la longueur θ=1 et on joint

par des segments les milieux des intervalles de longueur θ=1 des sommets des sous rectangles de l’histogramme des fréquences à partir du point M0(-1/2, 0) jusqu’au point M62 (60,5 , 0). 42

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Histogramme et polygone des fréquences hi

.

M1

..

M3

M2

.

M0

0 1 3

43

.

M61 Mois

6

12

24

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

36

60

Remarques : i) L’aire située sous le polygone doit être égale à l’aire de

l’ensemble des rectangles de l’histogramme. ii) Si l’amplitude la plus petite n’est pas un diviseur

commun des autres amplitudes, on choisit une valeur de θ, autre que la plus petite amplitude, qui doit être un diviseur commun de toutes les amplitudes afin de faciliter la subdivision des rectangles de l’histogramme en des sous rectangles de base θ. 44

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-3- Effectif cumulé et fréquence relative cumulée a- Effectif cumulé croissant L’effectif cumulé croissant de la hème classe est le

nombre d’individus Nh pour lesquels la variable X prend une valeur inférieur à eh.

45

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

b- Fréquence relative cumulée (croissante) La fréquence cumulée croissante de la hème classe est la fraction Fh du nombre total d’individus pour lesquels la

variable X prend une valeur inférieure à eh.

46

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Tableau- Effectifs, fréquences relatives, effectifs cumulés croissants, fréquences relatives cumulées croissantes

47

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : On reprend le cas de la distribution des chômeurs inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier 2015. Ancienneté d’inscription

Effectif ni

Fréquences fi

(en milliers) Moins d’un mois

362

0,168

D’un mois à moins de 3 mois

409,8

0,19

De trois mois à moins de six

326,2

0,151

De six mois à moins d’un an

382,2

0,177

D’un an à moins de deux ans

398,6

0,185

De deux ans à moins de trois ans

150,8

0,07

Trois ans ou plus

125,8

0,058

Total

2155,4

1

mois

La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois). 48

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Tableau- Effectifs, fréquences relatives, effectifs cumulés croissants, fréquences relatives croissantes Ancienneté d’inscription

Effectifs

Effectifs

Fréquence

Fréquences

ni

cumulés

s relatives

relatives

croissants Ni

fi

cumulées croissantes Fi

Moins d’un mois

362

362

0,168

0,168

D’un mois à moins de 3 mois

409,8

771,8

0,19

0,358

De trois mois à moins de six mois

326,2

1098

0,151

0,509

De six mois à moins d’un an

382,2

1480,2

0,177

0,686

D’un an à moins de deux ans

398,6

1878,8

0,185

0,871

De deux ans à moins de trois ans

150,8

2029,6

0,07

0,941

Trois ans ou plus

125,8

2155,4

0,058

1

2155,4

-

1

-

Total 49

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

3- Variables qualitatives Soit C une variable qualitative qui prend les modalités c1, c2, …,cK et soit ni les effectifs associés à chaque modalité

ci.

Le

nombre

n=n1+n2+…+nK.

50

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

total

d’observations

est

3-1- Présentation en tableau Tableau- Effectifs et fréquences relatives Modalités du caractère C

Effectifs ni

Fréquences relatives fi

c1

n1

f1=n1/n

c2

n2

f2=n2/n

.

.

.

.

.

.

.

.

.

ci

ni

fi=ni/n

.

.

.

.

.

.

.

.

.

ck-1

nk-1

fk-1=nk-1/n

ck

nk

fk=nk/n

𝑘

𝑘

𝑛𝑖 = 𝑛 𝑖=1

51

𝑓𝑖 = 1 𝑖=1

ni est l’effectif de la modalité ci. La fréquence relative de la modalité ci est fi=ni/n. Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

3-2- Représentations graphiques a- Diagramme en « tuyaux d’orgue »

Dans un repère orthogonal, portant en abscisses les modalités ci de la variable qualitative C et en ordonnées les

effectifs ni ou les fréquences fi, on trace, à partir de chaque modalité ci, un rectangle (tuyau) qui a pour base cette

modalité ci et comme hauteur l’effectif ni ou la fréquence fi. La base de chacun des rectangles ne possède aucune

signification numérique puisque la variable est qualitative et les bases des rectangles sont égales. 52

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : Le tableau ci-dessous présente la distribution de 100 personnes selon la catégorie socioprofessionnelle. Catégories Effectifs Fréquences Socioprofessionnelles ni fi Agriculteurs 10 0,1 Commerçants 30 0,3 Cadres 20 0,2 Ouvriers 30 0,3 Retraités 10 0,1 Total 100 1 53

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Diagramme en tuyaux d'orgue 0,35

0,3

0,25

0,2

Fréquences fi 0,15

0,1

0,05

0 Agriculteurs

Commerçants

Cadres

Catégories socioprofessionnelles

54

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Ouvriers

Retraités

b- Diagramme en secteurs

Appelé aussi « Camembert » ou digramme circulaire, le diagramme en secteurs partage un disque en des aires

proportionnelles aux effectifs (ou aux fréquences).

55

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : On reprend l’exemple de la distribution de 100 personnes selon la catégorie socioprofessionnelle. Catégories Effectifs Fréquences Socioprofessionnelles ni fi Agriculteurs 10 0,1 Commerçants 30 0,3 Cadres 20 0,2 Ouvriers 30 0,3 Retraités 10 0,1 Total 100 1 56

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Diagramme en secteurs : On porte sur le disque successivement : -Angle AôB : [AôB] = 0,1 x 360°=36°. La surface du secteur (AOB) représente la part des agriculteurs dans l’ensemble des 100 personnes ; -Angle BôC : [BôC] = 0,3 x 360° = 108°. La surface du secteur (BOC) représente la part des commerçants dans l’ensemble des 100 personnes ; -Angle CôD : [CôD] = 0,2 x 360° = 72°. Le secteur (COD) représente la part des cadres dans l’ensemble des 100 personnes ; -Angle DôE : [DôE] = 0,3 x 360° = 108°. Le secteur (DOE) représente la part des ouvriers dans l’ensemble des 100 personnes ; -Angle EôA : [EôA] = 0,1 x 360° = 36°. Le secteur (EOA) représente la part des retraités dans l’ensemble des 100 personnes. 57

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Diagramme en secteurs A

Retraités 10%

A B

B

A

E

B A

Agriculteurs 10%

B E

B B A

Ouvriers 30%

Commerçants 30%

O C

C D

C

D D

58

D

D

D

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Cadres 20%

C C

C

Section 3- Les indicateurs statistiques

• Les indicateurs de tendance centrale ; • Les indicateurs de dispersion ; • Les indicateurs de forme.

59

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-Les indicateurs de tendance centrale

Ce sont des indicateurs qui synthétisent l’ensemble d’une série statistique en faisant ressortir une position centrale de la valeur du caractère étudié. Ils regroupent la valeur médiane, différents types de moyennes et la valeur modale.

60

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-1-Moyenne arithmétique 𝒙 La valeur moyenne d’une série statistique est la somme de toutes les observations divisée par le nombre total d’observations. Autrement dit, la valeur moyenne 𝑥 d’une série de n observations 𝑥1 , 𝑥2 , …,𝑥𝑛 est 𝑥 =

61

1 𝑛 𝑥 1 +𝑥 2 +⋯+𝑥𝑛 𝑥 = . 𝑖 𝑖=1 𝑛 𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

i) le cas d’une variable discrète : Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1, 𝑥2, …, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne 𝑥 est : 𝑥 =

62

1 𝑘 𝑛 1 𝑥 1 + 𝑛 2 𝑥 2 +⋯+ 𝑛 𝑘 𝑥 𝑘 𝑛 𝑥 = 𝑖 𝑖 𝑖=1 𝑛 𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. Nombre

de

1

2

3

4

5

6

7

8

Total

Effectifs

10

15

15

30

10

12

5

3

100

Fréquences

0,1 0,15 0,15 0,3

pièces

8

0,1 0,12 0,05 0,03

1

1 10𝑥1 + 15𝑥2 + 15𝑥3 + 30𝑥4 + 10𝑥5 + 12𝑥6 + 5𝑥7 + (3𝑥8) 𝑥= 𝑛𝑖 𝑥𝑖 = = 3,86 𝑛 100 𝑖=1

63

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ii) le cas d’une variable continue : Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0 , e1[,[e1, e2[, …, [ek-1, ek[ d’effectifs respectifs𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne 𝑥 est : 𝑥 = ème

i classe : 𝑥𝑖 =

64

𝑒𝑖−1 +𝑒𝑖 2

1 𝑘 𝑛 1 𝑥 1 +𝑛 2 𝑥 2 +⋯+𝑛 𝑘 𝑥 𝑘 𝑛 𝑥 = 𝑖 𝑖 𝑖=1 𝑛 𝑛

.

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

où 𝑥𝑖 est le centre de la

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. Tableau- Effectifs et fréquences relatives Valeurs du salaire en DH

Effectifs ni

Fréquences relatives fi

3000 ≤ x < 6000

50

0,25

6000 ≤ x < 9000

90

0,45

9000 ≤ x < 12000

30

0,15

12000 ≤ x < 15000

15

0,075

15000 ≤ x < 18000

10

0,05

18000 ≤ x < 21000

5

0,025

Total

200

1

6

1 50𝑥4500 + 90𝑥7500 + 30𝑥10500 + 15𝑥13500 + 10𝑥16500 + (5𝑥19500) 𝑥 = 𝑛𝑖 𝑥𝑖 = = 8400 𝐷𝐻 𝑛 200 65

𝑖=1Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-2-Autres moyennes usuelles i) Moyenne harmonique H : La moyenne harmonique H de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes non nulles, est l’inverse de la moyenne arithmétique des inverses des valeurs xi : 1 1 = 𝐻 𝑛

66

𝑛

𝑖=1

1 1 1 1 1 = ( + + ⋯+ ) 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 , non nulles, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne harmonique est : 𝑘

1 1 𝑛𝑖 1 𝑛1 𝑛2 𝑛𝑘 = = ( + + ⋯+ ) 𝐻 𝑛 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛 𝑖=1

𝐻=

𝑛

𝑛

=𝑛 𝑛 𝑛 𝑛𝑘 1 2 𝑘 𝑖 𝑖=1 𝑥 𝑥 + 𝑥 + ⋯ + 𝑥 𝑖 1 2 𝑛

La définition de la moyenne harmonique présuppose que X ne prend pas la valeur 0. 67

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 8

1 1 𝑛𝑖 1 10 15 15 30 10 12 5 3 = = + + + + + + + = 0,3509 𝐻 𝑛 𝑥𝑖 100 1 2 3 4 5 6 7 8 𝑖=1

Ou encore : 𝐻 =

68

𝑛

=

100

8 𝑛 𝑖 10 15 15 30 10 12 5 3 + + + + + ++ 𝑖=1 𝑥 1 2 3 4 5 6 7 8 𝑖 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

= 2,8498

ii) Moyenne géométrique G : La moyenne géométrique G de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes strictement positives, est définie ainsi :

𝑛

𝑛

𝑥𝑖 = 𝑛 𝑥1 𝑥2 … 𝑥𝑛

𝐺= 𝑖=1

Cette formule implique : 1 𝑙𝑛 𝐺 = 𝑛 69

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝑛

ln⁡(𝑥𝑖 ) 𝑖=1

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 , strictement positives, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne géométrique est :

𝑛

𝑘

𝑥𝑖 𝑛 𝑖 = 𝑛 𝑥1 𝑛 1 𝑥2 𝑛 2 … 𝑥𝑘 𝑛 𝑘

𝐺= 𝑖=1

𝑘

𝑥𝑖 𝑓 𝑖 = 𝑥1 𝑓1 𝑥2 𝑓2 … 𝑥𝑘 𝑓 𝑘

𝐺= 𝑖=1

Ces formules impliquent: 𝑘

𝑙𝑛 𝐺 =

𝑓𝑖 𝑙𝑛⁡(𝑥𝑖 ) 𝑖=1

70

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 𝑛

8

𝑥𝑖 𝑛 𝑖

𝐺=

=

100

110 215 315 430 510 612 75 83

𝑖=1

𝐺=

71

8 𝑓𝑖 𝑥 𝑖=1 𝑖

= 10,1 20,15 30,15 40,3 50,1 60,12 70,05 80,03 =3,3882

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

iii) Moyenne quadratique Q : Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 ,…,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne quadratique Q est la racine carrée de la moyenne arithmétique des carrés des valeurs 𝑥𝑖 :

1 𝑄= 𝑛

72

𝑘

𝑛𝑖 (𝑥𝑖 )2 𝑖=1

1 = (𝑛1 𝑥1 2 + 𝑛2 𝑥2 2 + ⋯ + 𝑛𝑘 𝑥𝑘 2 ) 𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement.

𝑄=

73

1 8 1 2 2 𝑛 (𝑥 ) = [ 10 𝑥 1 𝑖 𝑖 𝑛 𝑖=1 100

+ 15 𝑥 22 + 15 𝑥 32 + 30 𝑥 42 + 10 𝑥 52 + 12 𝑥 62 + 5 𝑥 72 +( 3 𝑥 82)] = 4,2474

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

N.B. : Quelle que soit la série statistique considérée où tous les 𝑥𝑖 sont strictement positifs : H≤G≤x≤Q

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. H = 2,8498 ≤ G = 3,3882 ≤ x = 3,86 ≤ Q = 4,2474

74

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-3-Le mode i) le cas d’une variable discrète :

Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1, 𝑥2, …, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, le mode 𝑚𝑜 est la valeur 𝑥𝑖𝑜 de la variable statistique pour laquelle l’effectif 𝑛𝑖𝑜 est maximal : 𝑚𝑜 = 𝑥𝑖𝑜 .

75

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement.

Avec la valeur 𝑥4=4, l’effectif 𝑛4 = 30 est maximal.

Le mode est alors 𝑚𝑜 = 𝑥4 = 4.

76

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ii) le cas d’une variable continue :

Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs respectifs 𝑛1 , 𝑛2 , … , 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la classe modale est celle qui, dans l’histogramme des fréquences , a la plus grande ordonnée. L’intervalle [eio-1, eio[ est la classe modale si et seulement si : ℎ𝑖𝑜 = (𝑒

77

𝑓 𝑖𝑜 𝑎 𝑟 𝑖𝑜 −𝑒 𝑖𝑜−1

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝑓𝑖 𝑎𝑟

> ℎ = ∀ 𝑖 ≠ 𝑖𝑜 𝑖 ) (𝑒 −𝑒 ) 𝑖 𝑖−1

𝑑1

La valeur 𝑚𝑜 = 𝑒𝑖𝑜−1 + (𝑒𝑖𝑜 − 𝑒𝑖𝑜−1)(𝑑 +𝑑 ) est la valeur modale, où :𝑒𝑖𝑜−1 est 1 2

l’extrémité inférieure de la classe modale, 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1 est l’amplitude de la classe modale, 𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 et 𝑑2 = 𝑓𝑖 − 𝑓𝑖+1 lorsque les classes ont la même amplitude ou 𝑑1 = 𝑓′𝑖 − 𝑓′𝑖−1 et 𝑑2 = 𝑓′𝑖 − 𝑓′𝑖+1 lorsque les classes ont des amplitudes différentes.

78

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. D’après l’histogramme, c’est la classe [6000 ; 9000[ qui a la plus grande ordonnée : h2 = f2 = 0,45. D’où la classe modale est [eio-1, eio[ = [6000 ; 9000[ et la valeur modale est : 𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1

79

𝑑1 0,45 − 0,25 = 6000 + 9000 − 6000 = 7200 𝐷𝐻 𝑑1 + 𝑑2 0,45 − 0,25 + 0,45 − 0,15

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Quant à l’exemple de la distribution des chômeurs inscrits à

l’ANAPEC selon l’ancienneté de chômage en Janvier 2015, c’est la classe [0 ; 1[ qui a la plus grande ordonnée :

h1 = f1 . ar / a1 = f’1 = 0,168.

D’où la classe modale est [eio-1, eio[ = [0 ; 1[ et la valeur modale est : 𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1

80

𝑑1 𝑑 1 +𝑑 2

=0+ 1−0

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

0,168−0 0,168−0+0,168−0,095

= 0,6971 𝑚𝑜𝑖𝑠.

Dans la plupart des cas concrets, il y a une seule

valeur modale, la distribution est dite alors unimodale. Si la distribution sur une population comporte deux ou

plusieurs

modes

(distribution

bimodale

ou

multimodale) cela laisse à penser qu’il existe deux ou

plusieurs groupes distincts dans la population. Par exemple, la distribution des pointures de chaussures des hommes et femmes réunies. 81

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-4- La médiane et les quantiles

a- La médiane La médiane est la valeur de la variable statistique telle qu’il ait autant d’observations supérieures et

d’observations inférieures à cette valeur. Elle partage la série statistique en deux parties d’égal effectif.

82

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

i) le cas d’une variable discrète : *Soit une série statistique de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 connues, distinctes ou non et classées par ordre de valeurs croissantes : 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛 . On appelle médiane la valeur 𝑚𝑒 , telle que : (nombre d’observations inférieures ou égales à 𝑚𝑒 ) ≥ n/2 et (nombre d’observations supérieures ou égales à 𝑚𝑒 ) ≥ n/2. Autrement dit, il y a au moins 50 % des observations qui ont une valeur inférieure ou égale à 𝑚𝑒 la médiane et il y a au moins 50% des observations qui ont une valeur supérieure ou égale à 𝑚𝑒 . Sa définition dépend de la parité de n : ∗ - Si n est un nombre impair (n = 2 p + 1), la valeur médiane sera 𝑚𝑒 = 𝑥𝑝+1 ; ∗ - Si n est un nombre pair (n = 2 p), la valeur médiane sera 𝑚𝑒 = (𝑥𝑝∗ + 𝑥𝑝+1 )/2. 83

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple: Afin de réaliser une étude sur la rentabilité sectorielle dans le secteur S1, une enquête permet d’obtenir les taux de rentabilité en % de 8 entreprises : 2,5 ; 3 ; 3,1 ; 4,1 ; 5,4 ; 4,5 ; 5,2 ; 2,5. La valeur médiane de cet échantillon est obtenue en classant ces 8 valeurs par ordre croissant : Rang de

1

2

3

4

5

6

7

8

2,5

2,5

3,0

3,1

4,1

4,5

5,2

5,4

l’observation i Rentabilité financière (en%) xi

84

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Le nombre d’observations n = 8 étant un nombre pair (n = 2 p avec p = 4) la valeur médiane me

correspond à 𝑥𝑝∗ + 𝑥𝑝+1∗ /2soit: 𝑥4∗ + 𝑥5∗ /2 = 3,1 + 4,1 /2 = 3,6.

85

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Pour comparer la rentabilité des firmes de ce secteur S1 à celle des firmes du secteur S2, on a prélevé dans ce dernier un échantillon de 9 entreprises : 3 ; 3,5 ; 3,8 ; 4,1 ; 4,1 ; 4,5 ; 5,5 ; 5,5 ; 4,2. Pour obtenir la valeur médiane de ce deuxième échantillon, on réécrit les valeurs de cette série dans l’ordre croissant : Rang de

1

2

3

4

5

6

7

8

9

3

3,5

3,8

4,1

4,1

4,2

4,5

5,5

5,5

l’observation i Rentabilité financière (en%) xi 86

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

La taille de l’échantillon étant un nombre impair

(n = 2p +1 avec p = 4), la valeur médiane me correspond à xp+1* : me = x5 = 4,1.

87

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ii) le cas d’une variable continue : Lorsque les n observations d’une variable continue X sont regroupées en K classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs respectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la classe médiane est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,5 par excès, c’est-à-dire Fi>0,5.

88

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Par interpolation linéaire, on a :

𝑚𝑒 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1

= 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1

89

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

0,5 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1 0,5 − 𝐹𝑖−1 𝑓𝑖

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. la classe médiane est la classe [6000, 9000[ dont la

fréquence cumulée croissante approche 0,5 par excès, c’est-à-dire F2 = 0,70 > 0,5.

90

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

D’où : la classe médiane est : [e1, e2[=[6000 ; 9000[ et, par

interpolation linéaire, on a :

𝑚𝑒 = 𝑒1 + 𝑒2 − 𝑒1

0,5 − 𝐹1 = 𝑒1 + 𝑒2 − 𝑒1 𝐹2 − 𝐹1

𝑚𝑒 = 6000 + 9000 − 6000

0,5 − 0,25 0,70 − 0,25

= 6000 + 9000 − 6000

91

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

0,5 − 𝐹1 𝑓2

0,5 − 0,25 = 7666,6667 0,45

b- Les quantiles

Le quantile est un indicateur de position. Il est une généralisation de la notion de médiane.

Le quantile d’ordre α (0 ≤ α ≤ 1), noté 𝑥𝛼 , est tel qu’une proportion α des individus ait une valeur du

caractère X inférieure ou égale à 𝑥𝛼 . Le quantile 𝑥0,5 est égal à la médiane.

Les quantiles les plus courants sont : les quartiles, les déciles et les centiles. 92

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Les quartiles sont les valeurs d’une série ou d’une distribution statistique rangées par ordre croissant (ou

décroissant) qui partagent l’effectif total en quatre parties égales. Ils sont les quantiles d’ordre ¼, ½ et ¾.

Ils sont ainsi notés : Q1 = premier quartile = 𝑥0,25 ; Q2 = deuxième quartile = médiane = 𝑥0,5 et Q3 = troisième quartile = 𝑥0,75 (Q1 ≤ Q2 ≤ Q3). 93

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

i) le cas d’une variable discrète : Les trois quartiles Q1, Q2 et Q3 sont des nombre qui partagent les n observations en 4 classes qui ont chacune un effectif sensiblement égal à n/4. Le second quartile coïncide évidemment avec la médiane.

94

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

 Premier quartile. Le premier quartile Q1 est défini comme suit : Q1= (xn/4* + xn/4+1*)/2 si n/4 est un entier ;

Q1= x[n/4]+1* (où [n/4] est la partie entière de n/4) si n/4 n’est pas un entier.

On a la propriété : il y a au moins 25 % des observations qui ont une valeur inférieure ou égale à 𝑄1 et il y a au moins 75% des observations qui ont une valeur supérieure ou égale à 𝑄1 . 95

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

 Deuxième quartile. Sa valeur Q2 est égale à la médiane me.  Troisième quartile. Sa valeur Q3 est définie comme suit : Q3= (x3n/4* +x3n/4+1*)/2 si 3n/4 est un entier ;

Q3= x[3n/4]+1* (où [3n/4] est la partie entière de 3n/4) si 3n/4 n’est pas un entier.

On a la propriété : il y a au moins 75 % des observations qui ont une valeur inférieure ou égale à 𝑄3 et il y a au moins 25% des observations qui ont une valeur supérieure ou égale à 𝑄3 . 96

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple : Pour l’échantillon des 8 firmes issues de S1, le nombre d’observations n étant égal à 8, n/4 est l’entier 2. Par suite Q1= (xn/4* + xn/4+1*)/2=(x2* + x3*)/2=(2,5+3)/2=2,75. 3n/4 étant l’entier 6, on a: Q3=(x3n/4* + x3n/4+1*)/2=(x6* + x7*)/2=(4,5+5,2)/2=4,85.

Pour les 9 firmes issues de S2 le nombre d’observations n n’est pas divisible par 4 car n/4=9/4=2,25. Et [n/4] la partie entière de n/4 étant égale à 2, on a Q1= x[n/4]+1* = Q1= x* =3,8. De même, on a Q3= x[3n/4]+1* = x7* =4,5. 97

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ii) le cas d’une variable continue : 

Premier quartile. La classe qui contient le premier quartile est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,25 par excès, c’est-à-dire Fi>0,25.

Par interpolation linéaire on a :

𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1

0,25 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1



Deuxième quartile. Sa valeur Q2 est égale à la médiane me.



Troisième quartile. La classe qui contient le troisième quartile est la classe [ei-1, ei[ dont la fréquence cumulée croissante approche 0,75 par excès, c’est-à-dire Fi>0,75.

Par interpolation linéaire on a :

𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1

98

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

0,75 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1

Exemple : On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. 

La classe qui contient le premier quartile est la classe [6000, 9000[ telle que F(9000) = 0,7 > 0,25 et F(6000) = 0,25 ≤ 0,25. Par interpolation linéaire on a :

𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1

0,25 − 𝐹𝑖−1 = 6000 + 9000 − 6000 𝐹𝑖 − 𝐹𝑖−1

0,25 − 0,25 = 6000. 0,7 − 0,25



Deuxième quartile. Sa valeur Q2 est égale à la médiane me = 7666,6667.



Troisième quartile. Sa valeur estimée Q3 est définie par F(Q3) = 0,75. La classe qui contient le troisième quartile est la classe [9000, 12000[ telle que F(12000)=0,85 > 0,75 et F(9000)=0,7 ≤ 0,75. Par interpolation linéaire on a :

𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1 99

0,75 − 𝐹𝑖−1 = 9000 + 12000 − 9000 𝐹𝑖 − 𝐹𝑖−1

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

0,75 − 0,7 ≈ 10000. 0,85 − 0,7

2- Les indicateurs de dispersion

2-1-La dispersion en termes d’écarts moyens

Le calcul des écarts moyens se basent sur les caractéristiques de tendance centrale, telles que : la valeur médiane me ou la valeur moyenne 𝑥. Il considère ces écarts en valeur absolue ou en puissance paire afin de traduire correctement la dispersion.

100

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

a-Ecarts absolus moyens i) Ecart absolu moyen par rapport à la valeur médiane 𝑚𝑒 L’écart absolu moyen par rapport à la valeur médiane me d’une série de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 est

𝑒𝑚 𝑒 =

1 𝑛

𝑛

𝑖=1

1 𝑥𝑖 − 𝑚𝑒 = ( 𝑥1 − 𝑚𝑒 + 𝑥2 − 𝑚𝑒 + ⋯ + 𝑥𝑛 − 𝑚𝑒 ) 𝑛

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu moyen par rapport à la valeur médiane me est :

𝑒𝑚 𝑒 101

1 = 𝑛

𝑘

𝑖=1

1 𝑛𝑖 𝑥𝑖 − 𝑚𝑒 = (𝑛1 𝑥1 − 𝑚𝑒 + 𝑛2 𝑥2 − 𝑚𝑒 + ⋯ + 𝑛𝑘 𝑥𝑘 − 𝑚𝑒 ) 𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

ii) Ecart absolu moyen par rapport à la moyenne arithmétique 𝑥 L’écart absolu moyen par rapport à la moyenne arithmétique x d’une série de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 est 1 𝑒x = 𝑛

𝑛

𝑖=1

1 𝑥𝑖 − x = ( 𝑥1 − x + 𝑥2 − x + ⋯ + 𝑥𝑛 − x ) 𝑛

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu moyen par rapport à la moyenne arithmétique x est : 1 𝑒x = 𝑛 102

𝑘

𝑖=1

1 𝑛𝑖 𝑥𝑖 − x = (𝑛1 𝑥1 − x + 𝑛2 𝑥2 − x + ⋯ + 𝑛𝑘 𝑥𝑘 − x ) 𝑛

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

b- Variance et écart-type Ils mesurent la dispersion des données autour de la moyenne. La variance d’une variable statistique X est la moyenne arithmétique des carrés des écarts à la moyenne arithmétique : Var(X) = V(X) =

1 𝑛

𝑛 𝑖=1(𝑥𝑖

1

− 𝑥 )2 = 𝑛

𝑛 2 𝑖=1 𝑥𝑖

− 𝑥2

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘 avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la variance de X est : V(X) =

1 𝑛

𝑘 𝑖=1 𝑛𝑖 (𝑥𝑖

− 𝑥 )2 =

1 𝑛

𝑘 2 𝑖=1 𝑛𝑖 𝑥𝑖

− 𝑥2

Lorsque X est une variable continue les 𝑥𝑖 sont les centres des classes [ei-1 ; ei[ : 𝑥𝑖 = 103

𝑒 𝑖−1 +𝑒 𝑖 2

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

L’écart-type est la racine carrée de la variance : 𝜎𝑋 = 𝑉(𝑋) L’écart-type est exprimé dans la même unité que les observations, alors que la variance s’exprime dans le carré de cette unité. N.B. : L’écart-type donne plus de poids aux observations extrêmes que l’écart absolu moyen à la moyenne : 𝜎𝑋 ≥ 𝑒𝑥 . 104

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple 1 (le cas d’une variable discrète): On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du logement. 𝒙𝒊 1 2 3 4 5 6 7 8 Total 105

𝒏𝒊 10 15 15 30 10 12 5 3 100

𝒏𝒊𝒙𝟐𝒊 10 60 135 480 250 432 245 192 1804

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝒙𝒊 − 𝒙 -2,86 -1,86 -0,86 0,14 1,14 2,14 3,14 4,14 -

(𝒙𝒊 − 𝒙)𝟐 8,1796 3,4596 0,7396 0,0196 1,2996 4,5796 9,8596 17,1396 -

𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐 81,796 51,894 11,094 0,588 12,996 54,9552 49,298 51,4188 314,04

La variance de X est : 𝑉 𝑋 Ou encore :

1 𝑘 2 2 1804 = 𝑛 𝑖=1 𝑛𝑖 𝑥𝑖 − 𝑥 = 100

1 𝑘 2 314,04 V(X) = 𝑛 𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥) = 100 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2

L’écart-type de X est : 𝜎𝑋 = 𝑉(𝑋) = 1,7721 𝑝𝑖è𝑐𝑒𝑠.

106

− 3,862 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Exemple 2 (le cas d’une variable continue): On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise Atlas. Valeurs du salaire en milliers de DH

𝒙𝒊 (le centre de la classe [ei-1; ei[) 4,5

𝒏𝒊

𝒏𝒊 𝒙𝒊

𝒏𝒊 𝒙𝟐𝒊

𝒙𝒊 − 𝒙

(𝒙𝒊 − 𝒙)𝟐

𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐

50

225

1012,5

-3,9

15,21

760,5

6≤x 0, alors la liaison linéaire est positive ;

*Lorsque r(X, Y) = 0, alors la liaison linéaire est nulle ; il existe peut être une liaison non linéaire entre

X et Y; 148

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Le coefficient de corrélation linéaire entre deux variables quantitatives indépendantes est nul, mais la réciproque n’est pas vraie : 𝑋 𝑒𝑡 𝑌 𝑖𝑛𝑑é𝑝𝑒𝑛𝑑𝑎𝑛𝑡𝑒𝑠 → ↚ 𝑟 𝑋, 𝑌 = 0

149

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2- Ajustement linéaire d’un nuage de points :

Lors d’une étude simultanée de deux variables quantitatives X et Y sur des individus, on cherche si ces

variables sont liées. X et Y peuvent alors être liées par une relation fonctionnelle du type y = f(x).

150

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Ces

deux

variables

peuvent

être

totalement

indépendantes, telles que la taille de l’étudiant et sa note de statistique, totalement dépendantes telles que la distance x du rayon d’une sphère et son volume y liées par la relation 𝑦 =

4 𝜋𝑥 3 3

, ou partiellement

dépendantes telles que certaines variables en économie,

en médecine et pour d’autres sciences. 151

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Indépendance et dépendance fonctionnelle de X et Y

152

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Dépendance partielle de X et Y et ajustements possibles

153

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Pour cette dernière situation, si l’on représente graphiquement l’ensemble des points (xi, yi)

sur un

système d’axe, la forme du nuage de points peut inviter à ajuster

une

droite,

une

parabole,

une

courbe

exponentielle, etc. Ces courbes peuvent être obtenues graphiquement ou encore par une méthode algébrique dont la plus connue s’appelle la méthode des moindres carrés. 154

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On

observe

simultanément

les

variables

quantitatives X et Y sur n individus, on trace l’ensemble des points Mi(xi, yi), et on veut ajuster

une droite d’équation y = ax + b qui passe au « plus près des points Mi ».

155

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

En adoptant la méthode des moindres carrés, les paramètres a et b de la droite y = ax + b sont :

𝑎=

𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 = 2 𝑥𝑖 − 𝑥

𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦 𝑥𝑖2 − 𝑛𝑥 2

En divisant le numérateur et le dénominateur par n, on obtient : 𝐶𝑜𝑣 𝑥, 𝑦 𝑎= 𝜎𝑥2

où: 𝑎représente la pente de la droite. 156

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Quant à la constante b, elle s’obtient par la relation : 𝑏 = 𝑦 − 𝑎𝑥 , où 𝑏 représente l’ordonnée à l’origine.

Cette droite est la droite des moindres carrés de y en x ou encore la droite de régression de y en x.

157

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Remarque : Droite des moindres carrés de x en y : 𝑥 = 𝑎′ 𝑦 + 𝑏′ Cette droite s’obtient en minimisant la somme des carrés des

écarts parallèlement à l’axe des abscisses. Il suffit d’échanger x et y dans les formules qui donnent a et b pour obtenir a’ et b’, ainsi la droite a pour équation : 𝑥 = 𝑎′ 𝑦 + 𝑏′ ou : 𝑦 = 𝑎′ =

158

𝐶𝑜𝑣 𝑥,𝑦 𝜎𝑦2

1 𝑥 𝑎′



𝑏′ 𝑎′

et 𝑏 ′ = 𝑥 − 𝑎′𝑦

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

3- Qualité d’ajustement linéaire : 3-1- Le coefficient de détermination 𝒓𝟐 En vue de mesurer la qualité d’ajustement linéaire on calcule le coefficient de détermination

𝑟 2 , qui est égal au coefficient de corrélation linéaire au carré 𝑟 2 =

𝐶𝑜𝑣 𝑋,𝑌 2 . 2 2 𝜎𝑥 𝜎𝑦

Plus 𝑟 2 est proche de 1

plus la qualité d’ajustement est bonne. 159

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

3-2- L’équation de la décomposition de la variation totale de Y La somme des carrés totale (SCT) = la somme des carrés expliquée (SCE) + la somme des carrés résiduelle (SCR)

𝑛

𝑛

𝑦𝑖 − 𝑦 𝑖=1

2

=

𝑛

𝑦𝑖 − 𝑦 𝑖=1

où: les 𝑦𝑖 sont les valeurs observées de Y ; les 𝑦𝑖 sont les valeurs estimées de Y ; et 𝑦 est la moyenne arithmétique de Y. 160

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2

+

𝑦𝑖 − 𝑦𝑖 𝑖=1

2

3-3- La quantité (1-𝒓𝟐 La quantité (1-𝑟 2 est égale à la proportion de variation de Y

non expliquée par la droite des moindres carrés.

1

𝑟2

161

− 𝑟2

=1−

=

𝑛 𝑖=1 𝑛 𝑖=1

𝑛 𝑖=1 𝑛 𝑖=1

𝑦𝑖 − 𝑦𝑖 𝑦𝑖 − 𝑦

𝑦𝑖 − 𝑦𝑖 𝑦𝑖 − 𝑦

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2 2

2 2

𝑆𝐶𝑅 = 𝑆𝐶𝑇

𝑆𝐶𝑅 =1− 𝑆𝐶𝑇

162

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Les indices sont des rapports entre une ou plusieurs

observations d’une même grandeur, ils permettent de supprimer le problème des unités.

Les indices simples sont notamment utiles dans le calcul des taux de variation. Les indices synthétiques permettent de résumer, à l’aide des moyennes arithmétique, harmonique et géométrique, l’évolution d’un agrégat de grandeurs économiques. Les coefficients de concentration ont pour objet la saisie des déformations des distributions se traduisant par un regroupement des individus dans une ou plusieurs classes. 163

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Section 1- Indices simples ou élémentaires Soit G une grandeur économique qui varie dans le temps et qui prend les valeurs : 𝐺0 , …, 𝐺𝑡 , …, 𝐺𝑇 aux dates tϵ{0 ;1 ;… ;T} .

1- définition : On appelle indice simple ou élémentaire, la grandeur simple définie par le rapport suivant 𝐼𝑡/0 =

𝐺𝑡 𝐺0

avec tϵ{0 ;1 ;… ;T} où t=0 est la date de référence ou

époque de base et où t est la date courante. Nous pouvons également exprimer les indices en % : 𝐼𝑡/0 % = 164

𝐺𝑡 𝐺0

𝑥 100 avec tϵ{0 ;1 ;… ;T}.

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2- Propriétés des indices simples : 2-1- La circularité :

𝐼𝑡/0 = 𝐼𝑡/𝑡′ 𝐼𝑡′/0 =

𝐺𝑡 𝐺𝑡′ 𝐺𝑡′ 𝐺0

=

𝐺𝑡 𝐺0

avec t ϵ {0 ;1 ;… ;T} et t’ ϵ {0 ;1 ;… ;T}.

2-2- La réversibilité :

𝐼𝑡/0 = 2-3- L’enchainement :

1 𝐼0/𝑡

1 = avec t ϵ {0 ; 1 ; … ; T} 𝐺0 𝐺𝑡

𝐼𝑡/0 = 𝐼𝑡/𝑡−1 𝐼𝑡−1/𝑡−2 𝑥 … 𝑥 𝐼1/0 165

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝐺𝑡 𝐺𝑡−1 𝐺1 𝐺𝑡 = 𝑥…𝑥 = 𝐺𝑡−1 𝐺𝑡−2 𝐺0 𝐺0

Exemple : Depuis 2005, Monsieur Madani déjeune tous les premiers samedis du mois d’avril dans un restaurant. Son menu est composé d’une salade verte, du poisson, d’une portion de fromage, d’une glace à la vanille et il boit de limonade. Le même repas lui a été servi chaque année avec quelques modifications sur les quantités qu’il consomme : Tableau de données pour indice synthétique 2005

2010

2015

Quantité en

Prix en

Quantités en

Prix en euros

Quantités en

Prix en

grammes

dirhams par

grammes

par kg

grammes

dirhams par

kg

kg

Salade verte

120

20

150

26

160

31

Poisson

300

70

200

100

180

120

Fromage

50

8

60

10

80

12

Glace à la

40

20

60

25

70

30

1

10

1

13

1

15

vanille Bouteille de limonade

166

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Calculer les indices élémentaires de prix de chacun des éléments du repas de Monsieur Madani, base 1 en 2005.

Tableau-Indices simples base 1 en 2005 Indices élémentaires 𝑮 𝑰𝟐𝟎𝟏𝟎/𝟐𝟎𝟎𝟓 = 𝟐𝟎𝟏𝟎

Indices élémentaires 𝑮𝟐𝟎𝟏𝟓 𝑰𝟐𝟎𝟏𝟓/𝟐𝟎𝟎𝟓 = 𝑮𝟐𝟎𝟎𝟓

Salade verte

1,3

1,55

Poisson

1,43

1,71

Fromage

1,25

1,5

Glace à la vanille

1,25

1,5

Bouteille de limonade

1,3

1,5

𝑮𝟐𝟎𝟎𝟓

167

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*En utilisant les propriétés des indices élémentaires, calculer pour les éléments du repas de Monsieur Madani les indices élémentaires de prix I2005/2010 et I2005/2015 sauf pour la limonade.

Indices élémentaires

𝐼2005/2010 = 𝐼

168

1 2010 /2005

Indices élémentaires

𝐼2005/2015 =

1 𝐼2015/2005

Salade verte

0,77

0,65

Poisson

0,70

0,58

Fromage

0,80

0,67

Glace à la vanille

0,80

0,67

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Calculer l’indice I2010/2015 pour la limonade en utilisant les indices I2010/2005 et I2005/2015.

Selon la propriété de la circularité : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015 Où : 𝐼2005/2010 = 𝐼

1 2010/2005

1

= 1,3 = 0,77 et 𝐼2005/2015 = 𝐼

1 2015/2005

D’où : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015 = 1,3 𝑥 0,67 = 0,87

169

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1

= 1,5 = 0,67

Section 2- Indices synthétiques 1- Indices des prix

Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées de ce même article sont notées 𝑞 𝑖 . Les dépenses pour l’année de

base et pour l’année courante sont 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖 respectivement. Les coefficients budgétaires de l’article i mesurent la part de la dépense totale consacrée à cet article aux dates 0 (époque de base) et t (époque courante) : 𝑤0𝑖 170

=

𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0

et

𝑤𝑡𝑖

=

𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

avec

𝑛 𝑖 𝑤 𝑖=1 0

=

𝑛 𝑖 𝑤 𝑖=1 𝑡

=1

1-1- Indice de Laspeyres des prix: L’indice de Laspeyres des prix est la moyenne arithmétique pondérée des

indices élémentaires de prix

𝑖 𝐼𝑡/0

=

𝑝𝑡𝑖 𝑝0𝑖

, la pondération utilisée

étant celle de l’époque de base :

𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

𝑛 𝑝

𝑖 𝑤0𝑖 𝐼𝑡/0 =

𝐿𝑡/0 = 𝑖=1

𝑝

𝐿𝑡/0 = 171

𝑝𝑡𝑖 𝑝0𝑖

𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

=

𝑛 𝑖 𝑖 𝑝 𝑖=1 𝑡 𝑞0 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡" 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝑤0𝑖

=

𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0

1-2- Indice de Paasche des prix : L’indice de Paasche des prix est la moyenne harmonique pondérée des

indices élémentaires des prix

𝑤𝑡𝑖

=

𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡

=

1 𝑝𝑖𝑡 𝑝𝑖0

=

𝑝0𝑖 𝑝𝑡𝑖

, la pondération utilisée

étant celle de l’époque courante :

𝑝 𝑃𝑡/0

𝑝 𝑃𝑡/0 172

𝑖 𝐼0/𝑡

=

1 𝑛 𝑖 𝑖 𝑖=1 𝑤𝑡 𝐼0/𝑡

=

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑛 𝑖 𝑖 𝑝0 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑝𝑡

=

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡

𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "t" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

1-3- Indice de Fisher des prix : L’indice de Fisher des prix est la moyenne géométrique simple des indices de prix de Laspeyres et de Paasche :

𝑝 𝐹𝑡/0

173

=

𝑝 𝑝 𝐿𝑡/0 𝑃𝑡/0

=

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞0 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡

2- Indices des quantités : 2-1- Indices de Laspeyres des quantités : L’indice de Laspeyres des quantités est la moyenne arithmétique pondérée des indices élémentaires des quantités 𝑤0𝑖

=

𝑝0𝑖 𝑞0𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 0 0

=

𝑞𝑡𝑖 𝑞0𝑖

, la pondération utilisée

étant celle de l’époque de base :

𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

𝑛 𝑞 𝐿𝑡/0

𝑖 𝑤0𝑖 𝐼𝑡/0 =

= 𝑖=1

𝑞 𝐿𝑡/0 174

𝑖 𝐼𝑡/0

𝑞𝑡𝑖 𝑞0𝑖

𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

=

𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" au prix 𝑑𝑒 "0" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "0"

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

2-2- Indice de Paasche des quantités :

L’indice de Paasche des quantités est la moyenne harmonique pondérée des

indices élémentaires des quantités

𝑤𝑡𝑖

=

𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑝𝑖 𝑞 𝑖 𝑖=1 𝑡 𝑡

=

1 𝑞𝑖𝑡 𝑞𝑖0

=

𝑞0𝑖 𝑞𝑡𝑖

, la pondération utilisée

étant celle de l’époque courante :

𝑞 𝑃𝑡/0

𝑞 𝑃𝑡/0 175

𝑖 𝐼0/𝑡

=

1 𝑛 𝑖 𝑖 𝑖=1 𝑤𝑡 𝐼0/𝑡

=

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑛 𝑖 𝑖 𝑞0 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖 𝑞𝑡

=

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞0

𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "𝑡" = 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" au prix de "𝑡"

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

3- L’indice de dépense et la réversibilité selon les facteurs Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées de ce même article sont notées 𝑞𝑖 . Les dépenses pour l’année de base et pour l’année courante sont : 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖 respectivement. On définit l’indice de dépense

𝐷𝑡/0 de l’année courante t à la date de référence 0 :

𝐷𝑡/0 =

𝑛 𝑖 𝑖 𝑖=1 𝑝𝑡 𝑞𝑡 𝑛 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

=

𝑛 𝑖 𝑖=1 𝑑𝑡 𝑛 𝑖 𝑖=1 𝑑0

On peut démontrer l’égalité suivante, connue sous le nom de réversibilité selon les facteurs : 𝑝

𝑞

𝑞

𝑝

𝐷𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0

176

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Application :

On reprend l’exemple de l’application ci-dessus de Monsieur Madani de la première section. *Calculer l’indice des prix du repas de Monsieur Madani, pour les années 2010 (notée 1) et 2015 (notée 2) base 1 en 2005 (notée 0), en employant les constructions des indices de Laspeyres et de Paasche.

177

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Tableaux de données pour les indices synthétiques p0

q0

p1

q1

p2

q2

Salade verte

20

0,12

26

0,15

31

0,16

Poisson

70

0,3

100

0,2

120

0,18

Fromage

8

0,05

10

0,06

12

0,08

Glace à la vanille

20

0,04

25

0,06

30

0,07

Bouteille de limonade

10

1

13

1

15

1

p0q0

p1q0

p2q0

p1q1

p0q1

p2q2

p0q2

Salade verte

2,4

3,12

3,72

3,9

3

4,96

3,2

Poisson

21

30

36

20

14

21,6

12,6

Fromage

0,4

0,5

0,6

0,6

0,48

0,96

0,64

Glace à la vanille

0,8

1

1,2

1,5

1,2

2,1

1,4

Bouteille de limonade

10

13

15

13

10

15

10

34,6

47,62

56,52

39

28,68

44,62

27,84

Total 178

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Indices synthétiques des prix de Laspeyres : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝 𝐿1/0

=

5 𝑖 𝑖 𝑖=1 𝑝1 𝑞0 5 𝑖 𝑖 𝑝 𝑖=1 0 𝑞0

47,62 = = 1,3763 (𝑜𝑢 137,63 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 34,6

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝐿𝑝2/0

179

=

5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞0 5 𝑖 𝑖 𝑝 𝑖=1 0 𝑞0

56,52 = = 1,6335 (𝑜𝑢 163,35 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 34,6

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Indices synthétiques des prix de Paasche : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝

𝑃1/0 =

5 𝑖 𝑖 39 𝑖=1 𝑝1 𝑞1 = = 1,3598 (𝑜𝑢 135,98 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 5 𝑖 𝑖 28,68 𝑖=1 𝑝0 𝑞1

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝑝 𝑃2/0 =

180

5 𝑖 𝑖 𝑖=1 𝑝2 𝑞2 44,62 = = 1,6027 (𝑜𝑢 160,27 𝑒𝑛 𝑏𝑎𝑠𝑒 100) 5 𝑖 𝑖 27,84 𝑖=1 𝑝0 𝑞2

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Indices de Fisher des prix : -Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) : 𝑝

𝑝

𝑝

𝐹1/0 = 𝐿1/0 𝑃1/0 =

5 𝑖 𝑖 𝑝 𝑖=1 1 𝑞0 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

5 𝑖 𝑖 𝑝 𝑖=1 1 𝑞1 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞1

= 1,3763 𝑥 1,3598 = 1,368 (𝑜𝑢 136,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) : 𝑝

𝑝

𝑝

𝐹2/0 = 𝐿2/0 𝑃2/0 =

181

5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞0 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞0

5 𝑖 𝑖 𝑝 𝑖=1 2 𝑞2 5 𝑖 𝑖 𝑖=1 𝑝0 𝑞2

= 1,6335 𝑥 1,6027 = 1,618 (𝑜𝑢 161,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Références bibliographiques BOURBONNAIS, (Régis), Econométrie, 7ème édition DUNOD, Janvier 2009. GOLDFARB (Bernard) et PARDOUX (Catherine), Introduction à la méthode statistique, Gestion-Economie, Edition DUNOD, 2000. LECOUTRE (Jean-Pierre), Statistique et probabilités, Cours et exercices corrigés, Edition DUNOD, 2012. LETHIELLEUX (Maurice), Exercices de statistiques et probabilités avec rappels de cours en 12 fiches, Edition DUNOD, 2009. MONINO (Jean-Louis), KOSIANSKI (Jean-Michel), et LE CORNU (François), TD Statistique descriptive, Édition DUNOD, 2010. PUPION (Pierre-Charles), Statistique pour la gestion, Edition DUNOD, 2008. 182

Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès