32 0 590KB
TEMA 5: INDICATORII TENDINŢEI CENTRALE (INDICATORII MEDII) 1. 2. 3. 4.
Indicatorii medii – noţiuni generale. Media aritmetică şi proprietăţile ei Medii cu aplicaţie specială Indicatorii de poziţie: modul, mediana, cuartile şi decile
1. Indicatorii medii – noţiuni generale. Un loc important în categoria indicatorilor derivaţi îl ocupă indicatorii tendinţei centrale sau indicatorii medii. Mărimile medii constituie instrumente principale de cunoaştere a fenomenelor de masă şi au un grad mare de aplicabilitate practică. Ele redau ceea ce este tipic, comun şi general în evoluţia fenomenelor. Pentru a asigura un conţinut cât mai real mediilor calculate se impune ca valorile individuale din care se obţin să fie cât mai apropiate între ele. Mediile sînt mărimi statistice care exprimă, în mod sintetic şi generalizat ceea ce este normal, esenţial, tipic pentru unităţile unei colectivităţi distribuite după o anumita caracteristică. Din definiţie rezultă câteva trăsături de care trebuie să se ţină seama in calculul şi interpretarea mărimilor medii şi pe care le vom precauta în continuare. Media exprimă în mod sintetic valorile unei serii statistice şi ca urmare are un caracter abstract. Este o mărime generalizată în sensul că înlocuind fiecare termen al unei serii cu nivelul mediu suma termenilor rămâne aceiaşi. Media sintetizează normalul, adică exprimă nivelul purtat de majoritatea unităţilor colectivităţii distribuite după o anumită caracteristică. Pentru aplicarea corectă a metodei mediilor este necesar să se respecte următoarele condiţii: - calculul mediei să se bazeze pe folosirea unui număr mare de cazuri individuale - valorile din care se calculează media să fie omogene - alegerea acelei forme de medii care corespunde cel mai bine formei de variaţie a caracteristicii cercetate. Prin definiţie Media unei variabile statistice este expresia sintetizării într-un singur nivel reprezentativ a tot ceea ce este esenţial, tipic şi obiectiv în apariţia, manifestarea şi dezvoltarea acesteia Clasificarea mărimilor medii Mediile se diferenţiază între ele în funcţie de rolul pe care îl au în analiza statistică şi după modul de obţinere a lor: 1. După rolul în statistică se clasifică: a) mărimi medii fundamentale (media aritmetică, modulul, mediana). b) mărimi medii cu aplicaţii speciale (media geometrică, armonică, pătratică, etc.). 2. După modul de obţinere mărimile medii pot fi: a) mărimi medii de calcul(media aritmetică, armonică, geometrică) b) mărimi medii de poziţie(modul, mediana). Mărimile medii de poziţie se află prin depistarea termenului care ocupă poziţia centrală într-o distribuţie statistică. Mărimile medii de calcul se obţin prin efectuarea a două categorii de operaţii: acumularea termenilor seriei (fie prin însumare sau prin produs); revenirea (prin împărţire sau extragere de radical) la un nivel reprezentativ pentru toţi termenii seriei incluşi în calcul. La rândul lor mărimile medii de calcul se diferenţiază în medii simple şi medii ponderate. Mediile simple se calculează în cazul seriilor simple sau fără frecvenţă, adică pentru seriile în care variantele caracteristicii de distribuţie sunt purtate de câte o singură unitate statistică Mediile ponderate se calculează când variantele caracteristicii au frecvenţe diferite, adică în cazul seriilor cu frecvenţă: X : ( x i , ni ), i 1..m, unde n1 n2 ... ni . 2. Media aritmetică şi proprietăţile ei Cel mai cunoscut indicator al tendinţei centrale este media aritmetică. Media aritmetică face parte din categoria mediilor fundamentale. Este simbolizată prin X . Se foloseşte în general când fenomenul supus cercetării înregistrează modificări aproximative constante în progresia aritmetică.
Media aritmetică simplă se foloseşte pentru seriile simple, adică în cazul în care numărul variantelor caracteristicilor studiate este egal cu numărul unităţilor sau când se cunoaşte nivelul totalizat al caracteristicii şi numărul unităţilor., se află după relaţia: n
x
X
i 1
i
n
x
unde
n
i 1
i
x1 x 2 x3 ... x n , iar n - volumul colectivităţii
În cazul unei serii de distribuţie, când variantele caracteristicii se înregistrează de mai multe ori, media aritmetică simplă este înlocuită cu media aritmetică ponderată. Dacă fiecare variantă xi a caracteristicii are o anume frecvenţă de apariţie ni în colectivitate atunci în locul sumei simple se preferă agregatul : xi ni . În acest caz media aritmetică ponderată este obţinută prin relaţia:
n
X
x n i 1 n
i
n i 1
i
, i
Dacă în locul frecvenţei absolute ni se folosesc frecvenţe relative fi (sau fi%) relaţia de calcul devine : n
X
x i 1 n
fi
i
f i 1
x
i
100
fi
, (dacă f i 100%)
sau X
x f , i
i
(daca f i 1) .
i
Notă: În cazul când caracteristica statistică este reprezentată sub formă de intervale, media aritmetică se calculează luând în calitate de xi mijlocul intervalului respectiv (se presupune că unităţile individuale sunt reprezentate uniform în intervalul respectiv). Proprietăţile mediei aritmetice: 1. Media aritmetică este cuprinsă între xmax şi xmin ( x min X x max ). 2. Suma abaterilor nivelurilor individuale ale variabilelor aleatoare de la media lor este egală cu zero. n
Pentru seria simplă
(x i 1
i
X) 0.
x n
Pentru seria de frecvenţă
i 1
i
X ni 0 .
3. Media calculată pe baza variantelor caracteristicii micşorate sau mărite cu o constantă "a" se modifică în acelaşi sens şi cu aceeaşi mărime faţă de media seriei iniţiale .Se dă seria: x1,x2,... n
xn. X *
n
x i a x i i 1
i 1
n
n
a X a - pentru seria simplă.
n
X
*
x a n n i 1
i
i
X a
i
- pentru seria de frecvenţă 4. Media calculată din variantele caracteristicii multiplicate sau n
simplificate cu o constantă "k" se măreşte sau se micşorează de "k" ori. pentru serie simplă. m
X*
xi
k n n i 1
i
i
X - pentru serie de frecvenţă. k
X*
xi
k i 1
n
X k
Dacă se combina ultimele două proprietăţi se obţine formula de calcul simplificată a mediei
xi a k i 1 aritmetice: X k + a - pentru serii simple . n n xi a ni k i 1 X * k a - pentru serii de frecvenţă. ni n
5. Media aritmetică a unei variabile" Z" definită ca sumă a două variabile aleatoare independente X şi Y (Z=X+Y) este egală cu suma mediilor celor două variabile, adică X Y X Y . 3. Medii cu aplicaţie specială În categoria mărimilor medii de calcul cu aplicaţie specială cel mai des utilizate în proctica economică se includ: media armonică; media pătratică; media geometricăMedia armonică ( X h ) este o mărime definită ca inversă a mediei aritmetice calculată din valorile inverse ale caracteristicii. Dacă x1 , x2 , x3 ,...., xn sunt valorile caracteristicii, atunci
1 1 1 1 , , ,...., sunt valorile inverse. Poată fi calculată ca o medie simplă şi ponderată. x1 x 2 x3 xn
Xh
n
- media armonică simplă. X h
1 x i
n n x
i
- media armonică ponderată.
i i
Indicatori direcţi (X )
Indicatori indirecţi ( X h )
Productivitatea muncii cheltuielile de timp pentru o unitate de producţie Utilizarea fondurilor fixe producţia pe unitate de fond. fixe fonduri fixe pe unitate de producţie Puterea de cumpărare a leului cantitatea de mărfuri la 1 leu preţul unei unităţi de produs (lei) producţia într-o unitate de timp
Media pătratică X p .Este acea valoare care înlocuind termenii seriei ridicaţi la pătrat nu modifică suma pătratelor lor.
x
Xp
2 i
n
x n n 2 i
- pentru serii simple. X p
i
- pentru serii de frecvenţă (ponderate).
i
Media geometrică X g .se bazează pe relaţia de produs a termenilor seriei.
Xg
n
n
x1 x2 * * xn n xi
- pentru serii simple.
i 1
Xg
ni
x
n1 1
m
* x2n2 * * xnnm ni x ni - pentru serii de frecvenţă (ponderate). i 1
Calculul mediei geometrice prin logaritmi:
lg X g
lg x
i
n
lg X g
- pentru serii simple.
n * lg x - p/u serii de frecvenţă. n i
i
i
X g 10
de unde:
lg X g
Relaţia dintre toate aceste medii este dată de inegalităţile:
Xh Xg X X p.
Ex: Este dată repartiţia veniturilor lunare ale unor persoane Venitul Numărul xi xi*ni (mii $) pers. (ni) 2-4 10 3 30 4-6 16 5 80 6-8 25 7 175 8-10 15 9 135 10-12 9 11 99 12-14 5 13 65 Total 80 584 Deoarece avem o serie grupată pe intervale interval.
xi2ni
ni/xi
ni*log xi
90 3,333 4,771 400 3,2 11,184 1225 3,571 21,127 1215 1,667 14,314 1089 0,818 9,372 845 0,385 5,570 4864 12,974 66,338 de variaţie în calitate de xi vom lua mijlocul fiecărui
6
X
x n i 1 6
n i 1
Xh
i
i
584 7,3mii$ / pers 80
x n n 2 i
Xp
i
i
n n x
i i
80 6,166mii$ / pers 12,974
lg X g
i
4864 7,797mii$ / pers 80
n * lg x 66,338 0,829 80 n i
i
i
i
X g 100,829 6,749mii$ / pers. Relaţia dintre medii: 6,166 6,749 7,3 7,797
4. Indicatorii de poziţie: modul, mediana, quartile şi decile Modul (Mo)este valoarea caracteristicii cea mai frecvent întâlnită (observată) într-o serie statistică, adică valoarea ce-i corespunde frecvenţa maximă. Modul nu se calculează pentru seriile simple, sau pentru cele ce au frecvenţe egale( n1 n1 ... nn ) a. Aflarea modului în cazul unei caracteristici grupate pe variante de variaţie presupune: - se găseşte frecvenţa maximă - se citeşte în dreptul frecvenţei maxime valoarea caracteristicii corespunzătoare, valoare ce este egală cu Mo
Ex: Se cunoaşte distribuţia studenţilor după nota obţinută: Nota Studenţi ni 2 4 3 2 4 2 5 5 6 4 7 8 8 4 9 2
10
1
nmax=8 rezultă că Mo =7
b. Aflarea modului în cazul unei caracteristici grupate pe intervale de variaţie presupune: - aflarea frecvenţei maxime - citirea intervalului modal în dreptul frecvenţei maxime - calculul Mo după formula:
Mo X inf . l *
1 1 2
unde: Xinf – limita inferioară a intervalului modal l – lungimea intervalului modal Δ1 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului anterior Δ2 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor Ex: Se cunoaşte distribuţia salariaţilor după stajul de lucru: Stajul Lucrători (ani) ni 0-5 6 5-10 9 10-15 14 15-20 7 20-25 4 nmax=14 rezultă că
Mo 10 5
14 9 12,08ani (14 9) (14 7)
Mediana (Me) se defineşte ca acea valoare a caracteristicii a unei serii ordonate crescător până la care şi după care sunt distribuite un număr egal de unităţi ale colectivităţii: jumătate din unităţi sunt mai mari ca mediana, iar jumătate au valori mai mici. Astfel locul medianei corespunde valorii U Me
n 1 numită şi unitate mediană. 2
Aflarea medianei se face diferenţiat în funcţie de tipul seriei. a) Pentru serii simple cu un număr impar de termeni aflarea Me constă în găsirea termenului central. Ex: Vârsta: 15, 25, 10, 25, 18. - se aranjează în mod crescător valorile caracteristicii: 10, 15, 18, 20, 25 - aflăm (dacă e nevoie) locul medianei: U Me
5 1 3 şi astfel Me=18 2
b) Pentru serii simple cu un număr par de termeni aflarea Me constă în calculul mediei aritmetice simple a celor 2 termeni centrali: Ex: Vârsta: 15, 25, 10, 25, 18, 22 - se aranjează în mod crescător valorile caracteristicii: 10, 15, 18, 20, 22, 25 - aflăm (dacă e nevoie) locul medianei: U Me
6 1 18 20 3,5 şi astfel Me 19 2 2
c) Pentru serii de frecvenţe în cazul unei caracteristici grupate pe variante, aflarea Me presupune efectuarea următoarelor operaţii: - aranjarea în mod crescător a valorile caracteristicii - determinarea frecvenţelor cumulate Ni sau Fi%
- calcularea unităţii mediane U Me
n
i
2
(în cazul frecvenţelor relative U Me 50% ) şi
găsirea locului ei în şirul frecvenţelor cumulate, unde pentru prima dată se realizează relaţia de inegalitate: N i U Me sau Fi 50% - determinarea valorii caracteristicii în dreptul acestei relaţii valoare ce este egală cu Me
Ex: Se cunoaşte distribuţia studenţilor după nota obţinută: Nota Studenţi Ni fi% Fi% ni 2 4 4 12,5 12,5 3 2 6 6,25 18,75 4 2 8 6,25 25 5 5 13 15,625 40,625 32 6 4 17 12,5 53,125 U Me 16 sau U Me 50% 7 8 25 25 78,125 2 8 4 29 12,5 90,625 17>16 53,125>50% 9 2 31 6,25 96,875 astfel Me=6 10 1 32 3,125 100 Total 32 100 d) Pentru serii de frecvenţe în cazul unei caracteristici grupate pe intervale de variaţie aflarea Me presupune efectuarea următoarelor operaţii: - determinarea frecvenţelor cumulate Ni sau Fi% - calcularea unităţii mediane U Me
n 2
i
(în cazul frecvenţelor relative U Me 50% ) şi
găsirea locului ei în şirul frecvenţelor cumulate, unde pentru prima dată se realizează relaţia de inegalitate: N i U Me sau Fi 50% - aflarea intervalului median în dreptul acestei relaţii - calculul Me după formula:
Me X inf . l *
U Me N Me1 50 FMe1 sau în cazul frecvenţelor relative Me X inf . l * nMe f Me
unde: Xinf – limita inferioară a intervalului median l – lungimea intervalului median N Me1 sau FMe1 - frecvenţa cumulată (absolută sau relativă) până la intervalul median
nMe sau f Me - frecvenţa (absolută sau relativă) a intervalului median Ex: Se cunoaşte distribuţia salariaţilor după stajul de lucru: Stajul Lucrători Ni fi% Fi% (ani) ni 0-5 6 6 15 15 5-10 9 15 22,5 37,5 10-15 14 29 35 72,5 15-20 7 36 17,5 90 20-25 4 40 10 100 Total 40
U Me 29>20
40 20 sau U Me 50% 2 72,5>50 şi intervalul median este (10-14)
N Me1 15 iar FMe1 37.5
Astfel Me 10 5 *
20 15 50 37.5 11.79ani sau Me 10 5 * 11.79ani 14 35
50 40 30 20 10 0 0
5
U Q1 Q1 5 5 *
10 Me 15
20
25
1 * 40 10 sau U Q1 25% 4
10 6 25 15 7,22ani sau Q1 5 5 * 7.2ani 9 22,15
U Q3
Q3 15 5 *
3 * 40 30 sau U Q 3 75% 4
30 29 75 72.5 15,71ani sau Q3 15 5 * 15,71ani 7 17,5