Aplicatii Statistica [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Aplicatii Statistica Sociala

I. In cadrul unei gospodarii formata din 7 membri se inregistreaza urmatoarele venituri nete, exprimate in lei: 250, 200, 750, 1004, 1520, 1800, 2300. Sa se calculeze: 1) Venitul mediu net pe membru de familie; 2) Mediana. 1) X= (250, 200, 750, 1004, 1520, 1800, 2300) •

Observam ca avem distributii simple: f1=f2=f3=….fi=7, deci formula de calcul pentru medie (M sau X barat) este: M (X barat)= ∑xi /fi

Unde: M (X barat) = media ∑= suma xi= caracteristica, variabila fi= frecventa relativa, nr. observatiilor X barat = (250+200+750+1004+1520+1800+2300) / 7= 1117, 71 lei Interpretare: Venitul mediu net pe membru de familie este de 1117,71 lei. 2) Pentru calcularea medianei (Me), in cazul distributiilor simple: •

mai intai ordonam termenii in sens crescator sau descrescator: 200,250,750,1004,1520,1800,2300



apoi, suntem atenti sa vedem daca avem nr. par sau impar de termeni: La noi este numar impar de termeni (7). In acest caz, Me este valoarea termenului din mijlocul seriei: 1004.

Interpretare: Jumatate dintre membrii familiei au un venit mai mare de 1004 lei, iar jumatate dintre ei au mai putin de 1004 lei. II. In urma unui sondaj de opinie desfasurat intr-o localitate rurala, satenii chestionati au acordat urmatoarele punctaje pentru implicarea comunitatii in ecologizarea spatiilor publice: 7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8, 7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7. Care este punctajul mediu obtinut in urma acestui sondaj? Rezolvare: •

Observam ca in total sunt 35 de date strânse, de la cele 35 de persoane chestionate, deci N= 35.



Pentru a organiza datele, utilizând o distributie simpla a frecventei, sunt necesari urmatorii pasi:

1. Transcriem seria: X = (7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8, 7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7) 2. Se cauta valorile extreme din sirul de date (valoarea cea mai mare: 10; si cea mai mica: 1); 3. Se scriu toate valorile cuprinse între cele doua extreme într-o ordine descendenta pe o coloana; 4. Se numara de câte ori apare fiecare valoare în sirul de date; 5. Se trece apoi în tabel, frecventa de aparitie a fiecarui numar. În cazul de fata vom avea:

Caracteristica frecventa f*x Xi fi 1 2 2 2 0 0 3 1 3 4 3 12 5 4 20 6 4 24 7 9 63 8 7 56 9 3 27 10 2 20 ∑f=35 ∑f*x=227 •

Observam ca f1#f2#f3#......#fi, deci formula de calcul pentru medie va fi:

• •

In tabel mai adaugam o rubrica si calculam produsul f*x, pentru a obtine ∑f*x Atunci, media: M (X barat) = 227 / 35 = 6,48 pct.

Interpretare: Punctajul mediu acordat gradului de implicare a comunitatii in ecologizarea spatiului public de catre satenii chestionati din localiatea rurala “…” este de 6,48 puncte. III. Intr-un bloc se inregistreaza urmatoarea distributie a familiilor dupa numarul de copii pe care ii are fiecare familie: 6 familii nu au copii; 18 familii au un singur copil; 23 familii au 2 copii; 20 familii au 3 copii; 14 familii au 4 copii; 6 familii au 5 copii; 2 familii au 6 copii si o familie are 7 copii. 1) Sa se determine nr. mediu de copii pe familie, pentru blocul respectiv. 2) Sa se calculeze dominanta (Do) si mediana (Me).

Rezolvare: 1) Observam ca avem o distributie ponderata (cu frecvente), pe variante, unde variabila (X) este reprezentata de numarul de copii; •

Construim tabelul si se scriu toate valorile lui X, de la valoarea cea mai mica aparuta in enuntul problemei (0 copii), pana la valoarea cea mai mare (7 copii), dupa care se trec si frecventele aparitiei fiecarei valori in parte;

În cazul de fata vom avea:

Caracteristica frecventa Xi 0 1

f*x

Fi

fi 6 18

0 18

6 24

2 3 4 5 6 7

23 20 14 6 2 1 ∑f=90

46 60 56 30 12 7 ∑f*x=229

47 67 81 87 89 90

In acest caz, vom calcula media (X barat) utilizand formula:

= 229 / 50 = 2,54 Interpretare: Nr. mediu de copii pe familie in acel bloc este de 2,54. 2) Pentru a afla valoarea dominantei (Do) sau modului (Mo): • Fiindca avem distributie ponderata (cu frecvente), pe variante, identificam in tabel frecventa maxima a caracteristicii (f max=23) • Apoi, pe aceeasi linie cu ea, vom gasi in coloana din stanga valoarea dominantei - Do (acea valoare a caracteristicii corespunzatoare frecventei maxime): Do=2. Interpretare: Cele mai multe familii (majoritatea familiilor) din acel bloc au cate 2 copii. 3) Pentru a afla valoarea medianei (Me): •

Fiindca avem distributie ponderata (cu frecvente), mai intai trebuie sa calculam Unitatea mediana (U Me):



U Me= ∑fi / 2 = 90 / 2 = 45 Stiind ca Me este acea valoare a caracteristicii (X) pentru care este indeplinita conditia: Fi≥UMe, avem nevoie sa calculam frecventa relativa cumulata (Fi) Fi=Fi-1+fi Unde: Fi-1=frecventa relativa cumulata inferioara

• •

Conform conditiei de mai sus (Fi≥UMe) si stiind ca la noi UMe=45, ne ducem in tabel si din coloana lui Fi alegem valoarea mai mare sau egala cu 45, aceasta fiind 47. Apoi, mergand pe aceeasi linie cu aceasta valoare a lui Fi, vom gasi in coloana caracteristicii (X) valoarea medianei (Me), in cazul nostru Me=2.

Interpretare: Jumatate dintre familiile care locuiesc in blocul respectiv au mai mult de 2 copii, iar jumatate dintre ele au mai putin de 2 copii.

IV. Distributia, dupa timpul de deplasare spre o anumita locatie a unui esantion de 200 de persoane, este urmatoarea: 25 pers. ajung in maxim 30 minute; 50 pers. intre 30 minute si o ora; 60 pers. intre o ora si o ora jumatate, 45 persoane intre o ora jumatate si 2 ore; 15 persoane intre 2 ore si 2 ore jumatate si 5 pers. intre 2,5 ore si 3 ore. Sa se calculeze: a) Media b) Dominanta c) Mediana d) Sa Rezolvare:

a) Observam ca avem o distributie ponderata (cu frecvente), pe intervale, unde caracteristica/variabila (X) este reprezentata de intervalul de timp, iar noi alegem ca unitate de masura minutele, deci vom transforma orele in minute, pentru a transcribe intervalele; •

Construim tabelul si se scriu toate valorile lui X, pe intervalele de timp corespunzatoare datelor din problema, dupa care se trec si frecventele (fi) aparitiei fiecarui interval in parte;

În cazul de fata vom avea: Caracteristica frecventa xi-1, xi 0-30 30-60 60-90 90-120 120-150 150-180

x’i

x’i*fi

fi 25 50 60 45 15 5 ∑fi=200 •

15 375 45 225 75 450 105 4725 135 2025 165 825 ∑x’i*fi=8625

Deoarece avem o distributie cu frecvente, pe intervale, pentru a calcula media (X barat) vom folosi formula: X barat= ∑x’i*fi / ∑fi



Observam ca avem nevoie sa calculam mijlocul intervalului (x’i): x’i= xi-1+xi / 2 Unde: Xi-1= limita inferioara a intervalului Xi= limita superioara a intervalului La noi: x’1=0+30/2=15 x’2=30+60/2=45 s.a.m.d.



Pentru a ne usura munca, trecem in tabel X’i, apoi produsul dintre frecventele relative si mijloacele intervalelor, pentru a putea calcula suma lor (∑x’i*fi).



Acum avem toate datele necesare calcularii mediei: X barat= ∑x’i*fi / ∑fi =8625/200=43,12 minute

Interpretare: Timpul mediu de deplasare a persoanelor respective spre locatie este de 43,12 minute. b) Pentru calcularea dominantei (Do) sau modului (Mo), in cazul distributiilor cu frecvente, pe intervale, mai intai identificam intervalul modal, care corespunde frecventei maxime (fi): Caracteristica frecventa xi-1, xi 0-30 30-60 60-90 90-120

Frecv. cumulata fi Fi 25 25 50 (fi-1) 75 (Fi-1) 60(fimax) 135 45 (fi+1) 180

120-150 150-180

15 5

195 200

La noi, f max=60, deci intervalul modal este 60-90. Formula de calcul pt. Do va fi: Do= xi-1+d(Δ1/ Δ1+ Δ2) Unde: xi-1= limita inferioara a intervalului modal (la noi: xi-1= 60) d=marimea intervalului modal si d= xi-xi-1 = 90-60=30 Δ1= fi max-fi-1 =60-50=10 Δ2= fi max-fi+1 =60-45=15 Do= xi-1+[d(Δ1/ Δ1+ Δ2)] =60+[30(10/(10+15)]=60+(30*0,4)=60+12=72 minute Conditie: valoarea lui Do trebuie sa fie cuprinsa intre limitele intervalului modal. La noi: 72∈[60,90] Interpretare: Majoritatea persoanelor (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in 72 minute ( 1h si 12 minute). c) Pentru calcularea medianei (Me) (a se vedea tabelul de la punctul b) •

Fiindca avem distributii cu frecvente, pe intervale, formula de calcul a medianei este: Me= xi-1+d[(UMe-Fi-1)/fi]

• Identificam intervalul median, corespunzator frecventei relative maxime (fi max) La noi, f max=60, deci intervalul median este 60-90 (din tabelul de la punctul b) iar UMe=∑fi/2; unde Fi≥UMe, deci avem nevoie sa calculam frecventa relativa cumulata (Fi) in tabel (a se vedea tabelul de la punctul b):

• •

Fi=Fi-1+fi Unde: Fi-1=frecventa relativa cumulata inferioara Cum la noi UMe=200/2=100, din coloana frecventelor relative cumulate, pentru Fi≥UMe identificam valoarea Fi=135 Acum, putem calcula mediana Me= xi-1+d[(UMe-Fi-1)/fi] xi-1=limita inferioara a intervalului median, la noi: xi-1=60 d=marimea intervalului median; la noi: d=x-xi-1=90-60=30 Fi-1= frecventa relativa cumulata inferioara; la noi: Fi-1=75

fi=60 Me=60+30[(100-75)/60]=60+(30*0,41)=60+12,3=72,3 ≈72 minute (1h si 12 minute) Conditie: valoarea Me trebuie sa fie cuprinsa intre limitele intervalului median. La noi: 72∈[60,90] Interpretare: Jumatate dintre persoane (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in mai mult de 72 minute, iar jumatate dintre ele in mai putin de 72 minute.

V. Calculati cate zile au absentat in medie studentii unui an de studii: Caracteristica frecventa

x’i x’i*fi

xi-1, xi 1-5 6-10 11-15 16-20 21-25 26-30

fi 25 30 30 20 10 5

3 8 13 18 23 28

75 240 390 260 230 140

31- 35

4

33

132

∑fi=124

∑x’i*fi=1467



Observam ca avem distributii cu frecvente, pe intervale, in acest caz formula de calculare a mediei M (X barat) fiind: M (X barat)= ∑x’i*fi / ∑fi



Calculam mijloacele intervalelor (x’i): x’i= xi-1+xi / 2 si trecem rezultatele direct in rubrica din tabel, pentru a putea calcula suma mijloacelor intervalelor (∑x’i*fi)

La noi: M (X barat)= 1467/124=11,83≈12 zile Interpretare: Studentii respectivi au absentat in medie 12 zile.

VI. Calculati dispersia unei populatii pornind de la un sir de date provenite de la un esantion si coeficientul de variatie (v). X= (13,11,15,12,11) Caracteristica x patrat Xi 13 11 15 12 11 ∑xi=62

169 121 225 144 121 ∑x patrat = 780

1) Calculam si media, deoarece stim ca Dispersia reprezinta gradul de imprastiere, de variatie, a elementelor individuale in jurul valorii medii M: M (X barat)= ∑xi / n= 62/5=12,4



Stiind ca Dispersia, e notata cu:

σ patrat (σ = sigma) – pentru dispersia populatiei; s patrat – pentru dispersia esantionului Pentru a calcula dispersia unei populatii pornind de la un sir de date provenite de la un esantion folosim formula comuna:

σ patrat = s patrat =[∑x patrat – (∑x) patrat /n] / n-1 n= volumul esantionului (cand esantionul n