SC Lab2 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Universitatea tehnică a Moldovei Tehnologii informaționale

Statistica Computațională Lucrare de laborator Nr.2 Tema: Analiza statistică a datelor cu ajutorul funcțiilor grafice hist(), boxplot(), qqnorm(), qqplot() din limbajul R.

Elaborat: Coordonant:

masterandul gr. TI-211 Maftei Alexandru conf. univ. dr. Marusic Galina

Chișinău, 2021

Grupa: TI-211M Student: Maftei Alexandru Numarul in listă: 19

Sarcina Generați un set de 100 de date aleatorii conform următoarelor repartiții: 1. Repartiția binomială (n=20, p=0.5). 2. Repartiția Poisson (𝜆 = 3). 3. Repartiția uniformă pe intervalul [-10,10]. 4. Repartiția normală (mean = 2, sd=3). 1. Reprezentați datele obținute cu ajutorul diferitor tipuri de histograme (cel puțin 4), folosind funcția hist(). Explicați rezultatele obținute. 2. Reprezentați datele obținute cu ajutorul funcției boxplot(). Explicați rezultatele obținute. 3. Verificați cu ajutorul funcției qqnorm() dacă setul de date generat este aproape de repartiția normală. 4. Efectuați analiza datelor obținute cu ajutorul funcției qqplot(). Explicați rezultatele obținute.

Generarea seturilor de date: 1. 2. 3. 4.

set1 = rbinom(100,20,0.5) set2 = rpois(100,3) set3 = runif(100,-10,10) set4 = rnorm(100,2,3)

Reprezantarea grafică hist():

Histogramele obținute în urma reprezentării grafice, arată repartiția numerelor pe intervalele respective. La primul, al treilea și al patrulea set de date am folosit mai multe blocuri pentru o vizualizare mai detaliată a

repartițiilor. Pentru a doua figură această manevră nu are sens pentru că valorile repartiție au o diversitate de valori mai mică. În histograma mulțimii repartizate normal (a patra) se poate observa conturul clopotului Gaussian. Acest efect este mult mai evident la generarea unei mulțimi mai mari, folosind repartiția Gaussiană:

Reprezentare grafică boxplot():

Reprezentarea cu ajutorul funcției grafice boxplot, ne ajută să vedem toate seturile de date într-un singur grafic. Fiecare figura din imagine reprezintă distribuirea valorilor pe intervalele respective. Valorea maximă este in setul Nr1 (distribuit binomial), iar cea minimă în repartiția uniformă (Nr3). În figura repartiției Gaussiene (nr4), observăm un punct, ce reprezintă o valoare care se abate cu mult de media și limitele mulțimilor.

Repartiția poison are cel mai restrâns interval de valori și cu toate că mediana acestei mulțimi este mai mare decît mediana mulțimilor 3 și 4, valoarea maximă a repartiției poisson este cea mai mică dintre toate valorile maxime ale mulțimilor. Verificarea cu ajutorul funcției qqnorm():

Concluzie: În urma elaborării lucrării de laborator, am învățat repartițiile binomiale, repartițiile Poisson, repartițiile uniforme, repartițiile Gaussiene (normale) și repartițiile lognormale. Am efectuat calculele matematice și am practicat limbajul R folosind funcțiile de calcul și de reprezentare grafică.

Încercarea de a reprezenta seturile de date pe același grafic, nu este o idee bună pentru că nu ne permite să facem careva deduceri, chiar și dacă folosim culori diferite pentru fiecare mulțime. Cea mai bună soluție e să desenăm 4 grafice.

Analizând fiecare figură în parte putem spune că, cel mai apropiat de repartiția normală este setul de date distribuit uniform (3, verde), dacă să excludem însuși repartiția normală (4, albastră).

Analiza qqplot()

La reprezentarea cu ajutorul funcției qqplot(), vedem un grafic bidimensional. unde prima dimensiune reprezintă primul set de date, iar a doua dimensiune, al doilea set de date. Punctul de jos-stinga (5,0) reprezintă reprezentarea a celei dea 14 valoarea a ambelor mulțimi. La aceste două mulțimi a cîte 100 de valori, distribuite binomial și poisson, vedem relativ puține puncte (18), din cauza că valorile mulțimii reprezintă numere întregi, și multe sete de date se suprapun, și avem doar 18 variante unice. Aceast nu lucru nu se va repeta pentru reprezentarea celorlalte 2 mulțimi, unde șansa ca două valori să se repete este foarte aproape de 0.

Concluzie: În urma elaborării lucrării de laborator, mi-am aprofundat

cunoștințele în lucrul cu limbajul R, și în analiza datelor statistice, reprezentate grafic.