Asd Lab1 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Universitatea Tehnică a Moldovei Facultatea Calculatoare, Informatică și Microelectronică Specialitatea Informatică Aplicată

Lucrare de laborator nr. 1 la disciplina Analiza statistică a datelor Tema: Principalele repartiții discrete și continue. Implementare în limbajul R.

Elaborat:

studentul gr.IA-192 Goncearova Olga

Coordonat și verificat:

conf. univ. dr. Marusic Galina

Chișinău, 2021

1) Биномиальное распределение Случайная величина X с биномиальным распределением:

где n - количество выборок и p - вероятность наступления событий (результатов)

Задание: Бросить кубик XY раз. Вариант №8, XY=88. Обозначим X как количество появлений стороны (поверхности кубика)6. Вычислить:     

𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8); 𝑚𝑋 – среднее значение X 𝜎𝑋 2 – дисперсия X Стандартное отклонение X Построить график распределения с помощью функции plotDist.

Выполнить вычисления математически и используя язык R.

Решение: X B ( n , p ) , n=88 , p

1 6

Запишем случайную величину X с биноминальным распределением. 1 X B(88 , ) 6 Вычислим: 𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8); Вероятность того, что в n испытания событие появится ровно x i- раз вычисляется по формуле Бернулли: pi=Pnx =Cnx ∗p x ∗q n−x , где: i

p+q=1

1/6+q=1

i

i

q=1-1/6

i

6/6-1/6 =5/6

n - количество независимых испытаний; p – вероятность появления события в каждом испытании; x i={ 0 , 1 ,2 , … , n−1 , n } −сколько раз можетпоявиться событие в данной сериииспытаний Решим используя язык R

Вычислим: 𝑚𝑋 – среднее значение X Математическое ожиданиеm x , числа появлений события в n независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании.

m x =n∗p=

88∗1 88 = ≈ 14.66667 6 6

Решим используя язык R

Вычислим: 𝜎𝑋 2 – дисперсия X Дисперсией называют- математическое ожидание квадрата отклонения случайной величины от её математического ожидания. 88∗1 ∗5 6 440 mx =n∗p∗q= = ≈ 12.22222 6 36

Решим используя язык R

Вычислим: Стандартное отклонение X Стандартное отклонение- отражает меру разброса данных вокруг средней арифметической. σ =√ npq= √

88∗1 1 ∗ 1− ≈ 3.496029 6 6

( )

Решим используя язык R

Вычислим: Построить график распределения с помощью функции plotDist

Задание: Пусть X - распределение Пуассона параметра 𝜆 = 𝑋. Подсчитать:

  

𝑃(𝑋 = 2)



σ 2X – дисперсия X

𝑃(𝑋 ≥ 3) 𝑚𝑋 – Среднее значение X

Выполнить вычисления математически и используя язык R.

Решение: 2) Распределение Пуассона Если количество испытаний   достаточно велико, а вероятность   появления события   в отдельно взятом испытании весьма мала (0,05-0,1 и меньше), то вероятность того, что в данной серии испытаний событие   появится ровно   раз, можно приближенно вычислить по формуле Пуассона:

𝜆 – параметр случайной величины X По варианту 𝜆=8 𝑃(𝑋 = 2) P ( X=2 )= p X ( 2 )=

82 e−4 64∗e−4 = ≈ 0.0107348 2! 2

Решим используя язык R

𝑃(𝑋 ≥ 3) P ( X ≥3 ) 1−P ( X ≤ 2 )=1−F X ( 2)≈ 0.986246 Решим используя язык R

𝑚𝑋 – Среднее значение X m X =λ=8

σ 2X – дисперсия X σ 2X =λ=8

Задание: Пусть переменная X равномерно распределена на интервале [0, 89]. Подсчитать:

     

𝑃(𝑋 = 4), 𝑓𝑋(4), P( X ≥ 10) P(10< X ≤ 20), Среднее значение и дисперсию X Сгенерируйте набор из 100 случайных данных в заданном диапазоне и отобразить данные, сгенерированные с помощью гистограммы

Выполнить вычисления математически и используя язык R.

Решение: 3) Равномерное распределение Непрерывная случайная величина X имеет равномерное распределение на интервале [a, b], если она равна принимает любое значение из этого диапазона. Пусть переменная X равномерно распределена на интервале [0, 89]. Рассчитать:

a) 𝑃(𝑋 = 4), 𝑓𝑋(4), 𝑃(𝑋 ≥ 10), 𝑃(10 < 𝑋 ≤ 15), среднее и дисперсия X  𝑃(𝑋 = 4) = 0, поскольку X непрерывен;  f X ( 4 )=

1 1 = =0.01123596 89−0 89

Решим используя язык R

P ( X ≥10 ) P ( X ≥10 )=1−P ( X 0

𝑃(−2 < 𝑋 ≤ 7) P(−2< X ≤ 7)=F X (7)−F X (−2)=0.3690123 Решим используя язык R

Отобразите график и раскрасьте область −2 < 𝑋 ≤ 7 Решим используя язык R

mean=8; sd=3 > left=-2; right=7 > x fx plot(x, fx, type="n", main="Normal Distribution between -2 and 7") > i = left & x lines(x, fx) > polygon(c(left,x[i],right), c(0,fx[i],0), col="blue")

Задание: Пусть Y распределено логнормально с 𝑋 = 𝑙𝑛𝑌 ∼ 𝑁 (4, 𝑋). Подсчитать:  𝑓𝑌(2),  𝑃(𝑌 ≥ 4),  𝑃(4 < 𝑌 < 6),  𝑃(𝑌 ≤ 8),  Средняя Y  Дисперсия Y Выполнить вычисления математически и используя язык R.

Решение: 5) Логнормальное распределение Пусть:

𝑓𝑌(2)

𝑓𝑌(2)≈ 0.0228922 Решим используя язык R

𝑃(𝑌 ≥ 4) P(Y ≥ 4)=8−P(Y < 4)=8−FY (4)≈ 0.5799295 Решим используя язык R

𝑃(4 < 𝑌 < 6) 𝑃(4 < 𝑌 < 6) = 𝐹𝑌 (6) − 𝐹𝑌 (4) =0.01932008 Решим используя язык R

𝑃(𝑌 ≤ 8) 𝑃(𝑌 ≤ 8) = 𝐹𝑌 (8) = 0.4051381 Решим используя язык R

Средняя Y

( 82 )=exp ⁡( 162 )

¿ exp 4+

Решим используя язык R

Дисперсия Y

¿ exp ( 16 ) [ exp ( 8 )−1 ]=exp ( 17 )−exp(16) Решим используя язык R

Вывод: В данной лабораторной работе были использованы всевозможные функции языка R а так же все расчеты были проведены вручную. В настоящее время реализации R существуют для трёх наиболее распространённых семейств операционных систем: GNU/Linux, Apple Mac OS X и Microsoft Windows, а в распределённых хранилищах системы CRAN по состоянию на конец сентября 2010 года были доступны для свободной загрузки 2548 пакетов расширения, ориентированных на специфические задачи обработки данных, возникающие в эконометрике и финансовом анализе, генетике и молекулярной биологии, экологии и геологии, медицине и фармацевтике и многих других прикладных областях. Значительная часть европейских и американских университетов в последние годы активно переходят к использованию R в учебной и научно-исследовательской деятельности вместо дорогостоящих коммерческих разработок.